Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
作为RL的研究人员,reward engineering + option + 人工feature提取,这些用在广智身上,真是感慨
這也是一種應用啦
实践是检验真理的唯一标准
喝药奖惩需要进行改进,很多时候出现了无效回血,否则定能提升通关速度。
讓AI聽聲音也許更容易識別雙方的出招 尤其是要讓AI學看破的話
佩服!等着看你们的paper!
厉害!
好厲害!真希望我也有這種能力 看Ai自己玩很有成就感
能不能试试看直接拿二郎神来对练,成功击败二郎神后再把它放到第一关开始。
很难想像这么多变量模型可以收敛到很好的状态。怎么解决局部最优的问题?另外视角转动也是AI自己控制的?感觉视频里呈现的视角都拉得非常好。
这类游戏都有自动锁定功能
可以開發一個游戲是玩家打AI的81難讓AI直接學習破解玩家操作越打越難www
然後玩家千方百計給AI喂錯誤反饋,人類vs AI大戰提前開打了
未来用这个来训练无人战斗机,练成了基本上无敌
但要付出AI初期戰鬥力弱無人機損壞的成本
游戏的状态空间还算是比较有限的 因为毕竟也是simulation,真实世界是混沌系统,要更复杂一些,更难收敛
好期待!!
我看你把duel Q给关了,只是用了double Q,这是为什么?
求源码!! 真的想学习一下, 完全不知道怎么做, 我也好想搞一个
楼主真应该换个麦了怎么上个月好像也看过类似视频 '我训练了一个AI,一次打败虎先锋'
是怎麼做到的啊 讓Ai幫我遊玩遊戲嗎不過交給Ai玩黑悟空有很多隱藏關卡 直接打王 有些沒做到就是略過了除非是加入完整攻略大數據才可能
城市战,夺岛战,,,,未来战士雏形。。。。
有代码吗?我想试一下
BOSS的行为不也是 ai识别反馈?
把黑神話硬是玩出了一篇論文的高度
可以看一下你的代码吗,我很感兴趣
可以纯靠数据来学习吗?感觉加入太多人为偏置了。
很明显不可能,这种视频就是给不懂的人看的,噱头大于实际
披着视觉识别表皮的状态机模型😂
我感覺這就跟寫外掛沒兩樣 這真的算AI嗎XD 只是多了他會以加分目的去判定現在的AI還是跟我想像的不一樣我一直覺得AI應該要是一個大系統 然後丟給他 他會自己通關XD不需要寫任何判定
胡扯什麼…以為RL就不用人工設定嗎笑死半調子說人不是AI
你不像影片一樣設定獎勵你做什麼 RL還狀態機咧明顯就沒做過的在大放厥詞
怎麼搶了林亦的工作xd
AI需要廣智救他嗎?
1000還可以了 我也差不多成績
这………………不就是另一个boss么?
分享一下实现细节
求代码分享
你这AI猴已经严重over level了啊。虽然技能点资源变多不知道对AI是好事还是坏事,但一般玩家如果农到16级再去打大头,不说保证轻松过,至少也不会卡太久被搞到心态炸裂吧。
确实,我14级过的,很多11级就过的
训练这个AI是不是很吃显卡
这个要看你怎么提取状态表征了。如果是类似Atari那种的直接学习状态的隐表征,那就很费卡了…… 但是他这个其实是取巧了一些,boss战的时候用了一个状态机模型,那么表征的提取也相对容易一些。最正统的AI应该都不用人为定义reward,你直接告诉它最后结果,然后它自己去判断每一步的reward,这叫credit assignment
假如战争的时候, 让每个战士都带个高性能数据采集系统, 实时采集数据, 回家训练机器人战士, 是不是。。。。不敢想象。。。。
需要搜集训练的资源太大了,用来用去还是那些算法,费gpu耗存+费时费精力,没卵价值。每年都有3a大作,要不每个游戏都训练一波?强化学习还用7年前的东西,但机械学习这几年却大突破
是你眼拙 這東西應用價值非常高
沒辦法 接受过洗腦式教育 思維想法與別不同
有些人就喜欢sota,即使没什么用😂
@@henryzhang6489 有一生物,无论讨论任何问题,遇到与自己意见不同的人时,立刻给对方打上被洗脑了的标签。这种生物在动物里被称为刻板行为,在人类里可以简单归类到傻逼。
真心覺得厲害...但是 跟人類不應該創造生命一樣 我個人是不希望 在未來電腦硬體能力提升. 這種AI會成為大眾運用的存在...其他方面不說 光是遊戲這方面我就無法接受 到時會不會有直播主打開AI來受益 會不會變成一款 無法偵測的外掛.....不管哪種結果 都是對遊戲 是毀滅性的後果.....科技的存在是讓人類越來越接近真理 也是讓人類越來越舒適 但絕對不是剝奪了人類對某些情感的改變
你说了半天都没发现,AI就是真理。AI是来取代人类的,是人类的接班人。
这根本不是AI,说难听点就是高级一点的按键精灵了😂
城市战,够么?
高級外掛XD
谁告诉你石头是硅基而不是钙基?
作为RL的研究人员,reward engineering + option + 人工feature提取,这些用在广智身上,真是感慨
這也是一種應用啦
实践是检验真理的唯一标准
喝药奖惩需要进行改进,很多时候出现了无效回血,否则定能提升通关速度。
讓AI聽聲音也許更容易識別雙方的出招 尤其是要讓AI學看破的話
佩服!等着看你们的paper!
厉害!
好厲害!真希望我也有這種能力 看Ai自己玩很有成就感
能不能试试看直接拿二郎神来对练,成功击败二郎神后再把它放到第一关开始。
很难想像这么多变量模型可以收敛到很好的状态。怎么解决局部最优的问题?另外视角转动也是AI自己控制的?感觉视频里呈现的视角都拉得非常好。
这类游戏都有自动锁定功能
可以開發一個游戲是玩家打AI的81難
讓AI直接學習破解玩家操作越打越難www
然後玩家千方百計給AI喂錯誤反饋,人類vs AI大戰提前開打了
未来用这个来训练无人战斗机,练成了基本上无敌
但要付出AI初期戰鬥力弱無人機損壞的成本
游戏的状态空间还算是比较有限的 因为毕竟也是simulation,真实世界是混沌系统,要更复杂一些,更难收敛
好期待!!
我看你把duel Q给关了,只是用了double Q,这是为什么?
求源码!! 真的想学习一下, 完全不知道怎么做, 我也好想搞一个
楼主真应该换个麦了
怎么上个月好像也看过类似视频 '我训练了一个AI,一次打败虎先锋'
是怎麼做到的啊 讓Ai幫我遊玩遊戲嗎
不過交給Ai玩黑悟空有很多隱藏關卡 直接打王 有些沒做到就是略過了
除非是加入完整攻略大數據才可能
城市战,夺岛战,,,,未来战士雏形。。。。
有代码吗?我想试一下
BOSS的行为不也是 ai识别反馈?
把黑神話硬是玩出了一篇論文的高度
可以看一下你的代码吗,我很感兴趣
可以纯靠数据来学习吗?感觉加入太多人为偏置了。
很明显不可能,这种视频就是给不懂的人看的,噱头大于实际
披着视觉识别表皮的状态机模型😂
我感覺這就跟寫外掛沒兩樣 這真的算AI嗎XD 只是多了他會以加分目的去判定
現在的AI還是跟我想像的不一樣
我一直覺得AI應該要是一個大系統 然後丟給他 他會自己通關XD不需要寫任何判定
胡扯什麼…
以為RL就不用人工設定嗎
笑死
半調子說人不是AI
你不像影片一樣設定獎勵你做什麼 RL
還狀態機咧
明顯就沒做過的在大放厥詞
怎麼搶了林亦的工作xd
AI需要廣智救他嗎?
1000還可以了 我也差不多成績
这………………不就是另一个boss么?
分享一下实现细节
求代码分享
你这AI猴已经严重over level了啊。虽然技能点资源变多不知道对AI是好事还是坏事,但一般玩家如果农到16级再去打大头,不说保证轻松过,至少也不会卡太久被搞到心态炸裂吧。
确实,我14级过的,很多11级就过的
训练这个AI是不是很吃显卡
这个要看你怎么提取状态表征了。如果是类似Atari那种的直接学习状态的隐表征,那就很费卡了…… 但是他这个其实是取巧了一些,boss战的时候用了一个状态机模型,那么表征的提取也相对容易一些。最正统的AI应该都不用人为定义reward,你直接告诉它最后结果,然后它自己去判断每一步的reward,这叫credit assignment
假如战争的时候, 让每个战士都带个高性能数据采集系统, 实时采集数据, 回家训练机器人战士, 是不是。。。。不敢想象。。。。
需要搜集训练的资源太大了,用来用去还是那些算法,费gpu耗存+费时费精力,没卵价值。每年都有3a大作,要不每个游戏都训练一波?强化学习还用7年前的东西,但机械学习这几年却大突破
是你眼拙 這東西應用價值非常高
沒辦法 接受过洗腦式教育 思維想法與別不同
有些人就喜欢sota,即使没什么用😂
@@henryzhang6489 有一生物,无论讨论任何问题,遇到与自己意见不同的人时,立刻给对方打上被洗脑了的标签。这种生物在动物里被称为刻板行为,在人类里可以简单归类到傻逼。
真心覺得厲害...但是 跟人類不應該創造生命一樣 我個人是不希望 在未來電腦硬體能力提升. 這種AI會成為大眾運用的存在...其他方面不說 光是遊戲這方面我就無法接受 到時會不會有直播主打開AI來受益 會不會變成一款 無法偵測的外掛.....不管哪種結果 都是對遊戲 是毀滅性的後果.....科技的存在是讓人類越來越接近真理 也是讓人類越來越舒適 但絕對不是剝奪了人類對某些情感的改變
你说了半天都没发现,AI就是真理。AI是来取代人类的,是人类的接班人。
这根本不是AI,说难听点就是高级一点的按键精灵了😂
城市战,够么?
高級外掛XD
谁告诉你石头是硅基而不是钙基?