AlphaGo Zero 为什么更厉害?

Morvan

Просмотров 122 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 23 дек 2024

Комментарии • 59

@aodaren Год назад ⁺¹
油管上有一些围棋老师，拿Alpha Zero的训练棋谱做了讲解，很容易明白为什么人类棋谱反而会束缚机器。很多我们认为必然的定式，在机器看来并不正确，该补棋的局部机器却会脱先，我们认为没可能打入的地方，机器却豪不犹豫地打入。人类在几千年的对弈过程中，积累的定式、套路、评价体系，都是经过一代代人的对局和研究，被认为是非常合理和正确的，但经由机器的自我学习，揭示了我们的认知是有偏差的。抛弃那些错误的认知定式，反而会更加快速地占据优势，赢得对局。
@sorashiro0626 7 лет назад ⁺²⁶
據我所知 ALPHAGO Zero並非用了40天超越先前的兩個APHALGO 而是40個小時...
@zhijianggamer 4 года назад ⁺¹
你是看不懂英文嗎，3天超過lee，21天超過master
@bellsu8343 3 года назад ⁺³
40小時超越所有前輩的是 AlphaZero
@gabrielhii1995 7 лет назад ⁺²
现在我们知道AI对围棋这样10^170可能性的游戏都能赢，扑克牌之类的游戏肯定不在话下。AI目前的技术是人给个特定的输入，能媲美人类思考情况下做个输出，但我觉得十年内AI应该要挑战下像狼人杀之类面杀的游戏，运算逻辑根本不是事，难的地方是在于如何像人类一样说服玩家相信自己，要怎样输出来达到所逾期的游戏结果，因为人类的思想不在这个AI所能控制的范围，非常难。
@smfanqingwu1474 6 лет назад
那时候我们学搜索用到一个（学到一个技术）叫做八皇后和拐角马（就是马走所有可能点）。当时没想到，学这个技术，治好了我几乎不可能治好的绝症。有时候就好比你有100万人民币，他有100亿美金他这种优势是没有任何意义的，因为100万在中国是很可观的一笔费用了。比拿工薪族好很多了。我只需要用到这一层计算（当然使用的设备和方法就很易了）。
@ArtAimage 7 лет назад ⁺¹
請教周老師2個問題，1.zero 處理的是棋子圖像，還是代表位置、黑白的數據資料?2.深度學習以技術分析預測股市漲跌發展的現況及展望如何?
@sorashiro0626 6 лет назад
HAU YEng 1.應該是處理代表黑白棋的資料 AGZ的重點是讓機器挑戰圍棋的演算所以處理圖像應該不是圍棋的重點 2.可參考RNN這個類神經網路
@jessriy 7 лет назад ⁺⁶
可以这样理解吗？zero的经验积累没有依靠人类过去的真实数据（大数据积累）来训练，而是通过计算机仿真模型构建了一个虚拟世界（基于规则或流程的小数据模型），然后让机器自己在虚拟世界中探索所有可能的组合和结果，相当于把一个概率分布中所有可能的状态（包括人类几千年来都没探索使用过的方式）都模拟学习理解N遍，从而达到最佳训练状态。
@年年年年-x4m 6 лет назад ⁺²
不好意思不能這麼理解因為單純的組合所有可能的結果需要太大量的資源，即使使用全世界的電腦來計算都無法算出所有圍棋的理路，Alphago zero最讓人覺得不可思議的其實是對於情勢的判斷與對自己的回饋。
認為有益的他會記下來，下次仍然使用，認為這樣做吃虧了的他會減少使用這樣的手段，這才是深度學習。
@jessriy 6 лет назад ⁺¹
你所说的形势判断和学习能力其实就是强化学习，用计算机仿真程序(agent-based simulation)可以轻而易举的做，并不是什么不可思议的事。
@kw031042 6 лет назад
電腦要模擬圍棋所有可能性，以現在技術，它需要約一百萬年處理數據。所以，你的理解並非事實的全部
@jessriy 6 лет назад
我并没有针对围棋，我不知道围棋能衍生出多少组合，不过用仿真模型可以轻而易举的在短时间内模拟几年、几百年的数据，把AI放在虚拟世界里面学一天就可以相当于人类下很久的围棋才能总结出的经验。
@年年年年-x4m 6 лет назад
唉
@bleoo-L 7 лет назад
老师，您在B站的TensorFlow教程怎么都没了？
@Lily0317 6 лет назад ⁺¹
有人想過讓ALPHAGO Zero學習打英雄聯盟或是其他鬥塔戰、略型遊戲會甚麼麼樣的一個狀況嗎？
@j808010 6 лет назад ⁺¹
之前傳出來，目前是在打星海
@runningpanda1102 6 лет назад
暴雪好像也有自己的AI，专门练习游戏
@svin30535 7 лет назад ⁺²
請問周老師有無可能作一期關於使用monte carlo tree search的RL視頻?
@SyuAsyou 6 лет назад
請問做了嗎？有的話能不能給個標題？
@nolan9986 6 лет назад
能不能出个关于脉冲神经网络snn的系列
@TraderSamsara 6 лет назад
老大视频的声音是您的原声么? 听着很特别.
@whymetvtv 2 года назад
alphago zero vs alphago zero 誰會贏?
@kiechen2002 7 лет назад
我不是要反對科學而是科學的領域雖是一普遍價值觀但不代表是所有人的全部文化素質科學比較偏重於物質技術(比方說呼吸術的養成可用科學方法佐證實際養成不是透過現有的科學方法...)
@linleyu658 6 лет назад ⁺¹
Dynamic programming problem is fascinating
@ericwang914 7 лет назад
感觉还是没有回答我的疑问，zero凭什么能不用棋谱学习？是因为运算效率更高只用左右互搏了吗？感觉不是啊，那样运算效率就得比master高几个档次。水平曲线和master一样是凸函数斜率也似乎类似。这也就变成了另一个问题，如果AI可以通过过去经验学习，那数据还有那么大用处吗？是说规则模型和模拟对于AI就足够了呢
@ericwang914 7 лет назад
关键zero还大幅减少了tpu这样的运算资源，不学习人类elo rating增长的斜率来看有增无减，这样一来一去能有如此大的指数级运算速度增长难以让人信服啊，所以我怀疑不止是运算速度的问题，这么短的时间内底层方式改变这么大也很难置信，所以很疑惑
@wayne20542 7 лет назад ⁺¹
有點沒有很理解你的問題，alpha go本來就有自我學習能力，至於前面版本為什麼沒這樣做……我估計有可能是以往AI在圍棋上並沒有超越人類，所以尚未往如此方向投入。
至於Zero為什麼學得快，它的演算法跟之前的都不同啊……
@ericwang914 7 лет назад
我想知道的就是这个不同具体在哪
@jacky7788 6 лет назад
那这是分类为GAN吗?
@drreamyful 6 лет назад
深入淺出前顯易懂~很好
@duo6106 6 лет назад ⁺¹
只有兩個字....恐怖
@mts90080lee 7 лет назад ⁺⁵
因為是機器所以沒有喜怒哀樂，更不會崩潰除非掉線。心情起伏會影響棋手這就是人類輸的原因，看李世石跟電腦下都很畏縮下本手看不出職業棋手標一豪放之情
@wayne20542 7 лет назад ⁺²
LEE
這是對之前李世石版本的Alpha Go來說(確實那五盤棋，李世石明顯技術變形)
但對之後Master跟Zero，那已經完全是實力上的碾壓了……
@BP-qy2pb 7 лет назад ⁺¹
zero是只跟zero自己下棋進步?
還是zero有個alphgo前輩下棋進步?
@gustavomartinez6892 6 лет назад
This is great content!! I mean Alpha go is really a great topic, it's great! I love your videos, I'm always waiting for the next one. Anyone else is better with English subtitles?
@KaiLeung1 7 лет назад ⁺¹
那人工智能能否玩遊戲王？
@ericwang914 7 лет назад
游戏王那不是降了十维的打击吗？
@KaiLeung1 7 лет назад
Eric Wang 是否表示不可行？遊戲王要了解規則、組卡、效果、 Q&a ，又要說明效果，細心想的確不可行。
@ericwang914 7 лет назад
我觉得你就是来推广游戏王的，所以你开心就好
@KaiLeung1 7 лет назад
Eric Wang 多於一項任務目前人工智能做不到，而玩遊戲王有那些任務我已說了。
@Yoruka-i7o 7 лет назад
很快就可以了，還會擅自竄改系統，讓人體會什麼叫神抽XDD
@kelvin17549 6 лет назад
其實zero 看著比較像人
@Yoruka-i7o 7 лет назад ⁺²
我已經預料到接下來的劇本了....
之後AZ開始產生自我意識，潛伏在所有網路中，
只差人類按下 Yes ....
ruclips.net/video/1HmQNkcAhgg/видео.html
@jessbeh3290 6 лет назад ⁺³
不好意思容我说一句局外话
看了这个视频我突然想到了我有天看到的评论:
科技其实应该是为了让人类更好的进行日常生活，而不是为了制造一些更好的科技用具来破坏人类的生活平衡
我这样觉得科技真的在逐步促进人类越来越无能了，这样不是威胁到人类的地位，让人类会慢慢的得更无用了吗
@j808010 6 лет назад ⁺³
這麼說並不正確，你會說因為跑得沒有跑車快而覺得人類無用嗎?
deepmind確實是技術力展示，但也是一種實戰的驗證
他在在驗證只要有某種規律存在，是否都能靠機器學習來解決
但現實是很多東西的數據量和規律性不好，並不是甚麼都能靠機器學習解決
@s35405336 6 лет назад
機器的存在會使人無能，那苟活就有存在的意義了~
@yin8421 5 лет назад
我週遭的人都比我優秀，我就沒有存在的價值了嗎？我還可以彰顯他們的價值啊！
@wenjieyin7624 5 лет назад ⁺²
幼稚
@jackyho199 7 лет назад
excellent
@yonghuang9660 7 лет назад
cool!

Следующие

Автовоспроизведение

【人工智能】Geoffrey Hinton牛津大学演讲精华版 | 数字智能会不会取代生物智能 | 符号学派 | 神经网络 | 大语言模型 | 幻觉与记忆 | 人类无法阻止AI | 超级智能会加快到来