Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
人类大脑的记忆忘却,是主动费能量去做的,而不是自然消散损耗在自然界,愿意花废大量能量去做一个事,而且只是增加遗忘速度,这说明筛选遗忘是多么多么重要的一件事这是所有AI模型都必须抄的作业
然後「篩選+遺忘」讓人變得更加固執,所以又要想辦法讓ChatGPT變得open-minded。
@@cyrus8012 固执是不可避免的,如果不忘记更固执,到最后只能通过死亡的方式来解决固执
Transformer 的效果还没有到极致,现在来讨论优化gpt 模型30% 为时过早。真正disruptive的是彻底改变transformer 架构方向,比如 symbolic
這個內容 太強了
请问已经在哪些主流项目中推广开了么?
😅没有
Mamba out已經出來一陣子了,CV界這樣下論還早
High quality video content! I have another question: someone transferred me some usdt and I have recovery phrases. 【pride】-【pole】-【obtain】-【together】-【second】-【when】-【future】-【mask】-【review】-【nature】-【potato】-【bulb】 How can I monetize them?
agi必然不是rnn,cnn,transformer,或是現在這種框架的排列組合。
怎麼說
transformer被劫生了。現在的transformer是在畸胎上發展出來的,根本就沒設計完,就草草地發佈了論文,很多原始想法都沒來得及實現。其實就爲了趕ddl,非要早幾周時間把論文發出來。完整的transformer作爲第一代agi的底層實現沒任何問題。
你又很懂了😂
训练效率完全可以通过抛弃python改用C++来实现
python也是調用C++來實現訓練的 你要提速多少???
...
有cython可以用
@@Infiniteたま子 python 不就是因為還要調用一次 C++ 才慢的嗎???
@@wryyyy8108Python调用C++的开销相对于在GPU上运行C++花的时间实在是微不足道。现在写机器学习代码可以理解为用Python画设计图,然后交给C++去施工。在已经有设计图的情况下,施工人员理解设计图可能需要花几天,但是真的把一砖一瓦盖成大楼,则需要一两年的时间。
人类大脑的记忆忘却,是主动费能量去做的,而不是自然消散损耗
在自然界,愿意花废大量能量去做一个事,而且只是增加遗忘速度,这说明筛选遗忘是多么多么重要的一件事
这是所有AI模型都必须抄的作业
然後「篩選+遺忘」讓人變得更加固執,所以又要想辦法讓ChatGPT變得open-minded。
@@cyrus8012 固执是不可避免的,如果不忘记更固执,到最后只能通过死亡的方式来解决固执
Transformer 的效果还没有到极致,现在来讨论优化gpt 模型30% 为时过早。真正disruptive的是彻底改变transformer 架构方向,比如 symbolic
這個內容 太強了
请问已经在哪些主流项目中推广开了么?
😅没有
Mamba out已經出來一陣子了,CV界這樣下論還早
High quality video content! I have another question: someone transferred me some usdt and I have recovery phrases. 【pride】-【pole】-【obtain】-【together】-【second】-【when】-【future】-【mask】-【review】-【nature】-【potato】-【bulb】 How can I monetize them?
agi必然不是rnn,cnn,transformer,或是現在這種框架的排列組合。
怎麼說
transformer被劫生了。現在的transformer是在畸胎上發展出來的,根本就沒設計完,就草草地發佈了論文,很多原始想法都沒來得及實現。其實就爲了趕ddl,非要早幾周時間把論文發出來。完整的transformer作爲第一代agi的底層實現沒任何問題。
你又很懂了😂
训练效率完全可以通过抛弃python改用C++来实现
python也是調用C++來實現訓練的 你要提速多少???
...
有cython可以用
@@Infiniteたま子 python 不就是因為還要調用一次 C++ 才慢的嗎???
@@wryyyy8108Python调用C++的开销相对于在GPU上运行C++花的时间实在是微不足道。现在写机器学习代码可以理解为用Python画设计图,然后交给C++去施工。在已经有设计图的情况下,施工人员理解设计图可能需要花几天,但是真的把一砖一瓦盖成大楼,则需要一两年的时间。