DeepSeek震撼美股！將威脅NVIDIA地位？究竟是曇花一現還是真有威脅！？

曲博科技教室 Dr. J Class

Просмотров 383 тыс.

9 600

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 8 фев 2025

Комментарии • 1,3 тыс.

@Ellis曾 3 дня назад ⁺³⁷
曲博真的是一位很小心的學者，把操作原理作了深入淺出的系統性說明 ; 但卻把前因及其取用了誰的什麼又利用了誰的什麼等等隻字未提，對於新的高階發現舆研究 ; 我們給予認同及鼓舞，但更願大家都能對詳真的來龍去脈有更真實的認知 ; 也才能更加客觀的看待這複雜的世界。
@Randy-gn2rh 2 дня назад ⁺²
其實各家都會用它家的token來強化自己模型的認知，從google的發現中國ai模型的資訊，到各家都有彼此的影子，就像你身為人類，你無法忽視整個社會化帶來的影響，而程式碼是完全開源的，對於我們工程師真的非常開心，也許您接受到的資訊都是抄襲，但不能否認這其中的突破
@Randy-gn2rh 2 дня назад ⁺⁶
以前看醫學期刊，有醫生參考了它人的方法，加以改良後，用了不同的方式開刀，並且公佈於世。例如：我們現在用的微創手術，早期是腹腔鏡手術，如果不是有人願意發表並把資訊透明，人類能進步的基礎還是分享
@Randy-gn2rh 2 дня назад ⁺²
複雜的眼光去看待這世界，就很難真正客觀
@zhaorichard764 2 дня назад
@@Randy-gn2rh 你好耐心啊。点赞
@dfhuuyrsjppq День назад ⁺¹
所以你有證據DS取用了誰，利用了誰？還是又是[聽說]?
@hongdeCHI 4 дня назад ⁺⁶⁴
身為門外漢的我，看完您的說明，也似乎懂了那麼一點! 謝謝
@lyang1688 5 дней назад ⁺¹⁸⁸
有曲博在這麼短的時間幫大家解惑真是太感恩了幸福有你這樣的專家學者的專業指導
@TOM-bl6ib 3 дня назад
ruclips.net/video/R1Gr0QoJxpY/видео.html 这个视频对DeepSeek的分析很震撼！希望博士解惑一下
@1ericube640 3 дня назад
都开源了，你们台湾可以本地部署自己改，把台湾改成宇宙第一都行，自己随便编64那些老掉牙事情，每天都看几遍自己爽哈哈！
@Your_Majesty_2024 3 дня назад
DeepSeek 之后，你会发现最值得入手的是 SMCI 我们台湾人创立的 SMCI ruclips.net/video/GcJLQ9CzFTc/видео.html 这里可以了解更多 SMCI 25年的翻倍黑马几乎
@凱明周 4 дня назад ⁺²²²
很喜欢曲博的风格，不参杂任何意识形态成分，实话实说，令人感动。👍
@catinbootsnow4267 4 дня назад ⁺¹⁴
不滿足台灣數位發展部的任職資格要求😅
@祖宗-e5o 4 дня назад
台湾人不提政治就不会说话
@TOM-bl6ib 3 дня назад ⁺²
DeepSeek就是新时代的天才数学少女姜萍！
@祖宗-e5o 3 дня назад ⁺⁵
@@TOM-bl6ib cao ni ma B
@k-bs2vc 3 дня назад
@@TOM-bl6ib 口嗨改变不了事实，别跪了
@Chia-LoWu 4 дня назад ⁺¹⁸
受益良多，非常感謝你
@Ansforce 3 дня назад ⁺²
謝謝你的支持！
@peteralex6655 3 дня назад ⁺¹
@@Ansforce 曲博能否谈谈低成本蒸馏对英伟达的影响？
@mickeytsao 5 дней назад ⁺⁷³
感谢曲博的解析，粗略而易懂的讲解对AI技术的科普真的是太重要了！👍👍👍
@luzm7918 5 дней назад ⁺⁴⁵¹
AI業內都在看deepseek論文，模型開源程式公開，讀論文的人基本上沒有太負面的看法，基本上都認為推動了AI產業技術進步。開源也可以讓任何人在本地部署，去做實驗，完全沒有個資問題。反而OpenAI完全閉源無法本地部署
文科生or以政治為生的都是去問8964、TW是不是國家、獨裁民主..... 結論都很負面
BTW：nVidia還上線了deepseek模型，可以讓你方便使用。
@CrimsonVine-v3 5 дней назад ⁺¹¹³
有些人習慣了用輿論控制世界，但是理工科只講邏輯，不論立場，這招就沒法玩了。
@WL-mi9pl 4 дня назад ⁺¹⁴
但控制世界的會不會最後都是文科生？企業高管有多少是理工背景出來的？現在全世界總統/高階政治人物多少比例是理工背景出生的？
@PeilinSong 4 дня назад ⁺²
@@WL-mi9pl Politician is Politician, bussinessman is bussinessman, regardless of education backgrouds. It is true that in treal world that 文科生 is disadvantaged "over" 理工背景.
@李胖子-m7f 4 дня назад ⁺¹²
@@WL-mi9pl我觉得大部分科技公司的老大都有理科背景吧😂
@vincerong9464 4 дня назад ⁺¹⁹
@@WL-mi9pl 中国古话百无一用是书生
@mobilednc 4 дня назад ⁺⁴²
27:42 演算法改良：靠人才研究。精準的數據：人力和AI工具。強大的算力-硬體靠錢投資
@joseyrace3774 4 дня назад ⁺¹
幾句話總結，說得好。
@陈生-w2h 3 дня назад
最后一项由于美国的封锁，大陆不是靠资金就行的，还需要更加努力。
@Ron6384 4 дня назад ⁺³¹
終於等到曲博的解析，這種專業的東西還是需要專業的人導讀，非常感謝
@cornerpn 4 дня назад ⁺²⁴
人類要聰明
1、記性要好(ai都記的住)
2、思考問題的方式要好(演算法的改良)
3、學習的東西要是正確的(高品質的數據)
4、學習的時間要很足夠(強大的運算能力)
@dongoufei 4 дня назад ⁺⁴⁰
现在我知道tiktok不卖算法的原因了，算法真的很重要，数学领域需要天才
@bauhaus6725 4 дня назад ⁺¹⁵
有開發有競爭有進步！然後一直輪迴下去，產品越來越強大
@ITsESG168 2 дня назад
謝謝曲博的用心整理, 協助我們可以站在時代巨人的肩膀, 擴增視野
@Ansforce 2 дня назад
謝謝你的支持！
@Joehotel520 4 дня назад ⁺⁹
第一個科普deepseek 這麼清楚的YT，🎉厲害
@Alston-k9e 4 дня назад ⁺⁶⁰
知乎上看到一個比喻滿不錯的：DeepSeek-Zero 就像是一個口齒不清的天才兒童，不用老師，自學成長(non supervised learning)學會了極强的推論能力，但不會表達，講話沒人聽的懂，於是加入supervised learning教他怎麽【講人話】，這才有了DeepSeek-R1
@tuanli-nc6kg 4 дня назад
deepseek本身体利用国内大数据已经很吊了。所谓的蒸留就是扯蛋。训练Ai本身就是利用全球公开的资讯数据。没公开的数据，Deepseek又不是神仙会破解获得。
@Mr-Chim 2 дня назад
你跟deepseek-zero剛好相反，講了一堆，內容卻沒有任何邏輯，嗯，加油！
@kevinzhan7387 4 дня назад ⁺⁶
千呼萬喚始出來，一直期待曲博士討論DS
@讨厌上班-x6v 4 дня назад ⁺³⁸
终于等到曲博士的解读
@wenliang1841 4 дня назад ⁺¹²
希望能聽關於 DeepSeek 在 CUDA 與 PTX 的故事。
@劉峰旻-x7l 4 дня назад ⁺²⁷
大陸這次真的很強
如果再用意識形態來扭曲
只會讓自己在象牙塔裏口嗨
@Ansforce 4 дня назад ⁺¹⁴
說的好，這樣才是正確的態度。
@倫-i4i 3 дня назад
大陸也證明了，美國一定要滅共...太危險了。
@賴建良-x3g День назад ⁺⁴
提取人家的成果便宜賣正確?
@kangwenhu5513 День назад
@@賴建良-x3g 怎麼捉摸著跟米爹一個口氣呢，是特麼的專門出來賊喊捉賊嗎？
@qiangzhang4052 День назад
@@賴建良-x3g 怎么提取？都是公开接口，付费提取。再说你读书的时候，没买过总结性的学习资料？爱因斯坦研究出了质能方程，是不是别的国家也要出个爱因斯坦再研究一次，才能使用呢？
@luting3 5 дней назад ⁺²⁰
我一直在等曲博的这个视频
@keta423 4 дня назад
謝謝
@蔡-t6r 4 дня назад ⁺¹³
感謝曲博分享，這是目前我看到的DS講解最好一集。
@afonsode419 4 дня назад
有很多啦你沒看大陸或美國的而已台灣的也有很好的努力找找把講政治
廢話的都全不看就節省很多很多的時間啦
@theamazings2296 4 дня назад ⁺⁴⁵
终于听到专业解释了！曲博士赞一个！看到海外很多自己做AI Agent的，或者提供AI Agent服务的人，还有AI编程的人都自己部署32B蒸馏版，原来不明白，现在看32B蒸馏版本竟然达到了openai-o1-mini能力，那难怪很多人本地部署，一个是很多企业不想联网，怕企业数据丢失被盗窃，但是又没有类似o1-mini能力的可本地部署产品，那deepseek 这些蒸馏版的确是福音。AI编程的人据说每天也要花掉几十万token，一个公司应该很容易本地部署32B，或者70B版本，那也是给公司剩下一大笔钱。
@蔡-t6r 4 дня назад
你講得沒錯。
@JSHF-CE 4 дня назад ⁺¹
Llama也開源，也可以本地部署
@Logical-First 4 дня назад ⁺³
@@JSHF-CE
差太远了，美国很多都换成deepseek。
@JSHF-CE 4 дня назад
@@Logical-First 因為它直接蒸餾了頭部的OAI
@Logical-First 4 дня назад ⁺²
@@JSHF-CE
你比OAI更懂OAI？
@ttesttttestt-cj5by 5 дней назад ⁺⁵⁵
就是老師與學生的知識傳承，不懂為什麼怕輸而去限制，未來只有更快更精準，這樣的知識傳承只是不像人類會死亡而失傳
@StevenH815 5 дней назад
政治因素而不是技術因素，技術沒有色彩，但政治有！
如果是別國搞出來的，西方世界還不會反應這麼大，但中國搞出來的，還搞言論審查，這誰敢用阿？不怕自己的機密被中共竊取了？
@蕭乾元 5 дней назад ⁺⁹
擋人財路
@AndyCGX 5 дней назад ⁺⁹
蒸馏技术是所有大语言模型的公司都会去用的方法。就算最强的OPENAI也一堆人告他，训练别人的资料
@jackhmlin 4 дня назад ⁺²
DS違反不能萃取OpenAI的資料再回頭做商業競爭條款
@oliverhuang344 4 дня назад ⁺⁶
@@jackhmlin 你的意思是openai偷了全世界後規定別人不能偷它的? what a joke.
@lukehua5989 5 дней назад ⁺¹⁷⁴
DS选择开源不但把蛋糕做大了，还让更多人参与分蛋糕，而不是让一小撮科技大厂垄断。
@1019mena 4 дня назад ⁺¹⁹
中國字幕組在別人花大錢拍的影片上，上字幕上廣告免費觀看，對全人類貢獻真的好大
@士明褚 4 дня назад ⁺⁴⁸
@1019mena没有中国人你连字都不知道怎么写
@s0955790903 4 дня назад
@@1019mena 綠蟾蜍也配看影片?
@5t0ryte11er 4 дня назад ⁺²⁶
青鳥無處不在
@elkcuh1 4 дня назад ⁺⁴²
@@1019mena雖然你立場鮮明，很難接受其他意見，但我還是忍不住要拿一個比較貼近的比喻給你參考：當老美用百萬級攝影機拍攝高成本電影的時候，中國人發布了用手機拍攝的低成本電影，成果甚至比美國人拍的還好。
@josephshen86 3 дня назад ⁺¹
感覺就是填鴨式教育和建構式教育的對決，在資源有限的環境下，填鴨式教育可以確保低成本與高效能。兩者在開發方向走上了不同的路子，在短期內填鴨式教育可以達到一定穩定而高效的產出，而不採用critic 2元式的判斷機制，而用群體訓練獎勵也確保了降低模型出錯的機率，彌補了填鴨式教育缺少創造力的缺點。真的很厲害，另闢蹊徑。
@changargai 4 дня назад ⁺⁴¹
DeepSeek成功展示強大能力，尤其是效率，給美國AI產業界和資本市場，帶來極大的衝擊。不誇張的說，它掀翻了美國科技巨頭和資本市場吸金和印鈔的溫室。
@mainderchen 4 дня назад ⁺⁵
未來移動終端的AI agent 應用，將會加速到來，這個對於我們的生活將會有巨大的改變，例如個人健康顧問，法律事件的書狀顧問，行動秘書顧問；
@hanklin6660 День назад
有幸當您的學生, 憶起輔大科管教學畫面, 歲月沒停留在您面容, 還是很專業. 簡單易懂!
@Ansforce 20 часов назад
@hanklin6660 新年快樂！
@risasuper3174 5 дней назад ⁺⁹
謝謝！
@risasuper3174 5 дней назад ⁺²
謝謝🙏
@asia-88 5 дней назад ⁺¹⁸
优质解析，优秀博主❤❤
@hsumarco153 4 дня назад ⁺¹
感谢曲博士浅显易懂的讲解，看完视频，让我的大模型的知识更加丰富了。
@atlasx5947 4 дня назад ⁺⁴
曲博永远不会让人失望
@s.t.1384 4 дня назад ⁺²
真的解釋的非常詳細，很喜歡聽你解析專科理論
@harrymeng2309 5 дней назад ⁺²⁸
谢谢老师的详细分析！未来AI主要是华裔与印度裔（美国大公司）在智力上的竞争, DeepSeek只是率先给出答案, 精彩还在后面😄
@ckwong1226 5 дней назад
屎华人与话人得竞争，在美国的AI工程是人才耶时华人。
@gaozhan956 4 дня назад
不知你有没有在美国高科技大厂工作过，老印有智力优异的个体，但是做为群体，他们造就低效高内耗企业文化，早晚把美国高科技大厂玩死。
@junpengsshen-mq2ec 4 дня назад
这也是没办法的挽尊了。反正中国不会赢，也不能赢，否则湾蛙怎么办😂😂
@shuyatai 4 дня назад ⁺⁶
傻啊！一開始就把距離拉開了，後面想追就沒機會了。deepseek 已經贏麻了。又便宜又好用，誰還會用貴的，即使美國建牆也阻止不了了。
@ckwong1226 4 дня назад
@@harrymeng2309 是中国人与在美国的中国人的竞争。即便是在美国，研发AI的团队都是中国人。
@HexagramHuang 4 дня назад ⁺²
「取重點」在決策行為中是相當重要的關鍵，資料中充斥一堆不相干的雜訊反而會影響決策的效率。
@瘋言萬葉 5 дней назад ⁺¹⁰⁴
美國用政治新聞處理網路攻擊就代表deepseek強太多了而且還是完全開源的
@fanfu945 4 дня назад ⁺¹
關鍵在資料庫建立，若真的完全不透過對它方資料庫用特殊手段(如蒸餾技術)，而是完完全全透過自身技術和有限算力工具來建立自己的大語言模型資料庫，那就真的厲害了。
@مرواریدمشرقزمین 4 дня назад ⁺⁸
DeepSeep 從v3用到r1已經快2個月，各方面測試快速正確真的比open o1強
@sslc296 4 дня назад
如果不厉害网上一堆人骂懂吗为什么骂的少因为嘴硬即使好也不会承认@@fanfu945
@momentmove3726 4 дня назад ⁺²
是嗎？是個突破；突破就是強大？deepseek突破的是普及化。但在基礎研發，尖端及軍事應用美國還是領先一段距離的。
@mhmai3370 4 дня назад ⁺⁴
要再加個台灣
@waca7414 4 дня назад ⁺²
老鐵這次真的蠻厲害的
沒有因為GPU被限制硬要競爭搞出半殘的東西
而是用現有的基礎上去加強
@kemachan9633 4 дня назад ⁺⁶
前陣子要AI自主的印度，還想花大錢購買nv的GPU，現在就看印度還願不願花大錢買設備
@happyfeel615 4 дня назад ⁺²
印度部长已经说了要在DeepSeek的基础上研究搭建印度的AI模型
@neo_smith 2 дня назад
基于中文思维方式的模型，其他语言下能力会缩水的@@happyfeel615
@binladan911 3 дня назад ⁺¹
謝謝說明，簡單的介紹人腦.AI.各種訓練方式，期待AI的競爭和之後的發展。
@0FolkDance 4 дня назад ⁺¹²
我印象中百分之一的成本，是媒體說的，在deepseek的論文中只有提出他們在"某階段的訓練"中，如果租用什麼樣的算力中心顯卡，成本大約是多少，因為他們自已有顯卡，所以只是使用類比去估算沒有自已的顯卡，需要要花多少成本，但是媒體把它拿去跟別人的"總訓練成本"作比較，比較的基礎相差巨大，才會出現百分之一這種離譜的數字，我覺得這是媒體的鍋，不是deepseek的鍋，但它的做法節省了大量成本這件事本身沒有錯。
@Ansforce 3 дня назад
是的，媒體是用金額去反推算力大約1%，這個粗略預估的方法還可以。
@不给糖 3 дня назад
@@Ansforce 为什么你们都关注1%成本？如果他用出100%的成本，会不会更炸？
@Frank.W 2 дня назад
@@不给糖用出100%的成本不代表能發揮出100倍的能力，有時候這並不是等號，所以談這沒意義
要是光靠堆錢就能出成果，AI時代早就該來臨，但是並沒有
@nanpolend 4 дня назад ⁺¹¹
簡單來說就是權重參數萃取不重要的刪去論文問卷找相關性也是這樣做法，沒有版權的屬於思考方法
@simonyu3240 3 дня назад
你是説關於OpenAI侵權的幾個還沒有打完的官司嗎？
@魏金樹 3 дня назад ⁺¹
曲博真人才，讓大家見到了真相，讚啦
@陳音樂-d2u 5 дней назад ⁺¹²
沒有research功能的AI感覺像傳統單機版電玩對比網路版電玩，畢竟即時資料庫互動的意義是重要的。而大量即時資料取得和分析的處理算力還是必須的而且每一代產品的推進會疊加更多創新功能
@飞出水面的鱼 5 дней назад ⁺²
相比OpenAI，它反而时实时更新的（打开联网功能）。而网络爬虫是几乎不需要算力支持的。
@陳音樂-d2u 4 дня назад ⁺²
你有用過o3嗎
@陳音樂-d2u 4 дня назад
「即時更新」海量資料庫後分析推理是需要較大算力的
@Skynetuser123 2 дня назад ⁺³
Deepseek是科學問題，而不是政治問題
我們要用科學的方式，去解析其技術與方法，和未來對產業的影響，而不是用情緒與政治的角度去看事情，感謝曲博詳細的解說，才能正視聽明是非
@Ansforce 2 дня назад ⁺¹
你說的很好，正解。
@peterson-p2j 21 час назад ⁺¹
@@Skynetuser123 很難，因為科學的用途會取決於政治，以科學論科學是夢幻中的象牙塔
@蔡幸芳-o8t 17 часов назад
如果是如此那中國的誒唉某些見解就不會跟自由世界的ai那麼不一樣！ㄆㄧㄠˊ竊的東西當然便宜（有人懷疑不只如此喔美國在查晶片來源了）。裝上它不曉得會不會也竊取你的個資！
@Simonno586 4 дня назад ⁺⁶
老師開了扇窗才有學生的表現，照這邏輯如果把這扇窗關了，這學生就沒有精準的資料可以蒸餾。
所以數據還是要自己花錢訓練才好，你蒸餾人家的數據，人家也可以蒸餾你的方法，彎道超車總是無法拿到最後的成功，紮紮實實自己訓練才是真的
@paulli7953 4 дня назад ⁺¹
重新发明轮子？
@catinbootsnow4267 4 дня назад ⁺⁴
科學家們為什麼要發表研究成果學術論文而不是把科研成果當成珍藏的秘方？就是為了全人類的進步做出貢獻。
@徐Xl 4 дня назад
你好无知，总盯着美国，deepseek母公司幻方量化2015年就开发大模型用于炒股，量化工具。跟chatgpt只是侧重点不同。openai开发侧重日常聊天搜索，面向普通用户。幻方量化主要是用来炒股，普通人也接触不到。美国掌握全球舆论，自家的东西宣传的全世界都知道，马斯克被宣传成电动车鼻祖😂😂😂其实特斯拉是马斯克买的，马斯克还在读大学时，深圳满大街比亚迪电动出租车。
@LR-kc7gb 3 дня назад ⁺¹
@@catinbootsnow4267那你猜猜為何需要專利法跟企業秘密法
@alisontsai3030 2 дня назад
講得真的非常棒
@Aurora2024-wif 4 дня назад ⁺³
機器語言是無敵的---以前寫程式都是斤斤計較的---速度快的一匹---
@mhmai3370 4 дня назад
的確...以前公司的晶片卡在.25制程...最後是靠FW 使用組合語言去改寫...打敗使用.18制程的競爭者使用C的晶片
@wijclare 5 дней назад ⁺²¹
終於等到曲博解說了
@王盈盈-w5b 4 дня назад ⁺²
不愧是曲博 ❤
@yonghe9856 5 дней назад ⁺⁸
等好久了😂😂😂，谢谢🙏
@SyuAsyou 4 дня назад
感謝曲博精心解說～先訓練強大的超大型語言模型，再精煉成小型語言模型，以此構成MoE，希望本地端的強大AI引擎盡快到來～
@yijing8230 4 дня назад ⁺⁸
謝謝你的中立，純科技比較分析🎉❤
@Gary-tk5bt 4 дня назад ⁺⁶
重點: DeepSeek 能快速與降成本主要是拋棄 [ 評論器 Critic ], 這是其他人所沒有的.
@space-sci-x3r 4 дня назад ⁺¹
并不是r1的成本降低是因为v3基座。
@dristelwu5040 5 дней назад ⁺⁵
解读的非常好
@chinacoal2339 3 дня назад ⁺²
你請deepseek用《過秦論》的文字風格寫《過美利堅》，拍案叫絕！👍🏻👍🏻👍🏻
@dianasong4594 5 дней назад ⁺⁵
Human brain efficiency of energy usage is higher than AI in general. OpenAI has been in the wrong direction since.
@LML8071 2 дня назад
我認為各有好壞，就好像有經驗的師傅與博士所要面對知識深度與時機，無論如何這兩者都需要互相配合，並且因功耗與延遲對應在機器人與雲端，才會達到最有利的體系。
不過這場看來，像是潛力與CP值之間的爭鬥，由市場資金倒向誰來決定勝負，或不同客戶區隔打平。
@yingwenzhao7328 5 дней назад ⁺¹⁵
高品质的解释👍
@ThomasChiang-u4h 3 дня назад
上了一課AI 知識，Thank you very much!
@goodsealion 5 дней назад ⁺⁶
特別開門
@王安澜-m1u 3 дня назад ⁺²
台湾人也看鉴宝😂
@richardliu4939 4 дня назад ⁺¹
曲博这个视频还算好，及时性比起其他一些博主要差不少。
@黄天-s7x 5 дней назад ⁺²¹
曲博的视频永远都是没基础都能看懂一二
@comjordidesign 3 дня назад
感谢老师的讲解，人类科技的发展真是令人惊叹不已
@cocacola787 5 дней назад ⁺³⁰⁴
狠狠打臉民進黨還在那邊酸數發部200億幹什麼大事？
@chaochan-iq2ci 5 дней назад
天才少女糖凤比不上天才少年梁文超😅
@hsichuanchen9050 5 дней назад ⁺⁴³
共產黨急了
@wellowline6480 4 дня назад
@@hsichuanchen9050 這一把共產黨贏了,有啥好急...以後推出更多免費打死一些要收費的公司
@penaeus1234 4 дня назад ⁺⁵³
幫助全民點麵線。
@張子心-f7i 4 дня назад ⁺²⁶
@@hsichuanchen9050
不可能《急》吧？因為《數發部》程度不夠啦 … 沒聽說過：國際級圍棋手面對小學生挑戰會《很急》對吧？ 😂😂😂
@走哪算哪 4 дня назад ⁺²
至少现在国内有很多国产GPU能部署DeepSeek 推理机了，国产芯片确实看好。
@nxul2454 4 дня назад ⁺⁸
Deepseek再強也強不過我大台帝國耗資2000E的點麵線😊😊
@simonyu3240 3 дня назад
鳳姐的DMX技術也是世界獨創的，已經達到了非人類能力的巔峰，蟾蜍，禽獸，綠X雙向奔赴
@PeilinSong 4 дня назад ⁺¹³
Congrats to you on your quick learning capability on those topics. I have a fews points: 1. Deepseek never revealed the actually costs. 5.5 miliiion is an estimattion by CNBC. It is hard to estimate the cost as I believe that they use both NV GPU and Huaei Ascend GPU. 2. The significant of DS is that it shows again that algorithm (not software) is much more important than hardware. A previous example is back-propagation algoriothm, which enabled the application of learning based on NN. 3. The importance of CUDA is over-exaggerated as it is easily bypassed by DS engineers. I am able to code in CUDA after half day training. I am an enbgineer, not a computer graduate. People wishfully exaggerate CUDA in the same way TW people do to TSMC.
@zyjdf 4 дня назад ⁺¹
感谢曲博的解释，给曲博点赞
@wychan7574 4 дня назад ⁺⁷
最好還是可自己用deepseek 開源架設個人ai 不必連線, hosting 要求配置也不過份, 正常i7 RTX 4070, 16 GB 10 TB 硬碟已經可以. 這就証明deepseek 是open ai 的家用版了.
@大舜林 4 дня назад
謝謝曲博專業詳細的說明，受益良多~
@飞出水面的鱼 5 дней назад ⁺⁶¹
在这里评论的，有几个人真正听明白了？至少以我学习能力很少输人的能力，花了几个小时才真正理解这些内容，真是绝美的思路和设计。听懂尚且如此困难，设计这套体系的确实恐怖。那些情绪化评论的，可以省省了吧！
@先生江-r6r 4 дня назад ⁺³
你說了什?省省吧
@我行我攝 4 дня назад
所以deep seek用的GRPO評分方法實作的設計方式是什麼?
@momentmove3726 4 дня назад ⁺¹
是有突破，但離恐怖還有距離。聽聽另一位發明堆疊式NPU的台灣博士的剖析
ruclips.net/video/7gdOL8QqxHI/видео.htmlsi=cgOCTEmfKQt5MIhE
@kenttsai7050 4 дня назад
你應該非資訊系所相關科系畢業的吧（大陸信息相關科系），且沒有後來進修ai 知識，才會那麼難懂，前面說的都是基礎理論，重點在知識蒸餾用open ai data base 來charge,所以。。。。哈哈😂
@wirelessafrucidfivg 4 дня назад ⁺¹
兄弟，你这是对牛弹琴。以我的经验，下面很多繁体评论会迷之自信，批评你能力不行的
@陳素蘭-c7j 4 дня назад
太太太深奧了，聽無，但真心佩服，讚啦，加油！
@raintire 4 дня назад ⁺⁸
「知識蒸餾」聽起來很像華人世界的「補習班」教育，從人類世界的實證，這是很有效的方法XD
@Ansforce 4 дня назад
哈哈！
@jt-ttt 4 дня назад ⁺³
翻译的问题，应该翻译成知识提炼
@Ansforce 4 дня назад ⁺⁷
@@jt-ttt 是的，確實翻譯成知識提煉比較恰當，但是媒體大部分都寫知識蒸餾，我想想才改的。
@黃崇適 4 дня назад ⁺³
@@Ansforce大部分媒體的語言掌握能力不夠好，結果拉低了大眾的語言能力...偏偏，大眾語言就是主流語言😢
@SyuAsyou 4 дня назад
我都說精煉，蒸餾這說法太莫名了
@chenchzd 4 дня назад ⁺¹
很好的一部研究說明影片
@MorrisPan 5 дней назад ⁺⁴
數據經過不斷的蒸餾到最優，是不是最后有機會就做到不同領域的ASIC或IP?😅
@Ansforce 5 дней назад ⁺⁷
數據蒸餾應該也有極限的，不可能一直蒸餾啦！
@andylu6431 4 дня назад ⁺²
這次DS衝擊，是否讓AI從高到低的運用加快普及？
不知這樣想對不對，資料中心需要強大的算力(高階晶片)，邊緣裝置夠用即可(中低階晶片)
中低階(7奈米以上甚至28奈米其實也挺快的)
@GroundWalker 4 дня назад ⁺¹
本地布署可用的模型
還是要"高階"顯卡才能跑
@caliber90ft123 2 дня назад
台積電曾經收現金幫比特大陸代工一批用於挖礦的ASIC, 未來embedded DS能否發展就看那一顆“夠用“的ASIC是怎麼被定義出來。
@LILI-ri9xh 4 дня назад ⁺³
Nvidia从TSMC购买GPU 3000美元一个，卖30000美元一个，是暴利。而Deepseek对GPU要求不高，AMD的GPU也很好用，对NV是个冲击。
@mingli458 5 дней назад ⁺⁶
这才是科学的态度
@HsiehJerry-k2y 2 дня назад
光是訓練無法產出效率，簡化&刪除垃圾的推論，才能增進有效推論的效率。
@cynthialee-1005 5 дней назад ⁺⁵
謝謝曲博
@joseyrace3774 4 дня назад ⁺¹
deepseek利用現有各大廠資源加上努力不懈的研發，實現彎道超車，在AI賽道就看最後誰能衝刺到終點，
@tuanli-nc6kg 4 дня назад ⁺¹
不能这样讲。大陸Ai利用大陸庞大各种数据己经训练得很吊了。可能有少数利用欧美文化不同的资料也很正常(例如各种神教信仰审美,性别取向等等)，要明白大陸智能科技应用在生活是领先美国的(美国多在实验室)，14亿人产生的大数据当然比美国多。美国学中国更多(文字/功夫/算命风水美食等...，中国5000年历史
@seediqliu 5 дней назад ⁺⁶
曲博講的很棒。謝謝分享。
當 DeepSeek R1 技術開源後，宛如海水退去，立刻就能看到誰沒有穿褲子。
有些國家反應快，已開始著手研究 DeepSeek R1 開源技術論文仿效其創新之優點，設法也為自己國家趕緊設計一件新褲子。相對的，其他沒有反應的，還站在原地沒穿褲子的，是有什麼更前衛更先進的想法嗎？ :)
@LatifaGruslin-o4z 5 дней назад ⁺²
禁止使用就行了，皇帝的新装胜过一切。哈哈哈
@atracy7686 4 дня назад ⁺²
他们把潮水褪去后的光屁股，称为他们的…科技的民主瀚自由！！！
@simonyu3240 3 дня назад
独有的民主DMX和三民自技术
@eddylin6679 4 дня назад
希望曲博分享一下NPU、ASIC、GPU在算力方面的特性以及差別，以及在推論端NVIDIA有哪些競爭對手
@andrewlao8337 5 дней назад ⁺⁵
分析正確!!! 多謝曲博老師!
@SixGor16888 4 дня назад
全力支持互相形成社群共同合作 🤘🤘🤘🤘
@鼎元-h3y 4 дня назад ⁺³
曲博老師講得還是比較清楚怪不得歐美嚇到吃手手我是真的蠻佩服開發的人不過審查關鍵字就很扣分
@karta14393 4 дня назад
感謝講解🎉
想起以前念碩論的感覺😂
@正城林-q6w 5 дней назад ⁺⁴
南無阿彌陀佛
@user-qb8fp8oj1p 4 дня назад
曲博老師❤新年快樂😂🎉🤣💪👍🥳
@心胧 4 дня назад ⁺⁴
说句实话，没有谈到最重要的地方，最重要的绝非成本低而是以为开源开源意味着以此为基础所带来的各种衍生应用根本难以估量，对未来的冲击更加难以估量。
@Ansforce 4 дня назад ⁺¹
你說的對，問題DS又不是第一個開源的模型，這個怎麼會是它的特色？
@arnoldhao1446 4 дня назад
@@Ansforce有一个看法是，ds r1作为第一个比肩openai o1的开源模型会改变当前生态。
对于之前专注于ai应用的厂商来说，只能选择在线的openai或者Claude之类的模型，成本高且容易受到上游企业影响，但是ds r1的到来可以让他们自己部署不逊于openai o1水平的模型，这也就是前段时间我们看到，这些公司如perplexity、微软等一边质疑一边独立部署提供产品给客户。
而且对于一些大学以及研究机构来说，可本地部署的大模型在多方面都比在线模型更优。
以上种种就相当于破坏了openai等的生态，转而壮大了以ds qwen之类的开源模型的生态。
虽然说ds看起来是在应用端做了限制，但是在训练的过程中还是会有自己的偏好，比如前几天perplexity说自己部署提供的ds r1是无审查的，但是大家测试英文确实没有，中文仍然被审查。这种隐忧让人两难。
@mhmai3370 4 дня назад
@@Ansforce
個人認為...是開源+AI技術門檻降低...
@yangdaniel2780 4 дня назад ⁺⁴
@@Ansforce 确切的说在目前已知的开源模型里能做到和openAI不相上下品质的只有deepseek，而做出来的这家公司是一家中国公司，并且是在没有美国硅谷那种算力硬件的支撑下做到的，这才是问题的根本也是为什么美国科技股震荡的根本原因！
@wirelessafrucidfivg 4 дня назад
@@Ansforce 开源且好用的暂时DS是第一位。性价比算特色吧
@stingerwang6105 День назад
LLMs和算力是两个概念，LLMs的使用依存于后者，后者的选择具有多样性，而前者，单位时间训练效率高是第一选择要素…但无论这个要素怎样的高，算力始终需要…
@jackycheng10101 4 дня назад ⁺³
針對監督式“政治意識”微調
曲博的說明，果然超越政治與體制及民主或專制
只在忽科技技術
善乎？惡乎？
有意思！！
人為操控的監督式微調，又開始啟動政治體制與民主自由或專制獨裁的競爭
科技的自由，永遠有人為的手段操作，所以，沒有真正的科技自由
只有選邊站的自認科技自由與AI 人工智慧發展的不同走向
才開始的AI世界，已步入混亂糾葛，各自AI技術，變成利刃武器，無解！！
@wldtw2008 4 дня назад ⁺²
小弟覺得曲博的影片並不是這樣解釋的，我認為曲博說的是，他們是在輸出要顯示給前端客戶時打上馬賽克。
@jackycheng10101 4 дня назад
@wldtw2008
輸出前的監督式微調，就是要有另一套審核機制，可以是軟體或人工
因為涉及各國法律規定的不同，必然會有的機制，這樣才不會觸法
但是，因為這樣機制，就成為政治與意識型態及體制的下手必然
若只是糾錯或各地法律規定，那還好
若是意識型態的政治過濾或控制，那就是另一問題
這次Deepseek被詬病，不是就集中在這議題之一
其實自信點，把兩種或多種意識型態或政治體系的見解都提供出來，讓使用者自己決定，經過自己邏輯思考，做的判斷，至少沒落口實！！
但是，你認為，專制獨裁體制會開放不管制嗎？
越專業的人，一旦做壞事，傷害會更大，不可不小心思辨！！）（我不是指曲博喔，我也是在某些方面有一點專業，看過專業人士與天才級的專業，做錯判斷，對政治體制與民主自由，傷害是超乎想像的）
@kxttd6870 3 дня назад
@@jackycheng10101 1450
@w888 4 дня назад ⁺⁶
大幅「躍」進，不是「耀」進！
@jt-ttt 4 дня назад ⁺¹
和年龄有关，反正我们那里老人都说耀进。
@someday_will_be 4 дня назад
自古有不同發音。
@IdeoControl 4 дня назад
台湾的国语发音不完全等于大陆普通话发音。
@someday_will_be 4 дня назад
@IdeoControl 台灣學校從前有兩種不同發音。
@IdeoControl 4 дня назад
@@someday_will_be 好吧听过很多台湾人读耀，还以为这位纠正者是大陆人。
@kennywang2135 3 дня назад
哥哥讲得真好
@waffenss1234567 4 дня назад ⁺⁶
挖金礦的找到更有效率挖法，只會引領更多資本有限的人衝下去挖礦，
這對於專賣挖礦設備的商人不會有不好影響，華爾街搞錯狀況讓市場反應錯誤罷了
更多中小業者認為自己可部署高效小模型或魔改蒸餾小模型，長期來說只會讓NV的硬體市場更擴大
蒸餾也蒸不出AGI,所以其實大資本大算力還是一樣有需求，只是在不同賽道罷了
@emiliac8480 4 дня назад ⁺¹
沒錯，所以黃仁勳說DS將來還是很需要Nvidia的晶片。否則以後沒有人要花大錢，大家只能互相蒸餾來蒸餾去了。
@keithlam5300 4 дня назад ⁺²
沒錯。但DS證明nvidia估值變太貴。還是有影響
@蠟筆小岳 4 дня назад ⁺¹
推這觀點！
@寧靜-i9c 2 дня назад
1.此技術確實厲害而精確，但非自己建立龐大資料庫，而是汲取他方資料庫「蒸餾」出更精準的資料，然後運用販賣相同的產品，
就像跟大盤購買的中盤商，卻賣出更便宜的價格，進而影響大盤商的生存和利潤。
然後名為「禁止壟斷和創新」。
2.想請問，若被蒸餾的他方資料庫研發出，「反蒸餾模式」及「反相同諮詢應用販賣之合約及系統」，此蒸餾方法會如何？
@Ansforce 2 дня назад ⁺¹
@寧靜-i9c 汲取他方資料庫「蒸餾」出更精準的資料，然後運用販賣相同的產品，這是OpenAI指控DeepSeek是蒸餾OpenAI的模型，但是DeepSeek沒有承認。確實有人發明「反蒸餾模式」但是效果不好。
@m.preacher2829 5 дней назад ⁺⁴
基本是RL那套东西，但RL可扩展性不好，直接采用GRPO，很明显他们对自己拿到的数据很有信心，所以前提还是好的数据
@飞出水面的鱼 5 дней назад ⁺²
看来你没有听懂。
@heehaahoohoo 4 дня назад
訓練用既數據當然要有信心，假設全是對的啦，如不是訓練個屁😮
@LA2JERSEY 4 дня назад
Smart is the new cool. I enjoy your shows, but still have no clue what you are going about. Keep the good show coming!
@凜凜-f8t 5 дней назад ⁺¹⁰
H100晶片帶動的電力能源耗損的問題依然健在。
水冷技術勢在必行，早點進入兩相浸沒式冷卻時代吧。
氣冷技術的散熱效果已經極限了。
@猪必胜 5 дней назад
水冷？不是早已進入石墨烯散熱的時代了嗎
@凜凜-f8t 5 дней назад ⁺¹
@猪必胜
石墨烯散熱喔，那你伺服器要多貴？
@凜凜-f8t 5 дней назад ⁺¹
@@猪必胜
還有你石墨烯一年產量夠不夠支撐伺服器產業？
@凜凜-f8t 5 дней назад ⁺¹
@@猪必胜
你不要只會講東西，而不去考慮現實面。
現實就是台積電也辦不到大量量產石墨烯
@猪必胜 5 дней назад ⁺²
@@凜凜-f8t 你操心太多了，中國人有芭蕉扇。
@alanlin4201 3 дня назад
講話不拖時間.....先給一個讚
@dtao7284 4 дня назад
謝謝曲博老師科普式解讀DS,門外的人可ㄧ探究竟。😊
@tuanli-nc6kg 4 дня назад
下载ds，很实用

Следующие

Автовоспроизведение

一小時略懂量子電腦｜量子位元、量子計算、超導電路、離子阱、拓撲量子位元、量子糾錯