E179|DeepSeek技术解析:为何引发英伟达股价下跌?

Поделиться
HTML-код
  • Опубликовано: 9 фев 2025
  • 随着DeepSeek登上苹果App Store榜首,这款低成本、高性能的开源模型引发全球关注的同时,也造成了英伟达股价在1月27日下跌近17%,市值蒸发5890亿美元。按理说,像DeepSeek这样的开源模型会带动AI创业繁荣,进而推高GPU需求。为什么英伟达却不涨反跌?本期节目我们将和模型算法、GPU虚拟化领域的学者与创业者一起探讨DeepSeek的核心优势,它对芯片产业和开源生态的影响,还原这场市场震动背后的逻辑。
    【主播】
    泓君Jane,硅谷101创始人,播客主理人
    【嘉宾】
    陈羽北,加州大学戴维斯分校电子与计算机工程系助理教授,AIzip.ai联合创始人
    John Yue,Inference.ai创始人兼CEO
    【你将听到】
    02:29 DeepSeek的三板斧:低成本、高性能、全开源
    03:57 大模型创新瓶颈:技术路线趋同,突破性想法变少
    05:09 核心创新:V3基础模型能力强
    07:01 创新一:MOE与绕过稀疏奖励
    09:04 创新二: 通过蒸馏学习传递能力,大模型教小模型
    12:46 为何V3出来一个月之后才引爆股市
    13:54 对英伟达利好与利空:冲击溢价但并未冲垮壁垒
    16:01 DeepSeek冲击英伟达两大护城河:“绕过”NVLink和CUDA
    23:00 类似于Groq的推理芯片能崛起吗?软件依然是难点
    29:11 《The Bitter Lesson》的启发:AI的两种基本能力是学习与搜索
    30:06 效率困境:AI需要跨越三个数量级才能达到人类智能
    35:20 开源的意义:降低AI应用开发准入门槛
    38:06 重构API价格体系:DeepSeek R1通过技术优化将成本降至OpenAI O1的1/27
    39:47 降级芯片难持续:老款芯片停产限制了成本优化空间
    43:08 小模型特定场景突破:某些任务已可媲美大模型表现
    45:34 未来AI基建分层化:端、边、云分工协同是趋势
    48:32 Anthropic的预测过分乐观:AI学习效率太低不足以追赶人类智能
    53:10 大模型本身不足以通向AGI,但基础研究方向正在取得进展
    56:00 模型自我能力提升是达到AGI的核心门槛
    57:33 通往AGI的多条路径:世界模型等不同技术方向并存
    01:03:22 提问DeepSeek :数据与持续创新能力
    【其他相关信息】
    MOE (Mixture of Experts,专家混合模型):一种神经网络架构,结合多个专家子模型进行工作,通过负载均衡提高效率,适用于大规模模型。
    Bootstrap (自举法):模型通过生成多个答案并选择最佳结果,来提升自身性能的自我改进方法。
    蒸馏 (Distillation):将大模型的知识转移给小模型,通过模仿大模型的输出,提高小模型的能力。
    GRPO (Group Relative Policy Optimization ,分组相对策略优化):一种用于强化学习的优化算法,通过在同一问题下生成多个输出(即“分组”),并对这些输出进行相对比较来计算奖励。这种方法避免了传统 PPO 中对价值函数的依赖,从而显著减少了内存和计算资源的消耗。
    PPO (Proximal Policy Optimization,近端策略优化):一种强化学习算法,通过限制策略更新的幅度来保持优化的稳定性。
    负载均衡 (Load Balance):在分布式系统中平衡计算任务,避免过度集中或资源闲置。
    强化学习 (Reinforcement Learning):通过奖励机制引导AI模型学习最优策略的机器学习方法。
    模型预测控制 (Model Predictive Control):基于对未来状态的预测来优化当前决策的方法,广泛用于自动化控制。
    NV Link (NVIDIA Link):英伟达开发的高速芯片互联技术,支持多GPU协同工作,提升计算效率。
    CUDA (Compute Unified Device Architecture,统一计算设备架构):英伟达推出的并行计算平台和编程模型,用于加速GPU上的计算任务。
    PTX (Parallel Thread Execution,并行线程执行):CUDA平台底层的指令集架构,直接与GPU硬件交互。
    CUDA Core/Tensor Core:CUDA Core 是GPU中的基础计算单元,负责执行并行计算任务;而 Tensor Core 是专门为加速深度学习中的矩阵运算和AI任务设计的计算单元,提供更高的计算效率。
    ASIC (Application Specific Integrated Circuit,专用集成电路):为特定应用定制的集成电路,通常用于高效处理特定任务。
    Groq:一家专注于开发AI专用芯片的美国公司,提供高效的AI计算解决方案。
    《The Bitter Lesson》(痛苦的教训):Rich Sutton的经典文章,提出在AI发展中,计算能力和规模比算法精巧性更为重要。
    世界模型 (World Model):一种能够预测动作后果的AI模型,常用于环境模拟、决策规划和强化学习中。
    《Genie 2》:DeepMind的研究论文,介绍了一个可以在任意2D图像中进行自由移动探索的AI模型 - 给它一张图片,AI就能变成图中的"主角",可以在画面中前后左右走动,仿佛真的进入了这个2D世界。这是一个重要的"世界模型"(World Model)的实例。
    HPC (High Performance Computing,高性能计算):使用超级计算机集群处理复杂的计算任务,通常应用于科学计算、气候模拟等高需求场景。
    【监制】
    杜秀
    【后期】
    AMEI
    【BGM】
    Dusk Movers - Alexandra Woodward
    City Phases STEMS INSTRUMENTS - John Abbot
    【在这里找到我们】
    公众号:硅谷101
    收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客
    海外用户:Apple Podcast|Spotify|TuneIn|RUclips|Amazon Music
    联系我们:podcast@sv101.net

Комментарии • 29

  • @yiuhongfung3980
    @yiuhongfung3980 3 дня назад +6

    這是我看過最好的 DeepAI 分析 真正行內業者意見全是乾貨 主持人也很好地照顧小白聽眾 不時總結嘉賓說話 舉例子 聽上去很舒服🙌🏻

  • @gaosan
    @gaosan 4 дня назад +6

    泓君的声线太好听了!

  • @jingjing5317
    @jingjing5317 2 дня назад +3

    作为使用了A I 3年的人 听得好累,还有时不时来个英文,真难受

  • @tellspring
    @tellspring 2 дня назад +1

    ❤很专业的访谈,不错!

  • @ENGINEERESS
    @ENGINEERESS 4 дня назад +1

    天天等着你们这一季🎉🎉🎉

  • @MR-js9el
    @MR-js9el 4 дня назад +1

    质量很高,感谢分享❤

  • @syl497
    @syl497 3 дня назад +1

    finally! thanks

  • @readword-cn
    @readword-cn 3 дня назад +1

    市场最主要的疑虑是因为deepseek的出现,美国会加紧对华高端芯片的限制从而影响英伟达的销量吧

  • @shih-chengmin
    @shih-chengmin 3 дня назад +3

    主持人反應極快

    • @jh113-b8j
      @jh113-b8j 2 дня назад

      集才华与美貌于一身的主持人

  • @weiwei6111
    @weiwei6111 3 дня назад

    昨天初八:早上被以前老板微信问DS相关的事, 下午跟投资人解释DS现象的原因, 晚上因为DS被告知一在线协作项目有转向, 接着跟人一直讨论这个R1的long cot训练数据怎么搞来的, 11点拉去听GRPO相关研究的在线分享, 准备休息看会电视, 第一个视频是YC的Diana在解释DS...切去看游戏博主Asmongold的视频也是在玩DS....

  • @goggles-666
    @goggles-666 День назад

    下载量不能说明什么

  • @lijingch
    @lijingch 3 дня назад

    现在李飞飞团队的出品可能真的影响更大了

  • @xugao3825
    @xugao3825 2 дня назад

    嘉宾关注的是硬件以及实际的应用,即使是对英伟达的影响,他们讨论的也是对公司长期的影响。更像是把时间线拉长10年,20年来看。而投资这件事虽然是对未来的预测,但充满了波动和情绪,未来英伟达好,不见得现在股价会好,股价好也不见得英伟达未来会好,加上是否会由于溢价profit margin降低等等降低估值,这都是金融估值的东西,和本身公司是否是好投资其实是两回事。
    但我们只能从当下看未来,所以我们即使现在在讨论10年的英伟达,也不能用现在的英伟达去类比。
    这点我觉得John说的其实很好,他认为很多目前冲击英伟达的事情,英伟达自己也可以做,而且未来有可能会做,且更加泛化。

    • @xugao3825
      @xugao3825 2 дня назад

      我们不能假定未来的同时又假定这些公司未来什么都不变化😂

  • @alexlee8897
    @alexlee8897 День назад

    陈羽北水平不太行,请不要老请他

  • @海東靑
    @海東靑 3 дня назад +4

    两位技术上是不错,但是对市场的分析思路真的是一塌糊涂。

    • @yuz835
      @yuz835 3 дня назад +3

      你说说

    • @海東靑
      @海東靑 3 дня назад

      @@yuz835 deepseek对市场的影响,和deepseek本身技术如何没有多大关系。我比较赞同下面这个结论:deepseek是开源社区的胜利。
      具体的市场分析其实很多视频说了,比这两位说得好,我不多说。打个比方吧:
      秦失其鹿,群雄并逐之。陈胜吴广是给了致命第一击。你去分析陈胜吴广“望之不似王者”,或者“天下群雄都比陈吴要强”,只能说明你看问题的眼光有问题。
      两位评论者的意思,“deepseek用的那些技术,我都懂”。那么在deepseek出来之前,你有认识到这些技术能够产生超越chatgpt的成果吗?

    • @shanliu6190
      @shanliu6190 День назад

      如果是分析未来2个月,那确实他们分析的不太行。时间线拉长到2年,我觉得没啥问题。

    • @海東靑
      @海東靑 День назад

      @ deepseek对市场的影响,根本不是deepseek的事情。讨论deepseek技术如何、美国是否继续领先也没有意义。
      我同意Meta大佬的说法:deepseek是开源社区的胜利。
      具体的也不多说,很多视频都讲了。我只说一件事,其实在这个视频里面也有体现:在DS出来之前,其它AI公司、团队的思考是,我能跟上OpenAI吗;DS出来之后的思考是,这些技术我都会呀,我难道还比不过deepseek这小公司吗?
      我相信很多团队都有潜力超越deepseek,openai的领先地位也能保持一段时间。但是openai天下共主的地位丢了,市场现在已经开始跑马圈地了。openai自己对原有市场逻辑也没信心了。

  • @sqyang608
    @sqyang608 3 дня назад +1

    这两个嘉宾视野不够宽

  • @chouanlin
    @chouanlin 3 дня назад +1

    感觉嘉宾没有理解市场的疑虑

  • @alexyoung3609
    @alexyoung3609 3 дня назад

    这个John Yue似乎不会说中文,很难沟通。总是答非所问。😢

    • @valley101podcast
      @valley101podcast  3 дня назад

      我喜欢他的回答,很清晰。btw,他的母语确实是英语

    • @alexlee8897
      @alexlee8897 День назад

      @@valley101podcast 别为了一个错误的邀请自降身价,评论里大家的反馈都不当回事吗