EZ撸paper: DeepSeek-V3 技术报告详细解读 part2 | 开源最强模型 | 性价比之王的核心技术MLA

Поделиться
HTML-код
  • Опубликовано: 26 янв 2025

Комментарии • 14

  • @ez.encoder.academy
    @ez.encoder.academy  6 дней назад +2

    关于DeepSeek提出的MLA, 大家还有什么问题吗? 你能明白这个创新背后的intuitive understanding吗?

  • @fghxu
    @fghxu 5 часов назад

    讲解很清晰, 请多做AI论文科普. 果断订阅 😁🥰

  • @vincentshi6164
    @vincentshi6164 5 дней назад

    感谢up,非常感谢这种硬核的讲解,一个人吃论文还是有些困难的,有了讲解效率嘎嘎提升!

  • @himoreality
    @himoreality 4 дня назад

    非常好的讲解

  • @弓瑟李-p8t
    @弓瑟李-p8t 5 дней назад

    讲得太好啦,坐等part3

  • @PlainviewZhang
    @PlainviewZhang 6 дней назад

    谢谢博主!

    • @ez.encoder.academy
      @ez.encoder.academy  6 дней назад +1

      谢谢你的支持, 我其实不太确定这种纯技术分享是否有用,可能没人看, 非常感谢你的反馈,我有动力继续分享

  • @LieDing-kb2or
    @LieDing-kb2or 4 дня назад

    非常感谢您的分享,受益良多!前两天也开源的Minimax Text 01,里面也提出了新的架构Lightning Attention 您有兴趣讲讲吗?

    • @ez.encoder.academy
      @ez.encoder.academy  4 дня назад

      谢谢支持!好的,我看看,难得有个粉丝提要求,我肯定尽力满足. 我原计划是后面撸一下DeepSeek R1

  • @yachen1699
    @yachen1699 3 дня назад

    当前AI显然事关大国博弈,不必讲那些书生气的话。

    • @ez.encoder.academy
      @ez.encoder.academy  3 дня назад

      哈哈😄好的,我还是纯粹从学术角度在分析这个论文