不要浪费钱买课了,喂饭式教你训练大模型llama3

Поделиться
HTML-код
  • Опубликовано: 27 сен 2024
  • 有什么疑问欢迎小伙伴在评论区提问哦
    花子看到都会尽量回答
    模型下载
    链接:pan.baidu.com/...
    训练环境:
    WSL2 on Windows 11
    Ubuntu 22.04
    torch = 2.2.2
    python=3.12
    cuda 11.8

Комментарии • 15

  • @yantinghuang7491
    @yantinghuang7491 2 месяца назад

    七分半视频知识点密度极高,良心视频,赞!

  • @daubaschen
    @daubaschen 3 месяца назад

    頻道內容很不錯!持續關注

  • @xueyuandu
    @xueyuandu 3 месяца назад

    不错,小案例做的很生动!很想跟老师学习一下制作的方法😊

  • @Sulzbach-dk7ov
    @Sulzbach-dk7ov 2 месяца назад

    400B 就算用 4-bit quantization 硬件也跟不上啊😂

  • @gerryraul4324
    @gerryraul4324 2 месяца назад

    训练出来能干嘛呢? 姐 ,训练出来能干嘛

  • @alberttsai9007
    @alberttsai9007 3 месяца назад +1

    好想有一台4090的普通电脑

  • @yuga4605
    @yuga4605 3 месяца назад

    請問可以直接在anaconda的虛擬環境上,使用Vscode加入RoLa技術進行調整嗎

  • @JackChe-i5k
    @JackChe-i5k 4 месяца назад +1

    请问3060 12g能跑吗

    • @korterious1846
      @korterious1846 3 месяца назад +1

      1080 70b跑不太動 , 8b應該可以

  • @skullywag5937
    @skullywag5937 3 месяца назад +4

    完全没学懂,你略过了许多步骤。比如最开始的爬取数据就没讲,如何加载模型也没讲。

    • @ArtisanCloud
      @ArtisanCloud 3 месяца назад +1

      的确,数据格式怎么转化,才是关键,后面都是无脑操作

  • @yitong233
    @yitong233 3 месяца назад

    nb

  • @korterious1846
    @korterious1846 3 месяца назад

    666

  • @gerryraul4324
    @gerryraul4324 2 месяца назад

    看不懂。 现在都这样 操作 模型的吗? 唉。真麻烦

  • @leejo5160
    @leejo5160 3 месяца назад

    请问博主是在美国工作嘛?