【生成式AI】窮人如何低資源復刻自己的 ChatGPT

Поделиться
HTML-код
  • Опубликовано: 20 апр 2023
  • 可以拿來訓練自己的 ChatGPT 的資料集 (由台灣大學學生 Eric Lam 整理)
    github.com/voidful/awesome-ch...
    感謝黃敬峰先生提供字幕
  • НаукаНаука

Комментарии • 79

  • @HungyiLeeNTU
    @HungyiLeeNTU  Год назад +54

    可以拿來訓練自己的 ChatGPT 的資料集 (由台灣大學學生 Eric Lam 整理)
    github.com/voidful/awesome-chatgpt-dataset/

    • @PenutChen
      @PenutChen Год назад +3

      這個應該置頂一下

    • @l501l501l
      @l501l501l Год назад

      伸手牌問一下,如果自己訓練ChatGPT,用Pytorch train完model,最後的model也會是一個Pickle檔(.pt) 嗎?
      然後要使用model的時候(inference),也是initiate後load model,才能開始使用嗎?
      我在想如果考量到所有model相關的成本,"小資族"在cloud service開始使用model,除了training的費用,可能還要考慮host這個model的成本(e.g AWS: S3 storage cost, EC2 computation cost).
      又或著6~13B size的model,在16GB的ram 可以直接載入,在本地端使用?(抱歉我只使用過BERT,所以希望有人可以提供經驗討論一下,謝謝

    • @user-ks7kb8qe4s
      @user-ks7kb8qe4s 3 месяца назад +1

      謝謝Eric拯救比較窮的人

    • @morningstarkalis
      @morningstarkalis 2 месяца назад +1

      你有沒有興趣加入一個即將提交"發明專利申請書"的核心團隊? 我需要你的專業 我也會提供你的費用 我相信你看過我的發明專利申請書後 你會有極大的興趣

  • @xaviertsai4063
    @xaviertsai4063 Год назад +7

    上課啦~ 我覺得老師上的課很適合拿來當通識課。淺顯易懂。

  • @simonliao5020
    @simonliao5020 Год назад +1

    第一次看到字幕。👍👍👍👍👍

  • @user-uf8qe3ib1r
    @user-uf8qe3ib1r Год назад +14

    老师太贴心了,买不起 A100 的穷人很感动

  • @hchsu4765
    @hchsu4765 Год назад +90

    謝謝老師拯救比較沒有錢的窮人

    • @hyy3657
      @hyy3657 Год назад +6

      老黃:我知道你還有錢買我的顯卡

    • @yonhlai
      @yonhlai Год назад +3

      难道还有比较有钱的穷人😂

    • @uartim
      @uartim Год назад

      比較窮的有錢人

  • @carloshsueh9195
    @carloshsueh9195 Год назад +58

    好像沒開打賞功能,不然我真的都想交學費了。感謝老師的整理跟提供insight,這幾篇文章要我自己讀完跟整理最快最快也要兩三天,老師跟團隊讓我們不到半小時就學完了,請收下我的膝蓋 orz

    • @willy7703
      @willy7703 Год назад +4

      您兩三天就可以整理完 我覺得也是快啦XD

    • @user-ls9un9uc3t
      @user-ls9un9uc3t Год назад

      希望老師可以出完整的線上課程!

  • @user-iw1nz1kc8m
    @user-iw1nz1kc8m Год назад

    很喜欢你拍的视频

  • @heeheehaha45
    @heeheehaha45 11 месяцев назад

    李老師好,
    有兩個想討論的話題:
    1. 語言模型可以用自己生成的答案,變為訓練的數據嗎?如果可以,只要放著他們不管,他們自己也會越變越聰明啊
    2. 如果有人把自己的模型放在區塊鏈的智能合約上,對比OPENAI的模型的輸出作訓練,這算不算在法律上抵觸了OPENAI的term of use? 如是,誰要負上責任?區塊鏈上都是無明的。。。
    謝謝!

  • @Jack-sk9hy
    @Jack-sk9hy Год назад

    牛哇牛哇😂 我正在想这个问题!

  • @ansonchang4196
    @ansonchang4196 Год назад

    謝謝老師

  • @chenlin7535
    @chenlin7535 Год назад

    🥳李老师什么时候讲讲LLM的评估? 感觉太多的营销号鼓吹轻量模型什么什么能和ChatGPT抗衡,但是有没有系统的评估数据

  • @mibo._.
    @mibo._. Год назад +20

    17:10 Vicuna 看起來表現好的原因會不會只是因為,這個評分標準偏向 Vicuna 當時訓練的 metric,都是使用 GPT-4 來衡量

    • @HungyiLeeNTU
      @HungyiLeeNTU  Год назад +17

      我覺得你說的蠻有道理的,如果當初 Vicuna 訓練的過程中有用 GPT-4 的衡量結果來選擇模型訓練的 hyperparameters,那使用GPT-4 衡量模型會對 Vicuna 有利

    • @PenutChen
      @PenutChen Год назад

      投影片上秀的 Vicuna 參數量是 13B,但 LLaMA-GPT4 的參數量是 7B,這應該也有影響

  • @nameno7725
    @nameno7725 Год назад +3

    13:30 self-train 成本

  • @hhkk2742
    @hhkk2742 Год назад

    大赞🎉❤ 13:30

  • @user-nn8vb4gp4f
    @user-nn8vb4gp4f Год назад +4

    許願成功了~謝謝老師~~~🥳🥳🥳

  • @llrabel
    @llrabel Год назад +1

    真是太有趣了!

  • @run963741
    @run963741 Год назад +3

    最後再把所有 LLM 做 ensemble,LLM 練蠱比賽開始

  • @nvsrf
    @nvsrf Год назад +1

    现在已经可以 disable chat history, allowing you to choose which conversations can be used to train chatGPT models.

  • @bryanshen4930
    @bryanshen4930 Год назад

    生產製造機器設備可以數位雙生!那有領域專業的專家是否也可以有一個數位副本?

  • @yuyi9978
    @yuyi9978 Год назад

    請問老師如果想參加這些專案需要什麼技能呢?因為本身沒有學過這方面

  • @pang-jungliu3663
    @pang-jungliu3663 Год назад +17

    說是窮人但仍然是有錢的窮人….

  • @BoChengSu
    @BoChengSu Год назад +1

    話說如果有一點點小錢的話可以去Azure tune一下自己的GPT模型哦🤩

  • @thisismuffinmuffin
    @thisismuffinmuffin Год назад

    可是在使用chatgpt當老師的時候不是還是會有資料外洩的問題嗎?

  • @nking99t
    @nking99t 4 месяца назад

    我感觉最麻烦的是整理数据的部分? 假设弄个MedLLM,怎么整理医疗数据。需要很多domain knowledges

  • @shenseanchen
    @shenseanchen Год назад

    感谢Lee老师! 受教

  • @user-vt8iu8du6q
    @user-vt8iu8du6q Год назад +2

    看完以後才知道羊駝有那麼多英文單字...

  • @hsiaosai1120
    @hsiaosai1120 Год назад

    簽到

  • @user-bk9hm5ce3s
    @user-bk9hm5ce3s Год назад

    最後說的那東西不會有 overfitting 的問題嗎

  • @haoli6628
    @haoli6628 Год назад

    就像是Sheldon😂

  • @yi-erliao468
    @yi-erliao468 Год назад

    訓練完如果沒在訓練,要那麼大的算力嗎?

  • @chaower6958
    @chaower6958 Год назад +1

    please help. 請問Dolly 2.0 是NAR還是AR model??? ???
    我看pythia 是拿GPTNeoX來training的感覺是AR model。問cha它老兄跟我說Dolly2.0是NAR。 還是Dolly 2.0是hybrid的?

    • @chaower6958
      @chaower6958 Год назад

      補充一下: 我是想應用NAR 的model像是BART。如果Dolly 2.0 在NAR的領域內表現優可以取代BART,也算是解惑大半了。感謝好心人士的回覆。

  • @star95
    @star95 Год назад +4

    老師 請教那個ChatGPT復刻下來的模型有多大? 好奇要多大硬碟存儲。 另外一個問題,知識庫的內容部分都已經存在模型裡了嗎? 復刻下來的模型可以斷開Internet 在內網裡正常工作嗎?

    • @aliendog5134
      @aliendog5134 Год назад +1

      1.刻下來的模型多大要看你用什麼pre train model 2.不太懂你這問題是什麼意思 3.模型載下來基本上就是在你的電腦了 你要部屬到哪裡都可以

  • @corezhang9353
    @corezhang9353 5 месяцев назад

    请教一下,这个有没有完整的教程

  • @bbcc2960
    @bbcc2960 12 дней назад

    awesome 7:40

  • @fishyang2453
    @fishyang2453 Год назад +17

    比較有錢的窮人🤣

  • @rayk5097
    @rayk5097 Год назад +11

    老師都不用休息嗎?😂

  • @zhzhang9660
    @zhzhang9660 Год назад

    老师能分享PPT吗

  • @j1992624
    @j1992624 Год назад +5

    建議換一個麥克風,或是上個cc字幕,感謝

  • @dandelionsdontfly6422
    @dandelionsdontfly6422 Год назад

    出个手把手的教程吧😭

  • @user-qz4hx6mz1v
    @user-qz4hx6mz1v Год назад

    窮人==無法購買數萬組GPU的人

  • @zhongzhongclock
    @zhongzhongclock Год назад +2

    标题改一下:如何通过大只的“草泥马”生成一头小只的“草泥马”,这样可以吸引更多的观众

    • @drnmss3860
      @drnmss3860 Год назад +1

      这吸引的不是精准用户……

  • @zhengyaolu3893
    @zhengyaolu3893 Год назад

    是不是有点像Meta Learning

  • @mcluke8092
    @mcluke8092 Год назад

    LLM重新定义穷人

  • @majaja7368
    @majaja7368 Год назад

    為什麼不跟chat gpt 一樣用網路上的文章訓練,而是要透過chat gpt呢?

    • @aliendog5134
      @aliendog5134 Год назад +5

      因為chatgpt的資料量非常大 想要自己造一個基本上不太可能 所以就透過 知識蒸餾的方式 來達到復刻的目的

  • @chenwilliam5176
    @chenwilliam5176 Год назад

    我是窮人,沒錢
    購買 ChatGPT
    服務 😢
    還是使用 Goggle
    😅
    熟練後,還是可以
    「快速根據自己的意思」
    生成報告&論文😃
    ----------------
    而且 OpenAI
    CEO 已經要我們
    忘記 ChatGPT-5
    😢😢😢😢😢

    • @Dream-xr7ls
      @Dream-xr7ls 8 месяцев назад

      現在有 4 pro 了,想必4 pro pro 指日可待

  • @hsuchechun9113
    @hsuchechun9113 Год назад

    還是不夠有錢😢

  • @s.alikecool8728
    @s.alikecool8728 Год назад

    他們是比較有錢的窮人 14:25

  • @the_fluffychan
    @the_fluffychan Год назад +1

    「比較有錢的窮人」 😭

    • @user-gk3ue1he4d
      @user-gk3ue1he4d Год назад

      哈哈哈哈哈,总不能自己造电脑 gpu就是了

  • @incendioraven4269
    @incendioraven4269 Год назад

    比较有钱的穷人哈哈哈哈

  • @user-jx8gj3tv3o
    @user-jx8gj3tv3o 2 месяца назад

    是不是我太弱智了,我完全聽不懂😂

  • @yray
    @yray Год назад

    墙国能复刻么😂

  • @TankNSSpank
    @TankNSSpank Год назад

    666

  • @kouenshi7926
    @kouenshi7926 Год назад

    不能換好一點的錄音設備嗎....??????這品質聽3秒就想關掉?????????

  • @user-rf9oj9hr9w
    @user-rf9oj9hr9w Год назад

    讓別人幫你跑不好ㄇ GPT共用PLUS才75台幣 阿..我不是窮人是乞丐

    • @user-gn1mh7zv3m
      @user-gn1mh7zv3m Год назад +2

      開頭不是有說,沒看?

    • @tl7955
      @tl7955 Год назад +8

      看不懂可以不用留言😌

    • @Nick167507
      @Nick167507 Год назад +1

      在說你是窮人/乞丐之前,邏輯先修好吧

  • @user-un8wb4zq4y
    @user-un8wb4zq4y Год назад +1

    你懂個屁啊

  • @bers6034
    @bers6034 Год назад +1

    省流:chatgpt自问自答自评价。

  • @KenHsiehTW
    @KenHsiehTW Год назад

    謝謝老師