台大資訊 深度學習之應用 | ADL TA Recitation: LLM Deployment 手把手教你如何部署大型語言模型

Поделиться
HTML-код
  • Опубликовано: 4 дек 2024
  • НаукаНаука

Комментарии • 4

  • @810602jay
    @810602jay 10 часов назад

    很棒的教學,感謝林博士 🥰 請教還會不會有後續更多 Serving & Inference 的技巧&實務教學?
    例如 Serving 不同 Quantaization & Sparse (Pruning) Model,找尋網路上關於 Serving Sparse Model 的資訊非常稀少。
    目前只有看到 vLLM 推一個 llm_compressor library 以及 nv 官方有 TensorRT-Model-Optimizer library 有 sparse model 的一些相關資訊 但也不是很清楚😓

  • @tunglee4349
    @tunglee4349 16 часов назад

    推薦使用RunPod上的vLLM

  • @hasszhao
    @hasszhao 16 часов назад +1

    max token这东西,很难调,用Mistral的话,token太大,至少我看到过它有时候会重复最后一句话而且endless。

    • @cher2023
      @cher2023 10 часов назад

      fading effect .... such romantic