Это видео недоступно.
Сожалеем об этом.

从0.5B到340B的LLM都需要多少显存?

Поделиться
HTML-код
  • Опубликовано: 22 июн 2024
  • 本期视频介绍了LLM推理时所需显存与推理速度,以及Batch-Size,上下文长度,不同量化如何影响显存与推理速度。

Комментарии • 3

  • @techdiylife
    @techdiylife  Месяц назад +1

    视频中资料:techdiylife.github.io/blog/topic.html?category2=t08&blogid=0058

  • @vaelephant
    @vaelephant Месяц назад

    清晰易懂,干货满满

  • @xueyuandu
    @xueyuandu Месяц назад

    这种总结最实在,最受用!辛苦了!