손쉽게 내 컴퓨터에서 LLM 돌리는 방법

Поделиться
HTML-код
  • Опубликовано: 22 дек 2024

Комментарии • 2

  • @seongminpark3131
    @seongminpark3131 2 месяца назад

    양자화 보통 q5정도 이상은 사용해라라는 말이 있던데
    어떻게 생각하세요?

    • @컴맹이해커가되기까지
      @컴맹이해커가되기까지  2 месяца назад

      모델 사이즈별로, 원하는 태스크와 원하는 성능이 어느정도인지에 따라 달라질거같습니다. 복잡한 태스크를 하실게 아니면 70b모델을 q2로 해도 나쁘지 않은 성능이 나오기도 합니다. 10b 내외의 작은 모델들은 양자화를 아예 안하는게 좋은거같고요 ㅎㅎ (양자화하면 너무 못쓰겠더라구요)