Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
양자화 보통 q5정도 이상은 사용해라라는 말이 있던데어떻게 생각하세요?
모델 사이즈별로, 원하는 태스크와 원하는 성능이 어느정도인지에 따라 달라질거같습니다. 복잡한 태스크를 하실게 아니면 70b모델을 q2로 해도 나쁘지 않은 성능이 나오기도 합니다. 10b 내외의 작은 모델들은 양자화를 아예 안하는게 좋은거같고요 ㅎㅎ (양자화하면 너무 못쓰겠더라구요)
양자화 보통 q5정도 이상은 사용해라라는 말이 있던데
어떻게 생각하세요?
모델 사이즈별로, 원하는 태스크와 원하는 성능이 어느정도인지에 따라 달라질거같습니다. 복잡한 태스크를 하실게 아니면 70b모델을 q2로 해도 나쁘지 않은 성능이 나오기도 합니다. 10b 내외의 작은 모델들은 양자화를 아예 안하는게 좋은거같고요 ㅎㅎ (양자화하면 너무 못쓰겠더라구요)