EP 30. AI 업계의 수퍼스타, 안드레이 카파시(Andrej Karpathy)의 미래예측

EP 24. AI 의 본질은 무엇? 바로 Computation ..

GPT-4o보다 느리고, 정리는 못해도 o1의 파급력이 더 큰 이유 (강정수 박사)

Wild Weather: Florida evacuations underway, Milton continues to develop

KSI - Thick Of It (feat. Trippie Redd) [Official Music Video]

What Actually Happened in Asheville: A Hurricane Helene Story

EP 22. Altman형 잘 가! OpenAI 도 이젠 끝인가? (초소형 오픈소스 모델이 GPT-4 를 이기는 이유)

노정석

Просмотров 3,5 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 7 окт 2024
LLAMA-3, QWEN 에 이어서 최근에 Google 에서 공개한 GEMMA-2 까지.
최근에 발표되는 소형의 오픈소스 모델들의 성능이 OpenAI 의 GPT-4 보다 더 좋은 벤치마크 성능을 보이는 경우가 심심찮게 보입니다. 9B 파라미터 크기를 가진 나름 초소형 모델이 1800B 크기의 GPT-4 보다 성능이 좋을 수 있다? 무려 크기 차이가 200배나 나는데 말이죠.
데이터셋의 크기/품질이 개선되었고, 더 많은 Compute 을 투입하면 투입할수록 작은 모델의 성능이 끊임없이 올라가고 있습니다. 작은 모델 역시 아직 훈련이 덜 되어 있다(under-trained)라는 말이 나올 정도로 소형모델의 성능이 증가하는 이유는 무엇일까요? 이 현상을 GROKKING 이라고 표현하는데요, 오늘은 이 내용을 살펴봤습니다.
9B 짜리 모델이면 오늘 당장 16GB 메모리를 가진 맥북프로에서도 쾌적하게 돌릴 수 있는 정도의 크기입니다. 이런 추세가 지속되다 보면 어쩌면 맥북프로에서 AGI 가 돌수도 있는 날이 올수도 있습니다. 우리가 생각하는 것보다 intelligence 의 본질은 간단하고, 인간은 하찮은 존재일 수도 있을 것 같습니다 ㅠ.ㅠ
본 동영상에서 주로 살펴본 논문은 arxiv.org/abs/... 입니다.
--
(2024-07-08 update)
Chinchilla Optimum 에 대해서 잘못된 내용이 있어서 바로 잡고 본문 내용을 수정했습니다.
/ pfbid029tkpkppyogbjqg3...

Комментарии • 11

@kev2582 3 месяца назад ⁺⁵
알고리즘으로 떠서 봤는데 좋은 내용이네요. 특히 스타트업이 찾아야하는 틈새의 관점이 최신 연구트렌드와 연계해서 이 만큼 정제된건 첨 보는거 같네요. 각자의 적당한 기회의 영역을 떠나서 경제성은 까다로운 문제인거 같습니다.
@jocoding 3 месяца назад ⁺³
유익한 영상 너무 잘봤습니다!! 감사합니다🙏
@김성은-m6t 3 месяца назад ⁺¹
내용 너무 좋습니다! 감사합니다.
@신우주-h1q 3 месяца назад ⁺²
생성 AI 관련 유용한 정보 감사드려요. 😀
@King-dumpling 3 месяца назад ⁺²
GROKKING 현상은 정말 흥미롭네요...
@nicewook 3 месяца назад ⁺¹
감사히 보았습니다. 딥러닝 뿐만 아니라 사람살이의 통찰도 느꼈습니다.
@jaephildo6169 3 месяца назад ⁺²
Training을 위한 양질의 데이터 (좋은 교재)를 준비했는지 어떻게 판단할 수 있을까요? 모델에게 어떤 교제가 좋았는지 피드백 받을 수 있는 방법 같은 것이 있는건가요?
@hjkim9681 3 месяца назад ⁺¹
39:20
@JasonJoeish 3 месяца назад
5:22 모델 사이즈가 작은 경우에 오버피팅이 된다구요..?
@chester_roh 3 месяца назад
오버피팅은 모델사이즈와 전혀 상관없는 내용입니다. 제가 말을 잇는 과정중에 명확하게 표현하지 못한 것 같습니다. 죄송합니다 ㅠ.ㅠ
@user-bsksoen2133 3 месяца назад
나 알트만인데 개추눌렀다

Следующие

Автовоспроизведение

EP 30. AI 업계의 수퍼스타, 안드레이 카파시(Andrej Karpathy)의 미래예측

EP 30. AI 업계의 수퍼스타, 안드레이 카파시(Andrej Karpathy)의 미래예측

EP 24. AI 의 본질은 무엇? 바로 Computation ..

EP 24. AI 의 본질은 무엇? 바로 Computation ..

GPT-4o보다 느리고, 정리는 못해도 o1의 파급력이 더 큰 이유 (강정수 박사)

GPT-4o보다 느리고, 정리는 못해도 o1의 파급력이 더 큰 이유 (강정수 박사)

Wild Weather: Florida evacuations underway, Milton continues to develop

Wild Weather: Florida evacuations underway, Milton continues to develop

KSI - Thick Of It (feat. Trippie Redd) [Official Music Video]

KSI - Thick Of It (feat. Trippie Redd) [Official Music Video]

What Actually Happened in Asheville: A Hurricane Helene Story

What Actually Happened in Asheville: A Hurricane Helene Story

Stray Kids Perform "Bye Bye Bye / Chk Chk Boom" | AMAs 50th Anniversary Special

Stray Kids Perform "Bye Bye Bye / Chk Chk Boom" | AMAs 50th Anniversary Special

ChatGPT, Claude, and Replit all in one | AI tools developers secretly use

ChatGPT, Claude, and Replit all in one | AI tools developers secretly use

챗GPT를 더 잘 사용해보고 싶다면 꼭 시청하세요! (feat.미래계급론)

챗GPT를 더 잘 사용해보고 싶다면 꼭 시청하세요! (feat.미래계급론)

EP 25. AI 또 다시 거품으로 끝나는가? 실리콘밸리 AI거품 경계론 훑어보기

EP 25. AI 또 다시 거품으로 끝나는가? 실리콘밸리 AI거품 경계론 훑어보기

EP 17. 드디어 LLM 의 저장용량이 밝혀졌다!

EP 17. 드디어 LLM 의 저장용량이 밝혀졌다!

[ENG]팔란티어 - 시대의 패러다임을 바꾸다 Palantir - Changing the Paradigm of an Era

[ENG]팔란티어 - 시대의 패러다임을 바꾸다 Palantir - Changing the Paradigm of an Era

카이스트 김대식 교수 | (2부) “챗GPT는 더 강력한 인공지능의 티저” 처음 듣는 챗GPT 이야기

카이스트 김대식 교수 | (2부) “챗GPT는 더 강력한 인공지능의 티저” 처음 듣는 챗GPT 이야기

EP 21. "이거 풀면 너님 AGI 쌉인정!", 백만불 상금걸린 ARC 테스트란 무엇인가 (GPT-4o 는 9점임. 90점 아님)

EP 21. "이거 풀면 너님 AGI 쌉인정!", 백만불 상금걸린 ARC 테스트란 무엇인가 (GPT-4o 는 9점임. 90점 아님)

오픈AI는 돈 한 푼 못받고 왜 애플과 손을 잡았을까? (30년 개발자 박종천)

오픈AI는 돈 한 푼 못받고 왜 애플과 손을 잡았을까? (30년 개발자 박종천)

EP 29. openAI 의 새모델 O1은 GPT-5의 마중물

EP 29. openAI 의 새모델 O1은 GPT-5의 마중물

Women’s Goalkeepers + Men’s 🤯🧤

Women’s Goalkeepers + Men’s 🤯🧤

🤣 Придумали, как зарабатывать, ничего не делая! И всё получилось! | Новостничок

🤣 Придумали, как зарабатывать, ничего не делая! И всё получилось! | Новостничок

Поплатился за подлые удары!

Поплатился за подлые удары!

Flying card unique skills incredible# trend life growth star# hello creator# bask in my autumn harv

Flying card unique skills incredible# trend life growth star# hello creator# bask in my autumn harv

Боец UFC Арман Царукян про Пухляша из ПОП-ММА #huga #хетагхугаев #хаха3раза

Боец UFC Арман Царукян про Пухляша из ПОП-ММА #huga #хетагхугаев #хаха3раза

Little kitten 💓💜❤️🥰

Little kitten 💓💜❤️🥰

Сгорела баня! Начинаем строить новую, пока не ударили морозы!

Сгорела баня! Начинаем строить новую, пока не ударили морозы!

Bro's Using 3 Weapons

Bro's Using 3 Weapons