AI 커뮤니티가 들썩... 지금 바로 써보세요 | GPT4 성능 갖는 미스터리 모델 gpt2-chatbot이 OpenAI에서 만든 Q* 적용 AGI 테스트 모델일까요?

안될공학 - IT 테크 신기술

Просмотров 41 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 11 сен 2024
지난 4월 27일 미스터리한 AI 모델이 lmsys chatbot arena에 등장했다가 수많은 의문을 남기고 5일만에 사라졌습니다. lmsys chatbot arena는 GPT4-turbo, Gemini, Claude 3 opus, LLaMa3 를 포함한 다양한 AI 모델을 동일 입력에 대해 테스트해보는 곳인데요. 여기서 gpt2-chatbot이라고 불리는 녀석이 등장했는데, GPT4 성능을 보여주고 논리력과 지식 깊이, 다국어 지원까지 안되는 게 없어 미스터리로 남았습니다. 이후 다시 등장하게 된 i-am-also-a-good-gpt2-chatbot 은 지금도 사용할 수 있는데요. 샘 올트만의 의미심장한 트위터 글과 하버드대 인터뷰 기반으로 GPT2에 AGI 기술를 접목했을 때 GPT4까지 성능이 나오는 것인지 모두 주목하고 있습니다.
#오픈AI #GPT2 #GPT4
Written by Error
Edited by 이진이
unrealtech2021@gmail.com

Комментарии • 45

@블라인드 4 месяца назад ⁺⁷
정체가 GPT4o였네요
@jess-ek9ym 4 месяца назад ⁺¹¹
늘 잘챙겨보고 있습니다. AI벤처 종사자로서 api로 사용했던 3.5, 4.0, 4.0터보 전체와 비교를 해볼때 개인적인 체감은 gpt4.0보다 조금 깔끔하게? 빠르게인거 같아요. 최근까지 다수 벤처들이 사용했던 모델이 gpt3.5 터보였거든요 4.0은 토큰대비 너무 비쌌고, 이거 상쇄하려고 4.0터보가 나왔지만 그래도 비싸다는 평이 많아서 단순 학습은 3.5터보가 정론이었습니다. 그런데 최근 타사에서 4.0수준에서 토큰 가격이 훨씬 저렴하게 개발된 모델들이 나오기 시작해 아마 OAI측이 이걸 의식한거 같습니다. 개인적인 예측이지만 아마 gpt2 모델이 넥스트 gpt5.0이냐 아님 gpt4.5처럼 중간에 쉬어가며 대신 토큰 가격성을 이득보는 측면이냐로 볼때 후자가 아니였을까 싶습니다. 해외에서도 경량화 모델같은데 이정도 성능이라고? 반응이 많은 것도 위와 같은 이유같구요. 벤처 입장에선 토큰 가격의 하락이 현재 메타라는게 너무 다행인 느낌이에요. 대중화의 열풍이 불고 있는 느낌입니다.
아 여기서 토큰은 일반 chatgpt 앱에선 체감이 힘들고 기업용처럼 api를 할당받아 그 api에서 쓰는 토큰 갯수만큼 비용을 내야할때의 체감이라 아마 일반적인 비유라고 보긴 힘들고 앞으로 1년동안 chatgpt앱 구독료가 현재 3만원 정도에서 2만원으로 떨어지게하는 이번 gpt2였다고 보면 되지 않을까 싶어요. 물론 토큰 가격이오피셜도 아니고 chatgpt는 api대비 매우매우매우 혜자인 현재 가격이라 낮출건 같진 않긴 합니다.
암튼 이렇게 빠르게 해외 소식들 소개해주시는거 정말 값지게 느껴지네요! AI가 대중화 되면서 반드시 100만 구독자 이상으로 보답받지 않을까 싶습니다. 응원합니다 파이팅!
@user-ix9uo4cu8s 4 месяца назад ⁺²
9:40 사실 저 논리 문제 같은 경우에는 그나마 Opus가 훨씬 구체적이고 논리에 가까운 대답을 한 것 같습니다. GPT2는 형식만 갖추었지 실질적인 추론 과정 내용은 많이 건너뛴 것 같네요.
+
제자 A, B, C 가 있고, 정답을 맞추는 제자는 C라고 둡시다. C의 눈에는 빨간 점이 찍힌 A, B의 이마가 보이고, 모두가 손을 들고 있는 상황입니다. 일단 C는 자신의 이마에 찍힌 점이 파란색이라 가정해 봅니다. 이러한 가정 하에서 C는 B의 입장을 생각해 봅니다. 제자 B의 눈에 빨간 점(A) 하나와 파란 점(C) 하나가 보일 것입니다. 이때, 제자 B 역시 일단 자신의 이마에 찍힌 점이 파란색이라 가정한 후, A의 입장에서 생각해본다고 합시다. 그렇다면, A의 눈에는 파란색 점 두개(B, C)가 보이는 동시에 B와 C가 손을 들고 있으니 자신의 이마에 있는 점이 빨간색이라는 사실을 쉽게 알 수 있습니다. 다만, A가 정답을 말하지 않는 것으로 보아 B는 자신 이마의 점 색깔이 파란색이 아니라고 결론내리고 정답을 맞출 수 있습니다. 하지만 B는 그렇게 하지 않았습니다. 여기까지가 A가 자신의 이마에 있는 점 색깔이 파란색이라 가정하였을때 일어나는 상황이었습니다. C는 자신 이마의 점 색깔이 파란색이라면 A, B가 쉽게 정답을 맞추었겠지만 그러지 못하는 것을 보고, 자신 이마의 점 색깔이 파란색이라는 가정을 기각하고 정답을 맞출 수 있습니다.
@yppsshdexgyswqu 4 месяца назад ⁺²
im-a-good-gpt2-chatbot 성능이 대단하네요. 이걸 사용하면서 넌지시 돌려서 물어보니, 자기가 만들어진 회사가 OpenAI라고 실토하더군요..ㅋㅋ 그리고 GPT-2 하고 이름이 비슷한데, 차이점이 뭐냐고 물어봤더니, 자기는 GPT-4 모델이라고 소개하고, GPT-4와 GPT-2의 차이점을 표시해주네요... 그러면서 마지막으로 GPT-4모델을 기반으로 하고 있다고 다시 알려주네요..
@jackpotnice 4 месяца назад ⁺³
항상 이런 최신정보 알려주셔서 감사합니다!!
@sanghwa 4 месяца назад ⁺⁵
im-also-a-good-gpt2-chatbot 성능이 장난 아니네요. 특징적으로 기존 모델들과는 달리 Bullet list를 쓸 때 한 뎁스가 더 들어간다는 특징이 있네요.
@Suhan1094 4 месяца назад ⁺²
GPT2에 Q*를 적용하고 테스트한다음 괜찮다 싶으면 GPT3.5에 Q*를 적용하고 GPT5라는 이름으로 발표할 것 같은 느낌이 드네요, GPT4에 Q*를 적용하려면 아직 하드웨어가 딸릴 것 같아요
@mapx2100 4 месяца назад ⁺¹
방금 테스트해봤는데, 퀴즈의 핵심은 B 와 C 가 주저한다는 것인데 그건 알아채지 못하네요.
좀 더 논리과정을 장황하게 설명하기는 하는데 정답을 맞추지는 못했습니다.
일단, 5/14 에 Google I/O 2024 발표전에 자기들이 먼저 발표한다고 한게 있으니 그때까지 기다려봐야겠네요.
@user-ft4zh7np9z 4 месяца назад
처음설명 보니까 감쇠병합(attenuated merge)이라는 방법인거 같은데 장점이 gpu없이 성능향상이 가능한 장점이 있어요 심지어 파인튜닝도 모델간의 행렬값의 차이만 구해서하려는 시도도 있습니다 이 방법을 이용해서 한국어를 못하는 모델에 한국어를 할 수 있게 하려는 시도도 있구요
@ushyuk 4 месяца назад ⁺¹⁹
생성 속도를 생각하면 꽤 가벼운 모델인 것 같은데, claude3 opus와 비슷한 성능이라.. 무시무시한 모델이네요
@user-spartium 4 месяца назад ⁺³
생성 속도 OPUS와 비슷하던데요? GPT4보다 무거울겁니다.
@ushyuk 4 месяца назад
@@user-spartium 직접 사용하거나 페이퍼를 본 게 아니라 영상에 나온 비교만 봤을 때 gpt2가 훨씬 빠르게 느껴졌는데 실제로는 아닌가 보네요?
@FirstClassStar 4 месяца назад
@@ushyuk 근데 신기하게 요즘 opus 엄청 빨라졌네요. Gpt4 끊은지 몇달 돼서 정확한 비교는 어렵지만 더 빠른듯한 느낌이에요.
@nanotree 4 месяца назад ⁺¹
파파 조합은 한명이 아예 발언권이 없으니 안되므로 빨빨파 빨빨빨만 가능한데
이때 관찰자가 파란색인 빨빨파의 경우 다른 둘이 손을 드는 근거가 뭘까요?
@user-lb6fu3qk6r 4 месяца назад
고맙습니다
@user-ze7kj8xh4e 4 месяца назад ⁺²
모델 삭제는 ChatArena에서 한 거라고 하네요 등록이 안 된 모델이라
@ljw-zp1js 4 месяца назад ⁺¹
또 혁명을 하시는겁니까 갓 알트먼
@dorams9865 4 месяца назад ⁺¹
AI 분야는 개발 속도가 정말 너무 빠른 것 같아요. 따라가기 벅찰 정도네요 @.@
@user-cv7ee8qr8t 4 месяца назад
Model B: im-also-a-good-gpt2-chatbot 는 중간에 답변을 항상 멈춰서 쓸수가없을정도네요
@박치기공룡대상혁 4 месяца назад ⁺¹
2분전은 못참지
@user-vw6rt8re8x 4 месяца назад ⁺¹
앜ㅋㅋ 반가워요! 얼른 봐야지
@unrealtech 4 месяца назад
반가워요😊
@jonifromsydney9230 4 месяца назад ⁺¹
어서 빨리 정식으로 서비스 했으면 좋겠는데 말입니다
@user-eb8oe5ym2m 4 месяца назад ⁺¹
늘 감사합니다.
@unrealtech 4 месяца назад
시청해 주셔서 감사드립니다!
@hoo5886 4 месяца назад
오늘은 후렴구가 없어서 너무 아쉬워요
@fjord38 4 месяца назад ⁺⁵
엔비디아 테슬라 둘다 사겠습니다. ❤❤❤
@user-tc9fd5mw3u 4 месяца назад
슬슬 큰거 오나? 올해는 몰라도 5년안에는 AGI 봤으면 좋겠는데..
@blue-pill 4 месяца назад
i-am-a-good-gpt2 이 모델… GPT4.5로 발표될 것 같네요.
@user-rv1gc8rs7r 4 месяца назад
개발 경쟁에 들어가면서 재밌는 개발이 많아지네요 . 그렇지만 다양한 gpt 프로그램이 나오는데 실제로 얼만큼 사람들이 gpt를 활용할까요?
gpt 프로그램은 많은데 어디에 써야 하는지 어떻게 써야하는지 모르고 있어요! gpt를 쓰기에는 아직 낯설고 어려워요
아직 개념이나 쓰임이 많이 혼용되고 100% 활용방법을 잘 모르겠어요. 이해 하기 쉽게 정리를 해주세요 큰 틀 에서 부터 작은 세부적인 요소로 까지 여러 갈래로 설명해주면 좋을 것 같아요. 좋은 영상 감사합니다!
@user-hn1zw8up5u 4 месяца назад ⁺¹
also gpt2 >>> GPT 4 느낌임
@faasdf 4 месяца назад
GPT4 정식 이름은 GPT-4 니까, GPT2-chatbot, GPT2-2, GPT2-3 이런 식으로 나오는 것이 아닐까? GPT2-2 성능은 chatbot 처럼 언어로만 학습하는 것이 아니라 다양한 모달리티 데이터로 학습하는 것이고?
@honneon 4 месяца назад
❤
@soomdong9376 4 месяца назад
입 털드만 사랑합니다
@foreverpericles 4 месяца назад ⁺¹
큐스타는 긍정적인 스카이넷이 될것.
@enslow 4 месяца назад
"GPT2" 라고그러니까 성능 낮아보이는건 뭘까? ㅋㅋㅋㅋ
@user-mg1cp2sb7x 4 месяца назад
무섭다. 그냥 무서운 미래가 오지 않을까 걱정됨.
인공지능 관련 윤리 법안이 빨리 나왔으면 한다
@user-ko8xo8lc3u 4 месяца назад ⁺¹
렉스 인터뷰 보면 샘 알트먼은 gpt5조차도 확신이 없어보임. 진짜 gpt5가 내부적으로 테스트되고 있고 성능이 놀랍다면 그것에 대해 암시를 했을텐데, 아직 해결해야 될 과제가 많고, 실제 성능에 대해서는 추측성으로만 얘기함. 그로보아 아직 현재 기술로 agi 운운할거리는 절대 안됨. 오픈AI가 agi에 근접했다는 것도 허무맹랑한 소리. gpt2라는 작은 숫자를 사용한거보니 경량화와 관련된 모델로 추측.
@덕현-b6p 4 месяца назад ⁺⁷
Gpt5는 이미 일부 기업들에게 선배포되었고 사용 후기에 대한 트윗글도 올라오는 시점에서 무슨 엉뚱한 얘길??
@user-pe5qc4sy1g 4 месяца назад
무슨 헛소리? Agi는 이미 개발 되었고 2년 안에 상용화 하는데 뭔 게 쌉소리를 이렇게 길게함? 투자가 다 이루어졌는데 ?
@user-ko8xo8lc3u 4 месяца назад
@@user-pe5qc4sy1g 니 머릿속에서 개발완료됨?
@user-pe5qc4sy1g 4 месяца назад
@@user-ko8xo8lc3u 느그 에 .미^^
@user-pe5qc4sy1g 4 месяца назад
@@user-ko8xo8lc3u 느그 부 ㅡㅡ모 에ㅡㅡ미. 요^^
@kang_clkk 4 месяца назад
뭐지 1등 입니다

Следующие

Автовоспроизведение