OpenAI発表最終日!最新モデルOpenAI o3について解説してみた

Поделиться
HTML-код
  • Опубликовано: 22 дек 2024

Комментарии • 57

  • @shaofey
    @shaofey День назад +7

    複数の回答(予測)を元に意思決定するって、MAGIシステム感あって好き。

  • @9tailsl5d68
    @9tailsl5d68 День назад +21

    AIの性能がべき乗則(パワー・ロー)に従うという話題、興味深いです。実は人間の学習や上達も同じ法則に従うことが示されています。20年以上前の実験ですが、東京工業大学名誉教授の木村泉先生は、この点を実証するために折り紙作家・吉澤章氏の作品「みそさざい」を15万回以上折るという驚異的な実験を行い、練習回数と作業時間の関係が冪乗則に従うことを確認しました。さらに、上達過程にはスランプや急激な成長といった揺らぎも見られることを明らかにしています。AIと人間どちらも学習には共通するものがあるのかと思いました。
    べき乗則は「世界の背後にある普遍的な法則」とも言われてるとの事なので、至るところにあるみたいです

    • @aivtuber2866
      @aivtuber2866  22 часа назад

      ありがとうございます!
      地震の規模と頻度などもべき乗則に従うとみたことありましたが
      他にも色んなところでべき乗則が成り立つんですね😲

  • @REIA-t1
    @REIA-t1 2 дня назад +4

    まとめてくださってありがとうございます!
    わかりやすかったです✨

    • @aivtuber2866
      @aivtuber2866  22 часа назад +1

      ありがとうございます!
      そう言っていただけて作って良かったです😆

  • @kochikyushu
    @kochikyushu День назад +13

    プログラミングはO1が圧倒的に有効なので、O1をコーディングで使ってます。O3で劇的に性能上がってるということで楽しみです!

    • @aivtuber2866
      @aivtuber2866  22 часа назад +1

      ありがとうございます!
      コーディングはo1強そうですもんね😊
      o3にプログラム書かせたらどんな感じになるか楽しみですよね!

  • @user-hj5ky1hn9t
    @user-hj5ky1hn9t 2 дня назад +15

    進化が早すぎる。
    今仕様検討してるシステムは来年度末に納品予定だけど、今自分がやってる仕事はもう虚業だな。
    身体鍛えとこ。。

  • @marcy01
    @marcy01 День назад +6

    7:28 9.11>9.9問題はトークナイザーがピリオドで区切るからという説を見たことがあります。
    ピリオド(小数点)以降は11と9という比較をしてしまうため9.11>9.9としてしまうんだとか

    • @aivtuber2866
      @aivtuber2866  22 часа назад +1

      ありがとうございます!
      言語モデルがここまで文脈を考慮した文章生成できることを考えると
      前後のトークンの関係を考慮して予測できそうな気もしますが不思議ですね・・・🤔

  • @lav-m4a138
    @lav-m4a138 День назад +3

    ARC AGIが本当にAGIをAGIたらしめるのかは疑問が残るが、少なくとも一定の規則性を観測してそれを定式化し、インスタンスに適用するのはAGIには必要な要素

  • @うに-c9d
    @うに-c9d День назад +6

    o3miniのコストが安いって話がすごくうれしいです
    安いプランでも使い放題になるといいなぁ…

    • @aivtuber2866
      @aivtuber2866  22 часа назад

      o1より安そうな感じだったので
      miniは回数制限あるかもですが
      沢山使えそうですよね😊

  • @ない-r3r
    @ない-r3r День назад +4

    これ見て逆にClaude 3.5 Sonnetって滅茶苦茶凄いんだなって素直に思った
    コーディング強くてライティングもそれなりに出来てコストも決して高いとは言えない
    o1 Proだとライティングにも強いらしいですが、コストが非常に重いですね
    Claude 4は10兆パラメーターという噂なので来年が楽しみです
    その前に3.5 Opus出して欲しいが

    • @aivtuber2866
      @aivtuber2866  21 час назад +1

      Sonnet3.5使っていても感じますがめっちゃ良いですよね!
      Claude4 10兆パラメータですか😲
      Opus3.5待ち遠しいですよね!

    • @santa-kakashi
      @santa-kakashi 10 часов назад

      120%同感です。ユーザーとして実感するのは論理的推論のレベル、情報の入出力の美しさが、chatGPT と比較して、月とスッポン、中学生と大学生位の開きがあると感じます。😊

  • @ああ-k7o9i
    @ああ-k7o9i 2 дня назад +9

    なんで2週間前にIQ130レベルの出してきてもうそれ以上の知能のAI出してきてるんだよ
    進化が早すぎるだろ😅

  • @kao1433
    @kao1433 День назад +5

    IT技術者だけど、今までコスト高くて採用できなかった高度な開発プロセスがAIの自動化でやれるんじゃないかなと考えてる

    • @ya7855
      @ya7855 День назад +1

      時間の問題だと思う。2025年のどこかでは今とは色々変わってそう

  • @merlin8
    @merlin8 День назад +3

    OpenAIは4oのモデルだと確実にミスる問題をo1にして、それ以外は今のところは4oを使ってますね。

    • @aivtuber2866
      @aivtuber2866  22 часа назад

      ありがとうございます!
      難易度で使い分けされているのですね🤔

  • @hosinohitoV
    @hosinohitoV 11 часов назад

    会話や文章生成に長考はあまり関係が無いと言うけど成功率低い事が出来るか聞いたりすると
    4oは質問者の人間が喜ぶような中身の薄い解答をする傾向だけど、o1は質問者を応援しつつも釘を刺すような冷静な解答をしてくる傾向があるので
    だいぶ違うと個人的には感じてます。人間だと反射で即答してるのと一呼吸置いて言葉を発するのでは違ってくるので同じことなのなのかも知れません。
    会話AIも速度を重視しつつ裏でo1o3のような「裏の思考」を走らせて適宜プロンプトに加えたりすると薄っぺらさが消えて人間的な深みが出たりするのかも

  • @REIA-t1
    @REIA-t1 2 дня назад +3

    機械も人の思考の仕方を真似て能力と上げてると考えると不思議な感覚w
    そもそも思考の仕方が人のものだったのかも微妙な時期になってきてますね()

    • @aivtuber2866
      @aivtuber2866  22 часа назад +1

      プロンプトもそうですが
      思考過程与えると精度上がる不思議ですよね🤔

  • @merlin8
    @merlin8 День назад +2

    最近流行りのfeloAIも思考過程モデル?みたいですね

    • @aivtuber2866
      @aivtuber2866  22 часа назад

      ありがとうございます!
      feloAI使いこなせていないのですが
      思考過程入れて検索している感じなんですね😲

  • @nexjudas.
    @nexjudas. День назад +3

    2025年は1ヶ月ごとに更に高性能なgptが出てきそうな予感。問題は悪用されないようにロボット三原則みたいな安全性を以下に守らせるかだな。そうじゃ無いと後々火の鳥の核戦争起こしたaiみたいになっちまうぜ。

    • @fjrbcmy7842
      @fjrbcmy7842 8 часов назад +1

      まず既得権益という格差社会を撤廃し平等で自由で平和な社会が訪れると思います😊🌿

  • @フォイ-w4y
    @フォイ-w4y День назад +7

    2年目社会人ワイが必死こいてシステムの勉強してる意味とは?
    AIに奪われない仕事に転職考えた方がいいな
    ムエタイ選手とか

    • @aivtuber2866
      @aivtuber2866  22 часа назад

      ムエタイで仕事を取れるのか問題が発生しそうですね🤔笑

  • @freedomjustice-w1p
    @freedomjustice-w1p День назад +3

    この性能をベースにしたAIエージェントが出てくると本当にPCでやってる人間の仕事はほとんど代替されそうですね
    いよいよAGIが現実的になってきたなぁ

    • @aivtuber2866
      @aivtuber2866  22 часа назад

      ですね!計算コストも下がっていけば
      プログラムもだいぶ楽になりそうですね😊

  • @hitsuki_karasuyama
    @hitsuki_karasuyama 2 дня назад +9

    o4と4o紛らわしすぎる
    o7をやりたいんだろうけど、ネーミングもAIに考えてもらえよ

    • @瑠璃-k2w
      @瑠璃-k2w 2 дня назад +2

      o4出る頃には4oは3.5みたいに消されてるんじゃない?

  • @jtpgmwta
    @jtpgmwta 14 часов назад +1

    冪乗則ってムーアの法則に似てるな

  • @JS-hg2vn
    @JS-hg2vn 2 дня назад +3

    問題をステップにはわけるのはいいけど、それが論理的なステップになってるかは、微妙な気がします。私はやっぱり正しいステップに分けるためにも、素の言語モデルの性能が重要だと思うんですよね。それを組み合わせたりとかで性能上げる前にやることないのかと。あと、claude最近コーディングしてて、すぐ忘れすぎじゃない?と感じるんだけど、気のせいかなぁ。

    • @aivtuber2866
      @aivtuber2866  22 часа назад

      おっしゃるように元の言語モデルがベースになっているので
      そちらの性能が大事そうですよね😊
      Claude忘れやすいとは私は感じていなかったですが
      出力する文章を省略してしまう傾向が強い感じがしてます🤔

  • @takuyaa1
    @takuyaa1 2 дня назад +3

    9,11と9,9の話おもしろい

  • @pakkun_
    @pakkun_ 5 часов назад

    2年前とかを考えると、かなりの勢いで成長していますね。
    でも、未知の問題を解けないというのは、結局はオリジナリティがないというか創造性がないというか・・・   人間様の優位性を感じますね。
    一方で、人間様も毎日同じ様な事ばかりをしていて、それを高速に処理できるのがプロだという主張もあったりしました。
    そういう意味で、毎日高速で事務処理している人間様は既にLLMに負けているわけです。一つ一つを時間をかけて丁寧に処理して、代わりに高額の報酬を手にするという仕事方法が、勝ち組なのでしょうかね。日本には少ないパターンです。
    教育もオリジナリティーを求める教育を受けたゆとり世代が勝ち残りそうですね。今の仕事の現場では、ゆとり世代は仕事ができないと嫌われてますけどね。

  • @街猫-x8p
    @街猫-x8p 2 дня назад +4

    o2は、どこにいった?

    • @kazutoasai2487
      @kazutoasai2487 2 дня назад +9

      スペインの通信業者Telefonicaが英国やドイツ向けに展開するブランド「O2」と被るのを避けるためと、OpenAIのサム・アルトマンCEOは説明している。

    • @michael-jones
      @michael-jones 2 дня назад +3

      London

    • @Kitsune-konkon
      @Kitsune-konkon День назад +2

      酸素無くなっちゃった

  • @フォナシック
    @フォナシック 2 дня назад +4

    ついにAGIが…いやもうAGIなのかな…

    • @ああ-k7o9i
      @ああ-k7o9i 2 дня назад +3

      o1の時点でIQ130ですよ
      O3は明らかに人間離れしてます、AGIでふ

    • @RivusVirtutis
      @RivusVirtutis День назад +1

      Iqテストなんて学習データに無数に含まれるからな…

  • @りらっくすくま
    @りらっくすくま День назад +2

    o1よりsonnetの方がいいなと思ってたらやはり・・・o3よりopusに期待

    • @user-xf6on8nl6r
      @user-xf6on8nl6r День назад +3

      それはどんな使い方してるん笑

    • @kinpatsumania57
      @kinpatsumania57 День назад +2

      日本語で使う場合はSonnetの方が言葉の選び方が上手かったですね (なおGemini 2.0はそれをも超えた模様)

    • @aivtuber2866
      @aivtuber2866  22 часа назад

      私もo1よりClaudeの方が(慣れもあるのか)好ましい文章に感じるのですが
      Gemini2.0はそれより凄いんですか😲