Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
複数の回答(予測)を元に意思決定するって、MAGIシステム感あって好き。
AIの性能がべき乗則(パワー・ロー)に従うという話題、興味深いです。実は人間の学習や上達も同じ法則に従うことが示されています。20年以上前の実験ですが、東京工業大学名誉教授の木村泉先生は、この点を実証するために折り紙作家・吉澤章氏の作品「みそさざい」を15万回以上折るという驚異的な実験を行い、練習回数と作業時間の関係が冪乗則に従うことを確認しました。さらに、上達過程にはスランプや急激な成長といった揺らぎも見られることを明らかにしています。AIと人間どちらも学習には共通するものがあるのかと思いました。べき乗則は「世界の背後にある普遍的な法則」とも言われてるとの事なので、至るところにあるみたいです
ありがとうございます!地震の規模と頻度などもべき乗則に従うとみたことありましたが他にも色んなところでべき乗則が成り立つんですね😲
まとめてくださってありがとうございます!わかりやすかったです✨
ありがとうございます!そう言っていただけて作って良かったです😆
プログラミングはO1が圧倒的に有効なので、O1をコーディングで使ってます。O3で劇的に性能上がってるということで楽しみです!
ありがとうございます!コーディングはo1強そうですもんね😊o3にプログラム書かせたらどんな感じになるか楽しみですよね!
進化が早すぎる。今仕様検討してるシステムは来年度末に納品予定だけど、今自分がやってる仕事はもう虚業だな。身体鍛えとこ。。
7:28 9.11>9.9問題はトークナイザーがピリオドで区切るからという説を見たことがあります。ピリオド(小数点)以降は11と9という比較をしてしまうため9.11>9.9としてしまうんだとか
ありがとうございます!言語モデルがここまで文脈を考慮した文章生成できることを考えると前後のトークンの関係を考慮して予測できそうな気もしますが不思議ですね・・・🤔
ARC AGIが本当にAGIをAGIたらしめるのかは疑問が残るが、少なくとも一定の規則性を観測してそれを定式化し、インスタンスに適用するのはAGIには必要な要素
o3miniのコストが安いって話がすごくうれしいです安いプランでも使い放題になるといいなぁ…
o1より安そうな感じだったのでminiは回数制限あるかもですが沢山使えそうですよね😊
IT技術者だけど、今までコスト高くて採用できなかった高度な開発プロセスがAIの自動化でやれるんじゃないかなと考えてる
時間の問題だと思う。2025年のどこかでは今とは色々変わってそう
これ見て逆にClaude 3.5 Sonnetって滅茶苦茶凄いんだなって素直に思ったコーディング強くてライティングもそれなりに出来てコストも決して高いとは言えないo1 Proだとライティングにも強いらしいですが、コストが非常に重いですねClaude 4は10兆パラメーターという噂なので来年が楽しみですその前に3.5 Opus出して欲しいが
Sonnet3.5使っていても感じますがめっちゃ良いですよね!Claude4 10兆パラメータですか😲Opus3.5待ち遠しいですよね!
120%同感です。ユーザーとして実感するのは論理的推論のレベル、情報の入出力の美しさが、chatGPT と比較して、月とスッポン、中学生と大学生位の開きがあると感じます。😊
なんで2週間前にIQ130レベルの出してきてもうそれ以上の知能のAI出してきてるんだよ進化が早すぎるだろ😅
OpenAIは4oのモデルだと確実にミスる問題をo1にして、それ以外は今のところは4oを使ってますね。
ありがとうございます!難易度で使い分けされているのですね🤔
会話や文章生成に長考はあまり関係が無いと言うけど成功率低い事が出来るか聞いたりすると4oは質問者の人間が喜ぶような中身の薄い解答をする傾向だけど、o1は質問者を応援しつつも釘を刺すような冷静な解答をしてくる傾向があるのでだいぶ違うと個人的には感じてます。人間だと反射で即答してるのと一呼吸置いて言葉を発するのでは違ってくるので同じことなのなのかも知れません。会話AIも速度を重視しつつ裏でo1o3のような「裏の思考」を走らせて適宜プロンプトに加えたりすると薄っぺらさが消えて人間的な深みが出たりするのかも
機械も人の思考の仕方を真似て能力と上げてると考えると不思議な感覚wそもそも思考の仕方が人のものだったのかも微妙な時期になってきてますね()
プロンプトもそうですが思考過程与えると精度上がる不思議ですよね🤔
最近流行りのfeloAIも思考過程モデル?みたいですね
ありがとうございます!feloAI使いこなせていないのですが思考過程入れて検索している感じなんですね😲
2025年は1ヶ月ごとに更に高性能なgptが出てきそうな予感。問題は悪用されないようにロボット三原則みたいな安全性を以下に守らせるかだな。そうじゃ無いと後々火の鳥の核戦争起こしたaiみたいになっちまうぜ。
まず既得権益という格差社会を撤廃し平等で自由で平和な社会が訪れると思います😊🌿
2年目社会人ワイが必死こいてシステムの勉強してる意味とは?AIに奪われない仕事に転職考えた方がいいなムエタイ選手とか
ムエタイで仕事を取れるのか問題が発生しそうですね🤔笑
この性能をベースにしたAIエージェントが出てくると本当にPCでやってる人間の仕事はほとんど代替されそうですねいよいよAGIが現実的になってきたなぁ
ですね!計算コストも下がっていけばプログラムもだいぶ楽になりそうですね😊
o4と4o紛らわしすぎるo7をやりたいんだろうけど、ネーミングもAIに考えてもらえよ
o4出る頃には4oは3.5みたいに消されてるんじゃない?
冪乗則ってムーアの法則に似てるな
問題をステップにはわけるのはいいけど、それが論理的なステップになってるかは、微妙な気がします。私はやっぱり正しいステップに分けるためにも、素の言語モデルの性能が重要だと思うんですよね。それを組み合わせたりとかで性能上げる前にやることないのかと。あと、claude最近コーディングしてて、すぐ忘れすぎじゃない?と感じるんだけど、気のせいかなぁ。
おっしゃるように元の言語モデルがベースになっているのでそちらの性能が大事そうですよね😊Claude忘れやすいとは私は感じていなかったですが出力する文章を省略してしまう傾向が強い感じがしてます🤔
9,11と9,9の話おもしろい
不思議ですよね🤔
2年前とかを考えると、かなりの勢いで成長していますね。でも、未知の問題を解けないというのは、結局はオリジナリティがないというか創造性がないというか・・・ 人間様の優位性を感じますね。一方で、人間様も毎日同じ様な事ばかりをしていて、それを高速に処理できるのがプロだという主張もあったりしました。そういう意味で、毎日高速で事務処理している人間様は既にLLMに負けているわけです。一つ一つを時間をかけて丁寧に処理して、代わりに高額の報酬を手にするという仕事方法が、勝ち組なのでしょうかね。日本には少ないパターンです。教育もオリジナリティーを求める教育を受けたゆとり世代が勝ち残りそうですね。今の仕事の現場では、ゆとり世代は仕事ができないと嫌われてますけどね。
ついにAGIが…いやもうAGIなのかな…
o1の時点でIQ130ですよO3は明らかに人間離れしてます、AGIでふ
Iqテストなんて学習データに無数に含まれるからな…
o2は、どこにいった?
スペインの通信業者Telefonicaが英国やドイツ向けに展開するブランド「O2」と被るのを避けるためと、OpenAIのサム・アルトマンCEOは説明している。
London
酸素無くなっちゃった
o1よりsonnetの方がいいなと思ってたらやはり・・・o3よりopusに期待
それはどんな使い方してるん笑
日本語で使う場合はSonnetの方が言葉の選び方が上手かったですね (なおGemini 2.0はそれをも超えた模様)
私もo1よりClaudeの方が(慣れもあるのか)好ましい文章に感じるのですがGemini2.0はそれより凄いんですか😲
複数の回答(予測)を元に意思決定するって、MAGIシステム感あって好き。
AIの性能がべき乗則(パワー・ロー)に従うという話題、興味深いです。実は人間の学習や上達も同じ法則に従うことが示されています。20年以上前の実験ですが、東京工業大学名誉教授の木村泉先生は、この点を実証するために折り紙作家・吉澤章氏の作品「みそさざい」を15万回以上折るという驚異的な実験を行い、練習回数と作業時間の関係が冪乗則に従うことを確認しました。さらに、上達過程にはスランプや急激な成長といった揺らぎも見られることを明らかにしています。AIと人間どちらも学習には共通するものがあるのかと思いました。
べき乗則は「世界の背後にある普遍的な法則」とも言われてるとの事なので、至るところにあるみたいです
ありがとうございます!
地震の規模と頻度などもべき乗則に従うとみたことありましたが
他にも色んなところでべき乗則が成り立つんですね😲
まとめてくださってありがとうございます!
わかりやすかったです✨
ありがとうございます!
そう言っていただけて作って良かったです😆
プログラミングはO1が圧倒的に有効なので、O1をコーディングで使ってます。O3で劇的に性能上がってるということで楽しみです!
ありがとうございます!
コーディングはo1強そうですもんね😊
o3にプログラム書かせたらどんな感じになるか楽しみですよね!
進化が早すぎる。
今仕様検討してるシステムは来年度末に納品予定だけど、今自分がやってる仕事はもう虚業だな。
身体鍛えとこ。。
7:28 9.11>9.9問題はトークナイザーがピリオドで区切るからという説を見たことがあります。
ピリオド(小数点)以降は11と9という比較をしてしまうため9.11>9.9としてしまうんだとか
ありがとうございます!
言語モデルがここまで文脈を考慮した文章生成できることを考えると
前後のトークンの関係を考慮して予測できそうな気もしますが不思議ですね・・・🤔
ARC AGIが本当にAGIをAGIたらしめるのかは疑問が残るが、少なくとも一定の規則性を観測してそれを定式化し、インスタンスに適用するのはAGIには必要な要素
o3miniのコストが安いって話がすごくうれしいです
安いプランでも使い放題になるといいなぁ…
o1より安そうな感じだったので
miniは回数制限あるかもですが
沢山使えそうですよね😊
IT技術者だけど、今までコスト高くて採用できなかった高度な開発プロセスがAIの自動化でやれるんじゃないかなと考えてる
時間の問題だと思う。2025年のどこかでは今とは色々変わってそう
これ見て逆にClaude 3.5 Sonnetって滅茶苦茶凄いんだなって素直に思った
コーディング強くてライティングもそれなりに出来てコストも決して高いとは言えない
o1 Proだとライティングにも強いらしいですが、コストが非常に重いですね
Claude 4は10兆パラメーターという噂なので来年が楽しみです
その前に3.5 Opus出して欲しいが
Sonnet3.5使っていても感じますがめっちゃ良いですよね!
Claude4 10兆パラメータですか😲
Opus3.5待ち遠しいですよね!
120%同感です。ユーザーとして実感するのは論理的推論のレベル、情報の入出力の美しさが、chatGPT と比較して、月とスッポン、中学生と大学生位の開きがあると感じます。😊
なんで2週間前にIQ130レベルの出してきてもうそれ以上の知能のAI出してきてるんだよ
進化が早すぎるだろ😅
OpenAIは4oのモデルだと確実にミスる問題をo1にして、それ以外は今のところは4oを使ってますね。
ありがとうございます!
難易度で使い分けされているのですね🤔
会話や文章生成に長考はあまり関係が無いと言うけど成功率低い事が出来るか聞いたりすると
4oは質問者の人間が喜ぶような中身の薄い解答をする傾向だけど、o1は質問者を応援しつつも釘を刺すような冷静な解答をしてくる傾向があるので
だいぶ違うと個人的には感じてます。人間だと反射で即答してるのと一呼吸置いて言葉を発するのでは違ってくるので同じことなのなのかも知れません。
会話AIも速度を重視しつつ裏でo1o3のような「裏の思考」を走らせて適宜プロンプトに加えたりすると薄っぺらさが消えて人間的な深みが出たりするのかも
機械も人の思考の仕方を真似て能力と上げてると考えると不思議な感覚w
そもそも思考の仕方が人のものだったのかも微妙な時期になってきてますね()
プロンプトもそうですが
思考過程与えると精度上がる不思議ですよね🤔
最近流行りのfeloAIも思考過程モデル?みたいですね
ありがとうございます!
feloAI使いこなせていないのですが
思考過程入れて検索している感じなんですね😲
2025年は1ヶ月ごとに更に高性能なgptが出てきそうな予感。問題は悪用されないようにロボット三原則みたいな安全性を以下に守らせるかだな。そうじゃ無いと後々火の鳥の核戦争起こしたaiみたいになっちまうぜ。
まず既得権益という格差社会を撤廃し平等で自由で平和な社会が訪れると思います😊🌿
2年目社会人ワイが必死こいてシステムの勉強してる意味とは?
AIに奪われない仕事に転職考えた方がいいな
ムエタイ選手とか
ムエタイで仕事を取れるのか問題が発生しそうですね🤔笑
この性能をベースにしたAIエージェントが出てくると本当にPCでやってる人間の仕事はほとんど代替されそうですね
いよいよAGIが現実的になってきたなぁ
ですね!計算コストも下がっていけば
プログラムもだいぶ楽になりそうですね😊
o4と4o紛らわしすぎる
o7をやりたいんだろうけど、ネーミングもAIに考えてもらえよ
o4出る頃には4oは3.5みたいに消されてるんじゃない?
冪乗則ってムーアの法則に似てるな
問題をステップにはわけるのはいいけど、それが論理的なステップになってるかは、微妙な気がします。私はやっぱり正しいステップに分けるためにも、素の言語モデルの性能が重要だと思うんですよね。それを組み合わせたりとかで性能上げる前にやることないのかと。あと、claude最近コーディングしてて、すぐ忘れすぎじゃない?と感じるんだけど、気のせいかなぁ。
おっしゃるように元の言語モデルがベースになっているので
そちらの性能が大事そうですよね😊
Claude忘れやすいとは私は感じていなかったですが
出力する文章を省略してしまう傾向が強い感じがしてます🤔
9,11と9,9の話おもしろい
不思議ですよね🤔
2年前とかを考えると、かなりの勢いで成長していますね。
でも、未知の問題を解けないというのは、結局はオリジナリティがないというか創造性がないというか・・・ 人間様の優位性を感じますね。
一方で、人間様も毎日同じ様な事ばかりをしていて、それを高速に処理できるのがプロだという主張もあったりしました。
そういう意味で、毎日高速で事務処理している人間様は既にLLMに負けているわけです。一つ一つを時間をかけて丁寧に処理して、代わりに高額の報酬を手にするという仕事方法が、勝ち組なのでしょうかね。日本には少ないパターンです。
教育もオリジナリティーを求める教育を受けたゆとり世代が勝ち残りそうですね。今の仕事の現場では、ゆとり世代は仕事ができないと嫌われてますけどね。
ついにAGIが…いやもうAGIなのかな…
o1の時点でIQ130ですよ
O3は明らかに人間離れしてます、AGIでふ
Iqテストなんて学習データに無数に含まれるからな…
o2は、どこにいった?
スペインの通信業者Telefonicaが英国やドイツ向けに展開するブランド「O2」と被るのを避けるためと、OpenAIのサム・アルトマンCEOは説明している。
London
酸素無くなっちゃった
o1よりsonnetの方がいいなと思ってたらやはり・・・o3よりopusに期待
それはどんな使い方してるん笑
日本語で使う場合はSonnetの方が言葉の選び方が上手かったですね (なおGemini 2.0はそれをも超えた模様)
私もo1よりClaudeの方が(慣れもあるのか)好ましい文章に感じるのですが
Gemini2.0はそれより凄いんですか😲