松田語録:TheAgentCompany〜17体のエージェントが協力してソフトウェア開発プロジェクトをこなせるかというベンチマーク

Поделиться
HTML-код
  • Опубликовано: 3 фев 2025

Комментарии • 18

  • @だもん-o6k
    @だもん-o6k 18 дней назад +4

    このような研究やツールは一番活発になって欲しいですね。とにかく水平に仕事を繋げるのがリアルでも一番面倒臭いので。そこにこそAIが入って欲しいですし、ASIからAGIに至るには一番必要な部分で。
    水平特化型のASIが出た時こそが、AGIの完成と、人間が不要になる時でしょう。24%出来てると考えると恐ろしい事です。

  • @今泉武男
    @今泉武男 18 дней назад +1

    まあ、今回の結果は一時的なものに過ぎないと思う。結局人間に個性があるようにLLMに個性があって良いので、そういうLLM間のネットワークの組み方が肝。人間の人事管理、労務管理と同じ。

  • @sn9894
    @sn9894 19 дней назад +4

    ベンチマークはまたすぐに達成されて、ゴールポストが動きそう、、、

  • @Freedomtorch22
    @Freedomtorch22 19 дней назад +3

    一人社長以下AI会社に関心があり、私もこの論文をとても興味深く眺めていました。現実的には、ここまで擬人化したヒューマノイド的な社員で会社を構成するより先に、産業ロボット的な社員の構成で実務をこなせるようになるのではないかと思いますが、やり取りが言語ベースだと、会社で何が起きているのか、悪口も含めて社長にはわかりやすいですよね(笑)。

  • @なむさん-e2h
    @なむさん-e2h 19 дней назад +5

    OpenAIが言うところのレベル5(組織化)でしょうか。それが既に25%というのは驚きです。臨界点に達したら乱立し始めて淘汰し合うかも知れません。なにしろ計算資源だけで出来るのだから。生成AIで会社を生成できそう。その後は部分的に身体性を伴うエージェントが入ってきて、全自動食品加工メーカーや自動車会社なんかも出来たりして。

  • @京都のお茶-e4h
    @京都のお茶-e4h 18 дней назад +3

    なるほど、もうそんなフェーズに来たんですね。だとすると2025年はChatGPTでこんな成果をあげました的なマウント合戦おこりそうな気がしますね。

  • @nexjudas.
    @nexjudas. 19 дней назад +4

    aiが勝手に富を生産するようになって、そのうちシムシティとかマインクラフトのシミュレーションゲームの終盤みたいに、生産の効率化と自動化が起きたとき、などんな社会になっていくのか今から楽しみですね。
    2030年には今の「常識」が遠い過去の考えになってそうですね。😊

  • @---hr6lq
    @---hr6lq 18 дней назад +4

    claude desktopのMCPを使って他のAIとも連携しつつオープンソースの改修とかにチャレンジしてますが、成功率はもうちょっと高い印象がありますね。
    あくまで体感ですが

  • @大額和良
    @大額和良 19 дней назад +3

    おっしゃる通り恐らくOpenAIの内部開発では既に24%どころではなく、50,60%くらいは既に達成しており、今年中には80,90%に出来ると言う見通しがあるのでしょう。それに基づいてのアルトマンの発言「今年中にはAIエージェントが実用になる。」があるのでしょう? 
     問題はそれをどう使うかで、欧米では企業自ら自社DXシステムを構築するのですが、日本では大企業でも下請けにやらせるので、AIエージェントを企業の実情に合わせて実現させる「AISIer」が日本では流行りそうです? 
     大型システム開発が無くなり消滅しそうなSIer業界に取っては朗報なのでしょうが(?)DXシステム同様の多重下請け構造に陥ると、又レベルの低いAIエージェントシステムが日本に溢れる可能性がありますね? 4重、5重下の底辺IT技術者に取ってAIエージェントなんて理解出来ないだろうし、設計(?)するSIer技術者も大して変わりは無い。今まではそれでも「根性と努力」「汗と涙」(?)で日本のDXシステムは作られてきたのですが(現場に居た下請け技術者の実感?)、さてAIは「根性と努力」「汗と涙」でどうにか成るのでしょうか?
     それとも今回はあくまで米国追従に徹するとすると、米国から「AIエージェント・インプリメントベンチャー」(?)が進出してくるのでしょうか? そうなるといよいよAIに関しては米国隷従に成ってしまいそうです? 最後の希望(?)は政府と松尾研かな?

  • @taninouchiaki1157
    @taninouchiaki1157 18 дней назад +2

    なるほど。AIの進歩に脅威を感じる。しかし、それでも総合的には人間には及ばないという段階かな。

  • @tm2742
    @tm2742 19 дней назад +1

    話を聞いた感じ、『プロンプトが下手すぎるのでは?』と感じました。保田さんが言ったとおり、『できているところではもっと凄いことが既にできてる』と思っています。

  • @dollbacky
    @dollbacky 19 дней назад +2

    マルチエージェントをNVIDIAの新型で反復シミュレーション自己学習して。。。もうマジで今年中には仕事できるようになりそう。
    で来年はロボットのセンシングデータを集めて自己学習して。。。まだまだ指数関数進化は止まらない。電力足りるかな。

  • @dischargedarrowgetback4322
    @dischargedarrowgetback4322 18 дней назад +1

    エージェントに人間に利益をもたらすための企業を運営させることに意味があるのかという問題があると思う。
    一般的な企業経営は数学や物理学という世界を変える力を持つ分野とは関連がないことがほとんどでしょう。
    例えば仮にLLMに僕の代わりをさせてもそれがLLMの進化につながる可能性はゼロです。
    ほとんどの企業は人間の役には立っているが、AIの役には立っていない。
    ということはLLMがこれらの業務にコンピューティングパワーを割くことは無意味ということになる。
    アルトマンはAGIを完成し、それを維持することに興味を失いつつあるように見える。
    むしろ一足飛びにASIを数学や物理学の分野で実現した方が早いと考えている可能性があります。

  • @そいやっさ-t4p
    @そいやっさ-t4p 19 дней назад +1

    Claudeがぶっちぎりなのはcomputer useのおかげだろうか。

  • @ultimatetacky
    @ultimatetacky 19 дней назад +2

    OCRの認識率を考えると、かなり成績の良いものでも97%前後で、100文字あれば3文字は手で修正する事になる。ソフトのコードになると、誤字脱字ではなくて、一見正しいコードの論理ミスを人が探さなくてはいけないので、人の作業は高度化しそう。翻訳では、優秀な翻訳者はAI翻訳がでたおかげで、更に忙しいとも耳にします。

  • @戸田恵介-k2m
    @戸田恵介-k2m 19 дней назад +1

    会社組織のストレスに耐えられなくなったAIが、「もういやだ、こんな世界◯ぼしてやる」ってならないことを祈ります。