で、Claude 3は本当にChatGPT超えたの?

Поделиться
HTML-код
  • Опубликовано: 27 авг 2024
  • ついに公開されたAnthropicの最新LLM「Claude 3」の実力を測ります。
    どうせまた・・・ん?
    使用するAI:
    ・Claude 3(Opus, Sonnet)
    ・ChatGPT(GPT-4)
    BGM:
    ・かずち - 青空空港
    ・茶葉のぎか - Soda_Soda
    ・さんうさぎ - え!?やば、、、、
    VOICEVOX: ずんだもん
    X(Twitter): / darmaakabeko

Комментарии • 33

  • @user-nt6qy5rn6l
    @user-nt6qy5rn6l 5 месяцев назад +10

    Claudeずっと愛用しているユーザーですが2.1の時点で「長文読み込ませてその情報を元に見出し付きでブログ本文をかかせる」って用途だとGPT4をはるかに凌ぐ性能でした
    GPT4はプロンプトかなりガチガチにしないと自然な読みやすい文章を出力してくれないのに対して、Claudeは面倒な指示をしなくても全体的に表現が柔らかくて重宝していました

    • @darmasama
      @darmasama  5 месяцев назад +2

      長文から解釈した内容を分かりやすく説明してくれる...という点ではClaudeが本当にすごいですよね。

  • @4cues
    @4cues 5 месяцев назад +7

    こうやって同じプロンプトで比較してくれるのは有難い!Claude2の時から執筆はうまい印象だったけどマルチモーダル非対応だったのもあってか影薄だったのが一気に伸ばしてきたなぁ
    ますますこれからが楽しみ

  • @uerllbeww-nc7vz
    @uerllbeww-nc7vz 5 месяцев назад +4

    25エージェントの行動についての動画を見た際、「主さんは本当にLLMが好きな方なんだ」と共感し、その時から応援してます。
    Claude3の解説もありがとうございます!LLM界隈、更に楽しくなりそうでワクワクしますね😆

    • @darmasama
      @darmasama  5 месяцев назад +2

      うわあ、ありがとうございます。とても嬉しいです。
      これからもLLMの進歩に目が離せません!

  • @user-sy9gh6oy1s
    @user-sy9gh6oy1s 5 месяцев назад +6

    ずんだもんの質問に対する3つの解答の比較
    面白かったです。
    ありがとう。

  • @nokinhagemegane7498
    @nokinhagemegane7498 5 месяцев назад +6

    今最も楽しみにしているチャンネルです。投稿大変だとは思いますが、無理のないペースでしてもらえたら幸いです!

    • @darmasama
      @darmasama  5 месяцев назад +3

      ありがとうございます!
      そう言ってもらえると嬉しいです

  • @nijihasiwatari
    @nijihasiwatari 5 месяцев назад +5

    ありがとう、本当に助かりました。私の知能じゃ優劣を判断するどころかその前段階にすらたどり着けなかったと思う

    • @darmasama
      @darmasama  5 месяцев назад +2

      ありがとうございます!
      結局は慣れだと思うので触れていきましょ!

  • @Und0e
    @Und0e 5 месяцев назад +4

    GPT4に匹敵するいうてもOpenAIが1年以上前に通った道なんよな。。OpenAI側はまだまだ高みの見物してそう

    • @darmasama
      @darmasama  5 месяцев назад +11

      「ふーん、はいGPT5」という可能性も...

  • @yoshiko_relax
    @yoshiko_relax 5 месяцев назад +5

    画像解析機能の比較もお願いします。

    • @darmasama
      @darmasama  5 месяцев назад +4

      了解です!
      今度まとめてやってみようと思ってます

  • @user-ft5sg9uw9p
    @user-ft5sg9uw9p 5 месяцев назад +1

    今回もわかりやすい解説ありがとうございました!ChatGPT以外も色々試したいのですが有料版は流石に財布が持たないのでこういう比較動画はとても助かります!

    • @darmasama
      @darmasama  5 месяцев назад +1

      ありがとうございます!軒並み月3000でやってやれませんよね...

  • @user-eh8ub7td4o
    @user-eh8ub7td4o 5 месяцев назад +10

    claudeの方が地頭はいい感じする。話しててこっちの方がおもしろい。gptはコンプライアンスガチガチすぎるのが良くないのかも。

  • @ug32282389
    @ug32282389 5 месяцев назад +4

    企業における活用においては、OpenAIのAPIってちょっとセキュリティ的に使いづらい為、MicrosoftのAzureOpenAIを利用しているというケースが多いと思います。
    OpenAIがセキュリティがダメという事では無く、日本でなじみのあるISMS系の認証規格を持っていないという理由からなんですけどね。
    AzureOpenAIのGPT-4が日本リージョンでいまだにTurbo非対応という事を考えると、AWSのBedrock上で使えるという点がClaude 3のアドバンテージになるかもしれないですね。
    多分、AzureOpenAIで使える無印のGPT-4とClaude 3では後者のほうが結構上回っている可能性もあるので・・・
    というかMicrosoft・・・小型LLMも大事だが、もうちょっと頑張ってくれ

    • @darmasama
      @darmasama  5 месяцев назад +1

      なるほど、そんな裏事情があったんですね!
      ありがとうございます。勉強になります
      Microsoftは贅沢言わないからCopilotのチューニングくらいもう少し...

  • @kumapanda100
    @kumapanda100 5 месяцев назад +1

    性能の高いAIが次々でてくるのは嬉しい反面、ユーザーとしては選択肢が難しい…。

  • @kentoo_1
    @kentoo_1 5 месяцев назад +2

    試してみましたがSonnetちゃんは結構ahoの子の印象ですね… Opusが気楽に試せるといいのですが

  • @suken1019
    @suken1019 5 месяцев назад +3

    すごい参考になります
    できたらずんだもん口調でしゃべってほしいのだ

    • @darmasama
      @darmasama  5 месяцев назад +9

      嫌なのだ
      どうもすみません...

  • @user-xm8vc4oq3d
    @user-xm8vc4oq3d 5 месяцев назад +4

    しかし面白くなってきましたねえ

    • @darmasama
      @darmasama  5 месяцев назад +2

      本当に面白くなってきました!

  • @chndsmmll
    @chndsmmll 5 месяцев назад +1

    claude3、普通に英語の論文を全文訳してくれますね。ChatGPTは一気に張り付けて「和訳して」って頼んでも要約を出すんですよね…そんでもって、claude3の翻訳は余裕でDeepL越えだと思います。今のところ、英語の論文の翻訳はclaude3一択だと思っています。
    8000単語ほどの英語の論文を翻訳してもらったのですが、DeepLに比べてかなりマシな、ちゃんとした全文訳を出してくれます。特に嬉しいのが、訳語が安定して一貫してるところですね。専門用語をぐちゃぐちゃに訳されたら意外と結構読みにくいですから…。訳語や翻訳の自然さも、ある程度文脈を理解してるような挙動に見えます。
    なんでこんなにChatGPTと挙動が違うんでしょう?一文一文参照させるとか、何か特別な処理をさせているんでしょうか?だって、人間で考えたら、8000単語の英語の論文を最初から最後まで読んで、最初から最後までを日本語で一文の漏れもなく翻訳する、みたいなことをやってるんですよね?化物というか、いませんよそんな人間。ChatGPTもできていません。最初にもしかしたらと思ってやらせてみたときに、マジでできてたのは本当にビビりました。

    • @chndsmmll
      @chndsmmll 5 месяцев назад

      ウェブ版だとそういう挙動をしたんですが、APIとかだとどうなんですかね…

    • @chndsmmll
      @chndsmmll 5 месяцев назад

      他のサービス(私が試したのはPhindってやつ)でもちゃんと全文訳を出します。これ、公式のウェブ版限定で裏で特別な処理をしてるとかじゃなくて、ちゃんとモデル自体が持ってる能力っぽい気がしてきました。バケモンです。

    • @darmasama
      @darmasama  4 месяца назад +1

      そうですね、根本的にClaudeがかなり人間が好む生成をしてくれるように調整されてる感じがします。

  • @user-nx1qq6sd8w
    @user-nx1qq6sd8w 5 месяцев назад

    わかりやすい。
    一般人目線で助かります。

    • @darmasama
      @darmasama  4 месяца назад

      ありがとうございます!

  • @aiCenter-tw3yz
    @aiCenter-tw3yz 5 месяцев назад +5

    アルトマンさんもうgpt5いやAGI出しましょう
    そして、イーロンマスクのプライドズタズタにしましょう。