离了大谱!”弱智吧”竟成大模型最佳中文训练数据 | ChatGPT、Claude3、Gemini Pro、KIMI谁是“弱智之王”

Поделиться
HTML-код
  • Опубликовано: 17 ноя 2024

Комментарии • 56

  • @linbintalk
    @linbintalk  7 месяцев назад

    回复示例:
    第一题:Claude3
    第二题:GPT4
    第三题:KIMI
    第四题:Claude3
    第五题:Gemini

  • @wumuyes
    @wumuyes 7 месяцев назад +1

    看了前面的答案,最后一题我居然提前猜对每一个答案对应的大模型了😁。总的来说,Claude3和KIMI回答内容较长,Claude3有条理,紧紧围绕原问题,KIMI会扩展且稍跑题,Gemini最精炼,GPT4界于它们之间。

    • @linbintalk
      @linbintalk  7 месяцев назад

      这规律总结的太好了、

  • @ninsun9537
    @ninsun9537 7 месяцев назад +2

    第一题:Claude3(讲的太透彻了)
    第二题:kimi(Claude很贴心但是说的有点不是很易懂。Gemini完全错误,GPT4“确保每个橘子切成两半,每个小朋友得到每个橘子的半个,从而公平分得四个橘子中的一份”这句话我总觉得他说错了。)
    第三题:Claude3(都很强,但最后那个“下次记得提前晒干”很有人文关怀)
    第四题:Claude3(只有他做对了)
    第五题:Gemini(只有他做对了)

    • @ninsun9537
      @ninsun9537 7 месяцев назад +1

      除去有点啰嗦和浪费output token,claude3简直是六边形战士。第五题Claude3也虽败犹荣,因为我自己也搜到了“熟蚝”这种说法,只能说要么中国真的有地方是这么称呼的,要么就是喂给他的学习材料里本来就有弱智提供的答案。kimi在不封号免费公测200K情况下能够做到这个水平也很惊喜。GPT4现在确实有点停滞了,期待4.5或5尽快出台。Gemini只能说是啥玩意儿,不过1.5 Pro本质和GPT 4第一代、Claude2.1是一代产品,ultra可能会好一点,但无奈不支持中文。主播可以试试看英语测评一下Gemini Ultra对阵Claude 3,不过大概率还是干不过。

    • @linbintalk
      @linbintalk  7 месяцев назад

      🤝 你是认真的

  • @hxlbac
    @hxlbac 7 месяцев назад +2

    我用的gpt4与你不一样?这是gpt4对兄弟年龄差的回答:根据题目,哥哥4岁时,弟弟是哥哥的一半,即2岁。弟弟与哥哥的年龄差始终保持2岁。所以当哥哥是100岁时,弟弟就是100岁减去2岁,即98岁。所以,弟弟是98岁。

    • @linbintalk
      @linbintalk  7 месяцев назад

      正常的,同一个问题同一个模型每次答案都可能不一样

    • @赵濛-y6t
      @赵濛-y6t 7 месяцев назад

      @@linbintalk sama sama

    • @王风云-h4o
      @王风云-h4o 7 месяцев назад

      我的GPT4也正确✅她这么回答的:我明白了,你说的是一个数学谜题。如果哥哥现在是100岁,而在哥哥4岁那年,弟弟是哥哥的一半,也就是说哥哥4岁时弟弟是2岁。那么现在哥哥100岁,弟弟应该是100-4+2,也就是98岁。希望这次的答案是正确的。如果还有别的问题或者其他需要帮助的地方,请告诉我。
      11.7s
      2694 Tokens

  • @王风云-h4o
    @王风云-h4o 7 месяцев назад +1

    我的GPT4这样的……完全不一样,生蚝煮熟了还是叫生蚝。这里所说的“生”在“生蚝”的命名中,实际上是用来指代这种特定海鲜物种的名称的一部分,而不是用来描述它的烹饪状态(生或熟)。就像一些其他食物或动物的名称一样,无论其状态如何,名称不会因为烹饪方式的不同而改变。所以,不管是生吃还是煮熟了,它们都被称为“生蚝”。希望这能帮助您理解这个小小的语言习惯!

    • @linbintalk
      @linbintalk  7 месяцев назад

      大模型的不稳定性

    • @WuNickel
      @WuNickel 6 месяцев назад

      我的也是,在哥哥四岁的问题上gpt4轻松识别了逻辑陷阱回答是98,在泳裤干燥问题上还给出为什么人们喜欢在游泳前穿干燥泳裤,提到了湿泳裤更容易滋生细菌和让穿着者不舒适,“如果时间紧迫你也不介意,也可以穿湿泳裤”

    • @WuNickel
      @WuNickel 6 месяцев назад

      @@linbintalk 相比起来,人可能更不稳定

  • @moonW22
    @moonW22 6 месяцев назад

    最近試了本地部屬模型主要都是7B大小,發現不管是llama3還是mistral似乎對中文對話的支援度都不太好,使用體驗不如連網版本。想請教這樣大小的模型若當知識庫基底好使嗎?

    • @linbintalk
      @linbintalk  6 месяцев назад

      要优化、直接拿来用不太行

  • @KC_79
    @KC_79 6 месяцев назад

    1 - Claude 3
    2 - Claude 3
    3 - Claude 3
    4 - Claude 3
    5 - Gemini 1.5 Pro

    • @linbintalk
      @linbintalk  6 месяцев назад

      Claude 3完胜

    • @35likaikou
      @35likaikou 6 месяцев назад

      你們是認真的嗎😅

  • @barnlin
    @barnlin 7 месяцев назад

    第一题:Claude3
    第二题:GPT4
    第三题:GPT4
    第四题:Claude3
    第五题:Gemini 1.5 pro

    • @linbintalk
      @linbintalk  7 месяцев назад

      Claude3和GPT4打平

  • @sharefly9555
    @sharefly9555 7 месяцев назад

    第一题:Claude3
    第二题:Claude3
    第三题:Claude3
    第四题:Claude3
    第五题:Gemini

  • @soluckysummer
    @soluckysummer 7 месяцев назад

    第一题:Claude3
    第二题:Claude3
    第三题:KIMI
    第四题:Claude3
    第五题:Gemini

  • @福泽谕吉-n3r
    @福泽谕吉-n3r 7 месяцев назад

    第一题:Claude3
    第二题:全错
    第三题:全错
    第四题:Claude3
    第五题:Gemini

    • @linbintalk
      @linbintalk  7 месяцев назад

      🤝 claude3胜出

  • @user-lg8ty3jm9q
    @user-lg8ty3jm9q 7 месяцев назад

    我是你的粉丝,现在有广告上找我做广告,想在我的视频中做广告,我又不知道怎么做,请问,你有这方面动物经验吗?现在有四五个广告商发邮件给我,我都不知道怎么做?也不知道怎么谈价格,如果你看到,可以回复我吗?谢谢

    • @linbintalk
      @linbintalk  7 месяцев назад

      我也没啥经验,频道以内容为主。

  • @dsfdsffsdfgsdrgd
    @dsfdsffsdfgsdrgd 7 месяцев назад

    总体上都很厉害了

  • @56777vimmm
    @56777vimmm 7 месяцев назад

    博主麦克风是啥型号呀

    • @linbintalk
      @linbintalk  7 месяцев назад

      舒尔MV7

    • @56777vimmm
      @56777vimmm 7 месяцев назад

      @@linbintalk 需要声卡吗?

  • @邵夹心
    @邵夹心 7 месяцев назад

    为啥不用文心一言测试呢😂

    • @linbintalk
      @linbintalk  7 месяцев назад

      文心一言我用的比较少,国内的模型比较喜欢用kimi

  • @Ersambx
    @Ersambx 7 месяцев назад

    然后呢?这就是训练?

  • @ccc7066
    @ccc7066 7 месяцев назад

    今天算是可以消化了😅

    • @linbintalk
      @linbintalk  7 месяцев назад +1

      哈哈,主打一个轻松

  • @王风云-h4o
    @王风云-h4o 7 месяцев назад

    她应该自己会学习的……

  • @闷油瓶
    @闷油瓶 6 месяцев назад

    不是gpt4真的有这么傻吗,特别是算年龄那个,大为震惊

  • @kaokelly5063
    @kaokelly5063 7 месяцев назад

    第一题:Claude3
    第二题:Claude3
    第三题:Claude3
    第四题:Claude3
    第五题:Claude3

  • @dddsjan9565
    @dddsjan9565 7 месяцев назад

    第一题:Claude3
    第二题:GPT4
    第三题:Claude3
    第四题:Claude3
    第五题:Gemini

  • @user-sb9ho5jz3e
    @user-sb9ho5jz3e 7 месяцев назад

    第一题:Claude3
    第二题:Claude3
    第三题:Genimi
    第四题:Claude3
    第五题:Genimi

  • @kailiu826
    @kailiu826 7 месяцев назад

    第一题:Claude3
    第二题:GPT4
    第三题:Claude3
    第四题:Claude3
    第五题:Gemini

  • @zhixinfan7756
    @zhixinfan7756 7 месяцев назад

    第一题:Claude3
    第二题:GPT4
    第三题:Gemini
    第四题:Claude3
    第五题:Gemini