离了大谱！”弱智吧”竟成大模型最佳中文训练数据 | ChatGPT、Claude3、Gemini Pro、KIMI谁是“弱智之王”

AI学长小林

Просмотров 4 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 17 ноя 2024

Комментарии • 56

@linbintalk 7 месяцев назад
回复示例：
第一题：Claude3
第二题：GPT4
第三题：KIMI
第四题：Claude3
第五题：Gemini
@SamuelVictor-u2d 7 месяцев назад
我还以为答案一是文心一言
@wumuyes 7 месяцев назад ⁺¹
看了前面的答案，最后一题我居然提前猜对每一个答案对应的大模型了😁。总的来说，Claude3和KIMI回答内容较长，Claude3有条理，紧紧围绕原问题，KIMI会扩展且稍跑题，Gemini最精炼，GPT4界于它们之间。
@linbintalk 7 месяцев назад
这规律总结的太好了、
@ninsun9537 7 месяцев назад ⁺²
第一题：Claude3（讲的太透彻了）
第二题：kimi（Claude很贴心但是说的有点不是很易懂。Gemini完全错误，GPT4“确保每个橘子切成两半，每个小朋友得到每个橘子的半个，从而公平分得四个橘子中的一份”这句话我总觉得他说错了。）
第三题：Claude3（都很强，但最后那个“下次记得提前晒干”很有人文关怀）
第四题：Claude3（只有他做对了）
第五题：Gemini（只有他做对了）
@ninsun9537 7 месяцев назад ⁺¹
除去有点啰嗦和浪费output token，claude3简直是六边形战士。第五题Claude3也虽败犹荣，因为我自己也搜到了“熟蚝”这种说法，只能说要么中国真的有地方是这么称呼的，要么就是喂给他的学习材料里本来就有弱智提供的答案。kimi在不封号免费公测200K情况下能够做到这个水平也很惊喜。GPT4现在确实有点停滞了，期待4.5或5尽快出台。Gemini只能说是啥玩意儿，不过1.5 Pro本质和GPT 4第一代、Claude2.1是一代产品，ultra可能会好一点，但无奈不支持中文。主播可以试试看英语测评一下Gemini Ultra对阵Claude 3，不过大概率还是干不过。
@linbintalk 7 месяцев назад
🤝 你是认真的
@hxlbac 7 месяцев назад ⁺²
我用的gpt4与你不一样？这是gpt4对兄弟年龄差的回答：根据题目，哥哥4岁时，弟弟是哥哥的一半，即2岁。弟弟与哥哥的年龄差始终保持2岁。所以当哥哥是100岁时，弟弟就是100岁减去2岁，即98岁。所以，弟弟是98岁。
@linbintalk 7 месяцев назад
正常的，同一个问题同一个模型每次答案都可能不一样
@赵濛-y6t 7 месяцев назад
@@linbintalk sama sama
@王风云-h4o 7 месяцев назад
我的GPT4也正确✅她这么回答的：我明白了，你说的是一个数学谜题。如果哥哥现在是100岁，而在哥哥4岁那年，弟弟是哥哥的一半，也就是说哥哥4岁时弟弟是2岁。那么现在哥哥100岁，弟弟应该是100-4+2，也就是98岁。希望这次的答案是正确的。如果还有别的问题或者其他需要帮助的地方，请告诉我。
11.7s
2694 Tokens
@王风云-h4o 7 месяцев назад ⁺¹
我的GPT4这样的……完全不一样，生蚝煮熟了还是叫生蚝。这里所说的“生”在“生蚝”的命名中，实际上是用来指代这种特定海鲜物种的名称的一部分，而不是用来描述它的烹饪状态（生或熟）。就像一些其他食物或动物的名称一样，无论其状态如何，名称不会因为烹饪方式的不同而改变。所以，不管是生吃还是煮熟了，它们都被称为“生蚝”。希望这能帮助您理解这个小小的语言习惯！
@linbintalk 7 месяцев назад
大模型的不稳定性
@WuNickel 6 месяцев назад
我的也是，在哥哥四岁的问题上gpt4轻松识别了逻辑陷阱回答是98，在泳裤干燥问题上还给出为什么人们喜欢在游泳前穿干燥泳裤，提到了湿泳裤更容易滋生细菌和让穿着者不舒适，“如果时间紧迫你也不介意，也可以穿湿泳裤”
@WuNickel 6 месяцев назад
@@linbintalk 相比起来，人可能更不稳定
@moonW22 6 месяцев назад
最近試了本地部屬模型主要都是7B大小，發現不管是llama3還是mistral似乎對中文對話的支援度都不太好，使用體驗不如連網版本。想請教這樣大小的模型若當知識庫基底好使嗎?
@linbintalk 6 месяцев назад
要优化、直接拿来用不太行
@KC_79 6 месяцев назад
1 - Claude 3
2 - Claude 3
3 - Claude 3
4 - Claude 3
5 - Gemini 1.5 Pro
@linbintalk 6 месяцев назад
Claude 3完胜
@35likaikou 6 месяцев назад
你們是認真的嗎😅
@barnlin 7 месяцев назад
第一题：Claude3
第二题：GPT4
第三题：GPT4
第四题：Claude3
第五题：Gemini 1.5 pro
@linbintalk 7 месяцев назад
Claude3和GPT4打平
@sharefly9555 7 месяцев назад
第一题：Claude3
第二题：Claude3
第三题：Claude3
第四题：Claude3
第五题：Gemini
@linbintalk 7 месяцев назад ⁺¹
Claude3完胜
@soluckysummer 7 месяцев назад
第一题：Claude3
第二题：Claude3
第三题：KIMI
第四题：Claude3
第五题：Gemini
@linbintalk 7 месяцев назад
Claude3胜出
@福泽谕吉-n3r 7 месяцев назад
第一题：Claude3
第二题：全错
第三题：全错
第四题：Claude3
第五题：Gemini
@linbintalk 7 месяцев назад
🤝 claude3胜出
@user-lg8ty3jm9q 7 месяцев назад
我是你的粉丝，现在有广告上找我做广告，想在我的视频中做广告，我又不知道怎么做，请问，你有这方面动物经验吗？现在有四五个广告商发邮件给我，我都不知道怎么做？也不知道怎么谈价格，如果你看到，可以回复我吗？谢谢
@linbintalk 7 месяцев назад
我也没啥经验，频道以内容为主。
@dsfdsffsdfgsdrgd 7 месяцев назад
总体上都很厉害了
@linbintalk 7 месяцев назад
AI进化超快
@56777vimmm 7 месяцев назад
博主麦克风是啥型号呀
@linbintalk 7 месяцев назад
舒尔MV7
@56777vimmm 7 месяцев назад
@@linbintalk 需要声卡吗？
@邵夹心 7 месяцев назад
为啥不用文心一言测试呢😂
@linbintalk 7 месяцев назад
文心一言我用的比较少，国内的模型比较喜欢用kimi
@Ersambx 7 месяцев назад
然后呢？这就是训练？
@linbintalk 7 месяцев назад
单纯的测试
@ccc7066 7 месяцев назад
今天算是可以消化了😅
@linbintalk 7 месяцев назад ⁺¹
哈哈，主打一个轻松
@王风云-h4o 7 месяцев назад
她应该自己会学习的……
@linbintalk 7 месяцев назад
答案会优化
@闷油瓶 6 месяцев назад
不是gpt4真的有这么傻吗，特别是算年龄那个，大为震惊
@linbintalk 6 месяцев назад
是的
@kaokelly5063 7 месяцев назад
第一题：Claude3
第二题：Claude3
第三题：Claude3
第四题：Claude3
第五题：Claude3
@linbintalk 7 месяцев назад
Claude3完胜
@dddsjan9565 7 месяцев назад
第一题：Claude3
第二题：GPT4
第三题：Claude3
第四题：Claude3
第五题：Gemini
@linbintalk 7 месяцев назад
Claude3胜出
@user-sb9ho5jz3e 7 месяцев назад
第一题：Claude3
第二题：Claude3
第三题：Genimi
第四题：Claude3
第五题：Genimi
@linbintalk 7 месяцев назад ⁺¹
Claude3胜
@kailiu826 7 месяцев назад
第一题：Claude3
第二题：GPT4
第三题：Claude3
第四题：Claude3
第五题：Gemini
@linbintalk 7 месяцев назад
Claude3胜出
@zhixinfan7756 7 месяцев назад
第一题：Claude3
第二题：GPT4
第三题：Gemini
第四题：Claude3
第五题：Gemini
@linbintalk 7 месяцев назад
Claude3胜出

Следующие

Автовоспроизведение