Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
回复示例:第一题:Claude3第二题:GPT4第三题:KIMI第四题:Claude3第五题:Gemini
我还以为答案一是文心一言
看了前面的答案,最后一题我居然提前猜对每一个答案对应的大模型了😁。总的来说,Claude3和KIMI回答内容较长,Claude3有条理,紧紧围绕原问题,KIMI会扩展且稍跑题,Gemini最精炼,GPT4界于它们之间。
这规律总结的太好了、
第一题:Claude3(讲的太透彻了)第二题:kimi(Claude很贴心但是说的有点不是很易懂。Gemini完全错误,GPT4“确保每个橘子切成两半,每个小朋友得到每个橘子的半个,从而公平分得四个橘子中的一份”这句话我总觉得他说错了。)第三题:Claude3(都很强,但最后那个“下次记得提前晒干”很有人文关怀)第四题:Claude3(只有他做对了)第五题:Gemini(只有他做对了)
除去有点啰嗦和浪费output token,claude3简直是六边形战士。第五题Claude3也虽败犹荣,因为我自己也搜到了“熟蚝”这种说法,只能说要么中国真的有地方是这么称呼的,要么就是喂给他的学习材料里本来就有弱智提供的答案。kimi在不封号免费公测200K情况下能够做到这个水平也很惊喜。GPT4现在确实有点停滞了,期待4.5或5尽快出台。Gemini只能说是啥玩意儿,不过1.5 Pro本质和GPT 4第一代、Claude2.1是一代产品,ultra可能会好一点,但无奈不支持中文。主播可以试试看英语测评一下Gemini Ultra对阵Claude 3,不过大概率还是干不过。
🤝 你是认真的
我用的gpt4与你不一样?这是gpt4对兄弟年龄差的回答:根据题目,哥哥4岁时,弟弟是哥哥的一半,即2岁。弟弟与哥哥的年龄差始终保持2岁。所以当哥哥是100岁时,弟弟就是100岁减去2岁,即98岁。所以,弟弟是98岁。
正常的,同一个问题同一个模型每次答案都可能不一样
@@linbintalk sama sama
我的GPT4也正确✅她这么回答的:我明白了,你说的是一个数学谜题。如果哥哥现在是100岁,而在哥哥4岁那年,弟弟是哥哥的一半,也就是说哥哥4岁时弟弟是2岁。那么现在哥哥100岁,弟弟应该是100-4+2,也就是98岁。希望这次的答案是正确的。如果还有别的问题或者其他需要帮助的地方,请告诉我。11.7s2694 Tokens
我的GPT4这样的……完全不一样,生蚝煮熟了还是叫生蚝。这里所说的“生”在“生蚝”的命名中,实际上是用来指代这种特定海鲜物种的名称的一部分,而不是用来描述它的烹饪状态(生或熟)。就像一些其他食物或动物的名称一样,无论其状态如何,名称不会因为烹饪方式的不同而改变。所以,不管是生吃还是煮熟了,它们都被称为“生蚝”。希望这能帮助您理解这个小小的语言习惯!
大模型的不稳定性
我的也是,在哥哥四岁的问题上gpt4轻松识别了逻辑陷阱回答是98,在泳裤干燥问题上还给出为什么人们喜欢在游泳前穿干燥泳裤,提到了湿泳裤更容易滋生细菌和让穿着者不舒适,“如果时间紧迫你也不介意,也可以穿湿泳裤”
@@linbintalk 相比起来,人可能更不稳定
最近試了本地部屬模型主要都是7B大小,發現不管是llama3還是mistral似乎對中文對話的支援度都不太好,使用體驗不如連網版本。想請教這樣大小的模型若當知識庫基底好使嗎?
要优化、直接拿来用不太行
1 - Claude 32 - Claude 33 - Claude 34 - Claude 35 - Gemini 1.5 Pro
Claude 3完胜
你們是認真的嗎😅
第一题:Claude3第二题:GPT4第三题:GPT4第四题:Claude3第五题:Gemini 1.5 pro
Claude3和GPT4打平
第一题:Claude3第二题:Claude3第三题:Claude3第四题:Claude3第五题:Gemini
Claude3完胜
第一题:Claude3第二题:Claude3第三题:KIMI第四题:Claude3第五题:Gemini
Claude3胜出
第一题:Claude3第二题:全错第三题:全错第四题:Claude3第五题:Gemini
🤝 claude3胜出
我是你的粉丝,现在有广告上找我做广告,想在我的视频中做广告,我又不知道怎么做,请问,你有这方面动物经验吗?现在有四五个广告商发邮件给我,我都不知道怎么做?也不知道怎么谈价格,如果你看到,可以回复我吗?谢谢
我也没啥经验,频道以内容为主。
总体上都很厉害了
AI进化超快
博主麦克风是啥型号呀
舒尔MV7
@@linbintalk 需要声卡吗?
为啥不用文心一言测试呢😂
文心一言我用的比较少,国内的模型比较喜欢用kimi
然后呢?这就是训练?
单纯的测试
今天算是可以消化了😅
哈哈,主打一个轻松
她应该自己会学习的……
答案会优化
不是gpt4真的有这么傻吗,特别是算年龄那个,大为震惊
是的
第一题:Claude3第二题:Claude3第三题:Claude3第四题:Claude3第五题:Claude3
第一题:Claude3第二题:GPT4第三题:Claude3第四题:Claude3第五题:Gemini
第一题:Claude3第二题:Claude3第三题:Genimi第四题:Claude3第五题:Genimi
Claude3胜
第一题:Claude3第二题:GPT4第三题:Gemini第四题:Claude3第五题:Gemini
回复示例:
第一题:Claude3
第二题:GPT4
第三题:KIMI
第四题:Claude3
第五题:Gemini
我还以为答案一是文心一言
看了前面的答案,最后一题我居然提前猜对每一个答案对应的大模型了😁。总的来说,Claude3和KIMI回答内容较长,Claude3有条理,紧紧围绕原问题,KIMI会扩展且稍跑题,Gemini最精炼,GPT4界于它们之间。
这规律总结的太好了、
第一题:Claude3(讲的太透彻了)
第二题:kimi(Claude很贴心但是说的有点不是很易懂。Gemini完全错误,GPT4“确保每个橘子切成两半,每个小朋友得到每个橘子的半个,从而公平分得四个橘子中的一份”这句话我总觉得他说错了。)
第三题:Claude3(都很强,但最后那个“下次记得提前晒干”很有人文关怀)
第四题:Claude3(只有他做对了)
第五题:Gemini(只有他做对了)
除去有点啰嗦和浪费output token,claude3简直是六边形战士。第五题Claude3也虽败犹荣,因为我自己也搜到了“熟蚝”这种说法,只能说要么中国真的有地方是这么称呼的,要么就是喂给他的学习材料里本来就有弱智提供的答案。kimi在不封号免费公测200K情况下能够做到这个水平也很惊喜。GPT4现在确实有点停滞了,期待4.5或5尽快出台。Gemini只能说是啥玩意儿,不过1.5 Pro本质和GPT 4第一代、Claude2.1是一代产品,ultra可能会好一点,但无奈不支持中文。主播可以试试看英语测评一下Gemini Ultra对阵Claude 3,不过大概率还是干不过。
🤝 你是认真的
我用的gpt4与你不一样?这是gpt4对兄弟年龄差的回答:根据题目,哥哥4岁时,弟弟是哥哥的一半,即2岁。弟弟与哥哥的年龄差始终保持2岁。所以当哥哥是100岁时,弟弟就是100岁减去2岁,即98岁。所以,弟弟是98岁。
正常的,同一个问题同一个模型每次答案都可能不一样
@@linbintalk sama sama
我的GPT4也正确✅她这么回答的:我明白了,你说的是一个数学谜题。如果哥哥现在是100岁,而在哥哥4岁那年,弟弟是哥哥的一半,也就是说哥哥4岁时弟弟是2岁。那么现在哥哥100岁,弟弟应该是100-4+2,也就是98岁。希望这次的答案是正确的。如果还有别的问题或者其他需要帮助的地方,请告诉我。
11.7s
2694 Tokens
我的GPT4这样的……完全不一样,生蚝煮熟了还是叫生蚝。这里所说的“生”在“生蚝”的命名中,实际上是用来指代这种特定海鲜物种的名称的一部分,而不是用来描述它的烹饪状态(生或熟)。就像一些其他食物或动物的名称一样,无论其状态如何,名称不会因为烹饪方式的不同而改变。所以,不管是生吃还是煮熟了,它们都被称为“生蚝”。希望这能帮助您理解这个小小的语言习惯!
大模型的不稳定性
我的也是,在哥哥四岁的问题上gpt4轻松识别了逻辑陷阱回答是98,在泳裤干燥问题上还给出为什么人们喜欢在游泳前穿干燥泳裤,提到了湿泳裤更容易滋生细菌和让穿着者不舒适,“如果时间紧迫你也不介意,也可以穿湿泳裤”
@@linbintalk 相比起来,人可能更不稳定
最近試了本地部屬模型主要都是7B大小,發現不管是llama3還是mistral似乎對中文對話的支援度都不太好,使用體驗不如連網版本。想請教這樣大小的模型若當知識庫基底好使嗎?
要优化、直接拿来用不太行
1 - Claude 3
2 - Claude 3
3 - Claude 3
4 - Claude 3
5 - Gemini 1.5 Pro
Claude 3完胜
你們是認真的嗎😅
第一题:Claude3
第二题:GPT4
第三题:GPT4
第四题:Claude3
第五题:Gemini 1.5 pro
Claude3和GPT4打平
第一题:Claude3
第二题:Claude3
第三题:Claude3
第四题:Claude3
第五题:Gemini
Claude3完胜
第一题:Claude3
第二题:Claude3
第三题:KIMI
第四题:Claude3
第五题:Gemini
Claude3胜出
第一题:Claude3
第二题:全错
第三题:全错
第四题:Claude3
第五题:Gemini
🤝 claude3胜出
我是你的粉丝,现在有广告上找我做广告,想在我的视频中做广告,我又不知道怎么做,请问,你有这方面动物经验吗?现在有四五个广告商发邮件给我,我都不知道怎么做?也不知道怎么谈价格,如果你看到,可以回复我吗?谢谢
我也没啥经验,频道以内容为主。
总体上都很厉害了
AI进化超快
博主麦克风是啥型号呀
舒尔MV7
@@linbintalk 需要声卡吗?
为啥不用文心一言测试呢😂
文心一言我用的比较少,国内的模型比较喜欢用kimi
然后呢?这就是训练?
单纯的测试
今天算是可以消化了😅
哈哈,主打一个轻松
她应该自己会学习的……
答案会优化
不是gpt4真的有这么傻吗,特别是算年龄那个,大为震惊
是的
第一题:Claude3
第二题:Claude3
第三题:Claude3
第四题:Claude3
第五题:Claude3
Claude3完胜
第一题:Claude3
第二题:GPT4
第三题:Claude3
第四题:Claude3
第五题:Gemini
Claude3胜出
第一题:Claude3
第二题:Claude3
第三题:Genimi
第四题:Claude3
第五题:Genimi
Claude3胜
第一题:Claude3
第二题:GPT4
第三题:Claude3
第四题:Claude3
第五题:Gemini
Claude3胜出
第一题:Claude3
第二题:GPT4
第三题:Gemini
第四题:Claude3
第五题:Gemini
Claude3胜出