【人工智能】OpenAI o3数学测试涉嫌造假引众怒？| 资助Epoch AI | 提前获数据访问权限 | FrontierMath突破性得分 | 合同保密要求 | 盈利压力巨大 | 模型评测还可信么

Best Partners TV

Просмотров 9 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 21 янв 2025

Комментарии • 87

@gwod4782 19 часов назад ⁺³⁹
Sam干出这种事情一点也不奇怪
@zhongzhongclock 16 часов назад ⁺⁸
大飞语录：有了Sam Altman在互联网上呼风唤雨，人们看着当年的硅谷第一恶人-------扎克伯格，都觉得已经是个眉清目秀的好人了。
@howandcover3477 12 часов назад
@@zhongzhongclock 出自哪一集，我想要朝聖一下
@zhongzhongclock 12 часов назад
@howandcover3477 忘了，你问大飞，他在某一期节目这么说的，原话可能不是这样的，但就是这个意思了
@chao541 16 часов назад ⁺⁶
不但要做出题还要能经受各种对解答过程的提问并大致讲解思考过程才算真的懂了😂
@fralawable 13 часов назад ⁺⁴
AI的能力是很可怕！
但沒有道德的人掌控了AI才是最可怕！
@carltonchu1 19 часов назад ⁺¹²
Ilya 離開後，openAI良心到底在哪裡？
@feifeishuishui 18 часов назад ⁺⁵
Sam: 什么是良心？
@deter3 12 часов назад ⁺²
Openai 在Sam 的带领下，只会被卖掉，不可能成为下一个谷歌，品行在最尖端和压力最大的商业竞争中，极度重要.
@Dawir12 16 часов назад ⁺⁹
似曾相识啊。是要重复Theranos的老路吗？莫非这是硅谷的系统性通病？
@businessschool4kids981 20 часов назад ⁺⁶
有时间请说说DeepSeek-R1与Cline开源组合与Cursor加上Claude 3.5闭源组合对AI软件工程师程序员的影响，以及未来的专门针对程序员开发的LLM比如NDEA。谢谢🙏
@poonman2004 19 часов назад
@@businessschool4kids981 ai超元域已經做了可以去看看
@taijistar9052 17 часов назад
博主是看不起中国公司的！他在这个视频里连中国模型都设提一下
@zq9813 17 часов назад ⁺⁷
出几百个顶尖数学家出题就说明AI已经在数学方面远超99.999%的人类了😂
@shizheliang2679 13 часов назад ⁺⁴
根本不是。frontier的重点在于杜绝数据污染，就是公开网络上找不到类似的题目。单论难度的话，你真和o1聊一会儿本科数学就能明显感觉出它不过是个鹦鹉
@刘家林 12 часов назад
@@shizheliang2679😂抓不到重点是鹦鹉，抓到重点那就不是了。
@ostin0127 20 часов назад ⁺²⁰
OpenAI 之前在 sora 就吹牛吹過頭了,過度商業化了
@zhongzhongclock 16 часов назад ⁺⁶
伊利亚离开了OpenAI，AGI的灵魂就已经离开了
@ostin0127 3 часа назад
@@zhongzhongclock 對的，我關注的幾個優秀的研究員也都離開OpenAI了，對OpenAI的未來目前我是持悲觀態度的
@tommycotton940 18 часов назад ⁺⁵
open ai的終極性格，一定是sam altman那樣的，哈哈哈哈
@brotherbig4651 16 часов назад ⁺³
这个的确是非常fishy。O3还没正式上线～
@nanadayo709 15 часов назад ⁺³
感覺真不是很意外欸ＸＤＤ
@chungrandy780 13 часов назад
能請問博主平常語音轉文字的模型是哪一款嗎？
@doge7562 11 часов назад
whisper model吧
就算不是這個也滿主流的
@sheldonlai1650 4 часа назад
早就知道是訓練集跟測試集同一包啊
@hayama2363 15 часов назад ⁺¹
做题家还是做题家
@junfanzhu 20 часов назад ⁺²
敲碗deepseek
@少云他爹 19 часов назад
ruclips.net/video/BnoMTeKxwBQ/видео.html
@bestpartners 19 часов назад ⁺¹
别着急，马上有两期节目都跟deepseek有关
@少云他爹 19 часов назад ⁺¹
@@bestpartners 测试好像非常拉跨？
@少云他爹 19 часов назад
@@bestpartners 期待中
@tsajm6bh 18 часов назад ⁺¹
@@少云他爹實際用不是比較準確？比不上SONNET和4O，比GEMINI 1.5 強，跟GEMINI2.0 PRO各有所長。我使用起來的感覺。
@zmeta8 18 часов назад
There are three ways of making money in this business, be smarter, be the first or cheat.
@zxwxz 17 часов назад ⁺³
星門計畫正式啟動，總額度500B，今年度就有100B，Sam Altman 根本不需要一般人的錢。
@czg1997 15 часов назад
孩子，这是他自己的钱吗？不就是通过各种金融手段造假然后最终层层包装从股民手中抽血？
@rknoob9110 13 часов назад
@@zxwxz 但是openai要像投资人展示它是SOTA，才能要到更多投资。
@PeilinSong 13 часов назад
先浪费日本人的钱
@lightrao7083 15 часов назад ⁺¹
作弊骗钱😅
@䧝贵 17 часов назад
我有个疑问。对于目前的训练来说，需要大量的数据训练，才能提取特征。比如给几万张猫咪的图片，才能训练出识别猫咪的AI。即便是OpenAI拿到了所有的测试题目，也没有多少（毕竟才60个数学家，能编出多少题目？），拿这些少的可怜的题目训练，会有效果吗？即便是训练过了，出一个原题，能答对吗？
@wuyuquan 17 часов назад ⁺¹
这就是为什么25%，而且万一后台调了真题的权重。那就不好说了
@9263STYV 16 часов назад ⁺¹
在训练集里面出现的，几乎都能答对。所以测试题不能拿去当训练材料，必须分离。但是为了拿高分，你懂的。
@hiucollo2402 20 часов назад
Thank you 大飞一口氣看到尾看完再看 🏆 🏆 🏆 ☘ 🍉 🎆 😄 🌺 🀄 😃 💐 ☕ 🌸 😁 🏵 🎆🪅🎄 😀 🧧 🎉 😇 💮 🌺 😎 🎊 🏮 🍀 🎄
@yangyang1412 19 часов назад
$太香了
@warpdrive1023 19 часов назад
这种作弊对OpenAI而言没有意义。他们很可能是想看一看AI的解题过程和数学家的解题过程有什么不同。即使答案是一样的。
@warpdrive1023 18 часов назад
能够看得懂答案的人都不多。OpenAI很可能拿到标准答案，然后把AI的解答一起交给外部人员评估。
@脑控揭秘 18 часов назад ⁺¹
针对考题题库进行训练怎么会没有意义呢
@jamespat7975 17 часов назад
@@warpdrive1023 Question : 8 students(namely 1 to 8 ) are arrange to sit at the seats in two row of 5(meaning there are always two empty seats). Find possible numbers of arrangements in which students 1,2,3 sit next to each other, 7 and 8 not sit to each other and that two empty seats must be next to each other.
My mannual hand calculations answer = 15,264, anyone ChatGPT o1 Pro get the same answer.
Can deepseek get the same/correct answer ? Any can try to calculate with deepseek ?
问题：8 名学生（即 1 至 8）被安排坐在两排 5 个座位上（意味着总是有两个空座位）。找出可能的安排数，其中学生 1、2、3 彼此相邻，7 和 8 不彼此相邻，并且两个空座位必须彼此相邻。
我的手动计算答案 = 15,264，任何 ChatGPT o1 Pro 都得到相同的答案。
deepseek 能得到相同/正确的答案吗？有人可以尝试用 deepseek 计算吗？
@warpdrive1023 16 часов назад
@@脑控揭秘 OpenAI看到了题目和答案并不意味着用他们进行了训练。
@脑控揭秘 14 часов назад
@@warpdrive1023 所以他们偷窥题目的目的又是为了什么？
@kmkwong 17 часов назад
👍👍💪💪
@realbearbear 3 часа назад
無所謂啊用不到o3😂
@qingpingguo85 17 часов назад
纳闷大飞的衣服哪里来的，上面头皮屑吗？
@bestpartners 17 часов назад ⁺¹
不是，从一堆衣服里临时扒出来的，可能沾了其他衣服的毛，抱歉我大老粗一个，下次尽量提前清理一下😂其实这件衣服穿起来还是非常舒服的
@河粉-k1h 19 часов назад
Too good to be true?
@westwind2000 18 часов назад
为了钱人都能变成魔鬼，这算啥😂
@taocook6526 11 часов назад
Sam领导下的OpenAI，良心不重要，虽然没定论，爆出这种事新闻不奇怪
@wanderingpoetinvoid 15 часов назад ⁺¹
UP主是不是不知道AI的邏輯原理，目前世界上所有的AI都無法無中生有，必須靠已經存在的資料去訓練自己，所以如果有新題目的話當然是沒有辦法解出答案，必須餵過相關題型的資料，才有概率算出答案。
@bestpartners 11 часов назад ⁺¹
嗯，我可能确实是不太懂🤣
@kewang7473 20 часов назад ⁺¹
AI这么小就开始学坏了，以后怎么得了
@yesweet 20 часов назад ⁺³
这里面的恶和ai有半毛钱关系😅
@surprisedhamster5576 19 часов назад ⁺⁵
坏的是人😂
@puzhaotang479 20 часов назад
现在注水了，蠢了
@yangyang1412 19 часов назад
江平：
@tsajm6bh 18 часов назад
希望特朗普一定要將OPEN AI抄家。這三年所有收入（不扣除成本）全數充公，包括拿到股份的員工。並且將Sam Altman判終身監禁，不得假釋。
@bjq1941 20 часов назад
随随便便就给别人下一个作弊的定义，太主观了。从我个人使用gpt的效果来看，我相信openai是一个真正做人工智能的公司
@solitonz 19 часов назад ⁺⁴
我也相信三鹿是一个真正做奶粉的公司。但是这并不妨碍他们在奶粉里加一点三聚氰胺
@bestpartners 19 часов назад ⁺²
这不是加了个问号么？等OpenAI出来答复就知道了，至少有这个嫌疑吧😂
@catchfishattexas 18 часов назад ⁺²
要求题库的特殊访问权限就已经说明问题了
@tsajm6bh 18 часов назад
@@bestpartners 即使他沒作弊，他在SORA時的操作已經讓人直覺就判定他是會作弊了。
@tsajm6bh 18 часов назад
博主可能要改標題了，這個用詞有風險危機。
@zxwxz 17 часов назад ⁺¹
星門計畫正式啟動，總額度500B，今年度就有100B，Sam Altman 根本不需要一般人的錢。

Следующие

Автовоспроизведение