OpenAI o1 地表最强模型发布，10 分钟博士级 AI 实地对比测试 | 回到Axton

回到Axton

Просмотров 50 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 25 дек 2024

Комментарии • 98

@axtonliu 3 месяца назад ⁺²
掌握 AI 时代的必备技能，加入「AI 精英学院」 👉 axtonliu.ai
▶ 「AI 实战派」Prompt Engineering 提示工程超值早鸟价课程 👉 axtonliu.ai/ai
▶ 「AI 自动化」教程 ChatGPT + Make + Zapier + 高效Notion模版 👉 axtonliu.ai/autoai
@axtonliu 3 месяца назад ⁺³¹
o1 经过与 GPT-4o 的对比之后，感受是 Claude 真强
@ag7929 3 месяца назад ⁺¹³
准确的说，大部分的人都用不到o1中擅长的数学、物理、生物。
我测试了一些高中、大学的数学题（使用latex），o1直接吊打任何其它大模型，准确率吓到我了。
测试代码，和Claude差不多，但相同提示词下，结果需要越多步骤的，o1强。
@AlertImDK 3 месяца назад ⁺³
應該是說都只是語言模型,就能做到這種程度,都已經是相當嚇人的成就,從前AI發展了30年,相比之下從前似乎都白忙一場...
@dogtheglasses3518 3 месяца назад ⁺²
應該是說都只是語言模型,就能做到這種程度,都已經是相當嚇人的成就,從前AI發展了30年,相比之下從前似乎都白忙一場...
@myftptoyman0 3 месяца назад ⁺⁶
我拿奧林匹克的數學去問 5題答對4題很多我連題目是什麼也不知道. AI 的發展太快了
@楽光-u9g 3 месяца назад ⁺¹
可是克劳德,给钱都封
@吴文辉-d7x 3 месяца назад
我是一直听老师的课。有时一些难度理解不了，但是总能收到最前沿的信息。
@楽光-u9g 3 месяца назад ⁺⁶
一周三十条. . 刚刚一下用了好多🤣
@supwang 3 месяца назад ⁺¹¹
终于知道4.9大于4.11了。
@doubleu7230 3 месяца назад ⁺²
Claude 的新opus还没出来呢
@yuli.kamakura 3 месяца назад ⁺²¹
o1 其实不是给普通人用的，4o 足够了。给科学家的工具。【数学】是现在限制科技发展的一个很重要因素，这个人群的学习和筛选成本巨大，个小孩从出生到博士，研究研究才能出一点东西，这个时间要 20-30几年才可能学完。学习的过程也扼杀创造力，人的大脑也不是读了大量信息和文献就有创新。等等。现在有了 o1 的帮助，这些问题中的一部份就可以解决了。不再需要严格的筛选，漫长的学习，更多的人可以进来科学创造，这个才是整个的【科技大爆发】。
@明瞭-x2s 3 месяца назад ⁺¹
怎么学数学就扼杀创造力了？你有证据？
@明瞭-x2s 3 месяца назад
不给普通人用，为什么还要给免费用户使用的机会？
@明瞭-x2s 3 месяца назад ⁺¹
其实不是给普通人用的？你在OpenAI产品部工作？真的很好笑。
@hantuun 3 месяца назад ⁺¹
拔苗助长, 空中楼阁, 连基础都没有就想飞，连走都不会就想跑，
另外「【数学】是现在限制科技发展的一个很重要因素」这是什么暴论？
你确定限制科技发展的是【数学】？？？
别说数学了，数学物理现在是理论走的很远，实验完全跟不上，设备，材料，能源，等等才是限制科技发展的当前障碍
@vootanical5512 3 месяца назад
重要的不是数学，是理解并能运用数学形式的工具语言是投入群体性智力工作的必要能力。
@yafengfu6247 3 месяца назад ⁺²
请问一下这个视频里的网页高亮用的是什么插件
@亓渊 27 дней назад
用的什么桌面工具，能这么流畅的展示方式
@MorseJulia 2 месяца назад
在数字化时代，科技竞争已成为大国博弈的新战场，谁能率先掌握核心技术，谁就掌握了未来发展的主动权。
@a.joshatt7518 3 месяца назад ⁺⁴
能不能让perplexity生成一下你那个代码，看看怎么样
@axtonliu 3 месяца назад ⁺²
perplexity后端模型也是GPT、Claude，应该不会有太大差别
@hochun836 3 месяца назад
想請問影片中使用的瀏覽器是哪一家的 ? 左側的 TABS 上方還有 ICONS 感覺滿好用的
@axtonliu 3 месяца назад
是 Arc
@danteshume7933 3 месяца назад ⁺²
您好，请问一下，你这个划词翻译是什么插件
@axtonliu 3 месяца назад
bob
@jackunfilteredmoments 3 месяца назад
@@axtonliu 没有搜到这个呢？
@赵成龙-j4p 3 месяца назад
@@axtonliu PC有没有类似的翻译软件呢？
@赵成龙-j4p 3 месяца назад
@@jackunfilteredmoments bob加翻译就能搜出来
@axtonliu 3 месяца назад
@@jackunfilteredmoments Mac的
@austinsu5838 3 месяца назад ⁺⁴
太可惡了，我的等級才在level 4還不能使用這個模型
@CoraYe-n3h 3 месяца назад ⁺²
记得之前一个Aidan Gomes的采访里提到过，目前的ai缺乏的是逻辑推理过程，因为从网络获取的信息是结果，ai是通过对结果概率的推算进行反馈的，现在这个版本就是ai在自己整理记录自己的推理过程，实际是ai在一步一步自我学习逻辑学习推理的进程。啊，人类越来越无用了，matrix on load
@tatuyakimura 3 месяца назад ⁺⁴
編碼能力Claude應該是最強的
@trump_ivanka 3 месяца назад
no
@zyz9878 3 месяца назад
你好，请问gpt会员的高级语音全面开放了吗？我之前没有所以退订了，打算等全面开放的时候订阅回来。目前的o1还是能用api测试一下的
@axtonliu 3 месяца назад ⁺¹
有没有全面开放这我还真没法知道，您不如直接问问OpenAI客服
@HipsterScent 3 месяца назад
還沒全部開放
@zyz9878 3 месяца назад ⁺¹
@@HipsterScent 感谢😀，看来得等秋天结束彻底开放才好续订
@HipsterScent 3 месяца назад
@@zyz9878 放心，開放您會知道的，很多人都在關注，可以節省您的關注時間
@墨如雨 3 месяца назад
现在开放了
@ecswc361 Месяц назад
一做新题目就露馅😂旧题目早就喂一大堆参考答案了😂
@axtonliu Месяц назад
😄 能分享下新题目吗？我也试试？
@felimet.jmzhou 3 месяца назад
想了解 08:07時使用的翻譯軟體是什麼
@axtonliu 3 месяца назад ⁺¹
bob , Mac
@allensky-ox9wr 3 месяца назад
感觉就是加了一层agent
@zidai-ix3mh 3 месяца назад
这个现在手机端可以使用吗，我手机上面没找到
@axtonliu 3 месяца назад
可以
@tonychow8120 3 месяца назад
试过了，好像比较强
@吴文辉-d7x 3 месяца назад ⁺¹
o1要钱才能用
@仁-g7r 3 месяца назад ⁺⁴
AI 大學畢業了，他現在是博士了！！
@linchunxin2010 3 месяца назад
还有博士后
@shimakaze-ling 3 месяца назад
ai读博士都读的比人快😂😂😂
@karominda 3 месяца назад ⁺¹
翻译没什么可谈的。比如说中文：我吃饭了，饭我吃了，我吃了饭，我饭吃了。怎么翻译，都不影响阅读理解其含义。
@xiaowang-pq6xy 3 месяца назад ⁺²
为什么拿来分析股票，彩票。一点都不准
@denny8713te 3 месяца назад ⁺¹
這些東西是隨時變動跟機率的跟硬理論又不一樣 😅
@Gaki-bj1hy 16 дней назад
连现代金融学都无法分析股票
@pengchengwu447 3 месяца назад
我api试下来，Sonnet 3.5从来没比4o强过！！！
@yisiliu8598 3 месяца назад
我测试也是API调用没有claude官网效果好
@ShawshankLam 3 месяца назад
寫代碼明顯要比4o強，4o寫代碼還沒4強呢
@tensorflow5330 3 месяца назад ⁺¹
既然已经是博士生水平了，是不是意味着要涨价了
@user-gg3cs9kd7b 2 месяца назад
测试评论
@gemini_537 3 месяца назад ⁺¹⁰
说实话，感觉OpenAI有点儿黔驴技穷了，用强化学习加强推理不是一个什么不得了的新东西，其实大家都在这样做，只是OpenAI先把产品拿出来了，而且目前效果来讲其实不怎么样。费这么大劲去数strawberry有几个r...
@axtonliu 3 месяца назад ⁺³
关键是， Claude能数对😅
@selfhosted-lover 3 месяца назад ⁺²
@@axtonliu claude 3.5 sonnet数不对strawberry有几个r，o1-preview和o1-mini能数对。奇怪的是o1-mini竟然思考的时间比o1-preview长。
@gabrielchow 3 месяца назад ⁺³
Claude 更数不对现在出错更多
@axtonliu 3 месяца назад
@@selfhosted-lover 哈哈，看来是发挥不稳定，我试过Claude他答对了
@ironmanmusk8342 3 месяца назад
不是老弟，你有没有用它测过数学题啊😂
@pengchengwu447 3 месяца назад ⁺³
不认可最后的结论。文明的特征就是盖茨和你喝的可乐是一样的。
@michael-zn1rb 3 месяца назад ⁺¹
人家这就是在贩卖焦虑而已😅
@joyyang3169 3 месяца назад ⁺²
8.11和8.8哪个大都分不清
@pengchengwu447 3 месяца назад
ChatGPT o1-preview
您说：
8.11和8.8哪个大
ChatGPT
思考 4 秒
8.11 比 8.8 大。
@pengchengwu447 3 месяца назад ⁺¹
加上思考过程，疯掉了要：ChatGPT o1-preview
您说：
8.11和8.8哪个大
ChatGPT
思考 4 秒
比较数值大小
稍微看看，8.11 和 8.8 的比较。8.11 等于 8 加 0.11，8.8 等于 8 加 0.8。显然 0.8 大于 0.11，所以 8.8 大于 8.11。
8.11 比 8.8 大。
@pensularnaseeare9531 3 месяца назад ⁺¹
答对了，但是思考时莫名其妙的用了韩语
@csoulkey6170 3 месяца назад ⁺²
应用版本来说8.11大于8.8，你问小数8.11与8.8哪个大，就不会犯错了
@hesuoyu 3 месяца назад ⁺³
你可别吹牛了，还博士生水平了。一道初中数学题，都算不出来。题目如下：“三角形abc，从bc上取一点d，从d到a画一条直线.已知角dab60度，角abc40度，ab=cd，求角c度数“。GPT的答案都是胡蒙乱造，你提示一下它某处的推理错误，它会认错，然后又会给你编造一个不同的答案，就在认错跟编造错误答案中循环。
@happyculater2923 3 месяца назад
不要问几何，不要问几何，不要问几何
@fangshang-o2z 3 месяца назад ⁺⁴
感觉以后真的大部分人都要失业了，不知道该何去何从。
@john1987john 3 месяца назад
使用Ai
@反贼必须死 3 месяца назад
😂又不能逃避，当然要利用。
@MayTamWONG 3 месяца назад
每人大機率是專屬垂直領域的頭部。
@MayTamWONG 3 месяца назад
過去有個說法，叫做雜家。但首先，他的前提是，有那麼一些科目，您如果把多個科目攪在一塊兒，那叫雜家。但現在的情況是，每個人都是一個「科目」…並非將人進行物化或異化：因為在傳統的感覺中，科目是個大詞，專家是個小詞。當然可能有異化嫌疑，但這裡並不是把一個高中生說成一個博士後，因為如果每個人都是那種存在的話，博士後亦如K12的感覺就出來了。那就看您只是做題家，還是真的喜歡把玩甚麼東西了。說那只是一個感覺，是因為如果大模型若咻的一下沒了，那您也就可以回到本來的狀態了，不過如此，也挺好，就當是報夢的那種有趣的夢。您得慶倖大模型沒有在夢中把您給吞吃了，醒過來還是得提防著大模型的，不然後果就難說了。
@kp1130 3 месяца назад ⁺¹
不可能的
@trump_ivanka 3 месяца назад
o1 超过 claude3.5 sonnet
openai 重回地球第一
@梁培朝 3 месяца назад
一直是第一呀
@kp1130 3 месяца назад ⁺³
堆砌如山的知识也永远不会有思考能力
@左歸丸-v4u Месяц назад
有點爛啊
@couchtaming23 3 месяца назад ⁺²
openai正在训练的全新大模型都还没出来呢，大招还在后面

Следующие

Автовоспроизведение

谷歌的逆袭之作：实测Gemini 2.0三大核心功能，原生多模态+工具，超越当前AI助手的局限 | 回到Axton