许成钢谈经论政:DeepSeek是人工智能领域里的重大突破吗?
HTML-код
- Опубликовано: 10 фев 2025
- 1月底,中国科技公司“深度求索” (DeepSeek)发布了生成式人工智能系统R1,声称以低于美国最好的模型百倍的成本获得与其相当的结果,震动了美国朝野和科技界。不过1月29日,《金融时报》报道,OpenAI称他们已经发现证据表明,“深度求索”大量能力和知识是靠使用OpenAI的ChatGPT训练而来。其他关于DeepSeek成本的证据也逐渐浮出水面。DeepSeek 是抄袭还是创新?是昙花一现还是引发人工智能领域的革命?《许成钢谈经论政》为您分析解读。
#许成钢 #人工智能 #DeepSeek
==========================================
*美国之音新闻应用程序*
美国之音新闻应用程序全新改版,让您快速掌握新闻与资讯!欢迎通过苹果、谷歌应用程序商店下载免费的美国之音新闻应用程序!
苹果 bit.ly/VOAnews...
安卓 bit.ly/VOAnews...
安卓用户还可以下载APK bit.ly/VOAnews... ,手动安装新闻应用程序。欢迎试试!
详细内容请参照 www.voachinese...
==========================================
美国之音新推出影音应用程序 VOA+ 欢迎下载收看美国之音电视及专题节目!
apps.apple.com...
play.google.co...
==========================================
通过GoogleNews 阅读美国之音新闻👉 bit.ly/VOAgoogl...
==========================================
*翻墙上网办法*
翻墙软件
1) nthLink bit.ly/download...
2) 赛风3 bit.ly/downloa...
您也可以发送电子邮件到 wangluo@saifeng3.com 索取赛风3软件(可不填电邮主题和内容)。另外,使用安卓手机的网友还可以通过 bit.ly/PsiphonA... 手动安装赛凤3,欢迎试试!
详细上网办法请参照:bit.ly/shang-wang
美国之音每日电邮新闻,除了多篇新闻报道,还包括最新翻墙信息。请电邮至chinese@voanews.com订阅,并注明“订阅新闻”。
==========================================
*通过Podcasts收听美国之音*
www.voachinese...
==========================================
收听收看美国之音中文电视、广播节目
最新中文广播节目表和频率表(2023年10月29日-2024年3月30日):www.voachinese...
==========================================
美国之音中文网: www.voachinese...
美国之音RUclips频道: / voachinese
订阅美国之音RUclips频道:bit.ly/dingyue-...
美国之音脸书: / voachinese
美国之音推特: / voachinese
美国之音Instagram: / voachinese
美国之音GoogleNews bit.ly/VOAgoogl...
美国之音24/7中文广播 bit.ly/VOARadio...
《时事大家谈》RUclips播放列表:bit.ly/VOAIO-yo...
许成钢测试DeepSeek答复算术题目 1989+64=?全文记录:www.voachinese.com/a/7969507.html
根本不是这种结果,自己试试就知道了,voa一如既往的抹黑中国一切。
@@LAULEONARD-xp1ru 你自己看下链接就知道
卧槽!马斯克说了,要关掉VOA😢你们这是到头了吗?😂
这帮人绩效太差了
天天找一帮不三不四的人,声称中国要崩溃了,没想到自己先嘎了。
美国之音的雇员们,赶紧找新工作吧,马斯克决定关闭 VOA,你们的好日子到头啦!
小狗狗要赶快找新主人咯
马斯克是真男人,事实就是事实,阴阳怪气意识形态,美国不会更强大,不利于全人类的进步。 美国之音的主持人,晚上睡觉睡的好吗? 照镜子时会想些啥?
🐶粮要断供了
他们很难找到新工作了,能混一天算一天吧
@@LiLIu-p3n 把旧的主人忘掉,效忠新主人就应该 ok 的。做养不熟的小狗狗
deepseek r1真的很好用,本地部署,同样任务和openai 4omini相比,效果不相上下,甚至有时更好,对于广大科技从业人员真的是一大福音。
电台都要没了咋这么不知道愁呢😂
这嗑唠的,没毛病😄
优秀的提问, 大师的解答。
从专业角度看,批评者的观点存在过于简单化的问题,原因如下:
1. Scaling Laws 的本质
“Scaling laws”通常是指在大量实验中观察到的经验规律,例如在 transformer 模型中,随着模型规模和计算量增加,模型性能改善往往呈现出相对缓慢(如幂律或线性)的提升,而训练所需的计算资源(或成本)往往增长更快。这一规律基于大量标准化实验条件下的观察结果,并非绝对不变的“自然法则”,而是描述了在特定架构、数据和训练方法下的一种趋势。
2. 算法和工程优化的作用
近年来,研究者和工程师们在模型优化、算法改进和硬件效率等方面做出了大量工作,例如:
• 模型蒸馏与剪枝:通过蒸馏技术可以将大模型的知识迁移到更小、更高效的模型上,从而大幅降低计算成本。
• 低精度运算和量化:使用低精度运算可以在不显著损失性能的前提下减少计算量和能耗。
• 架构改进:设计更高效的 transformer 变体(如稀疏注意力、混合专家模型等)也能在相对较低的成本下获得较好的性能。
因此,如果 Deepseek 采用了这些技术,降低成本是可能的,而这并不“违反” scaling laws,而是利用了在传统大规模训练之外的优化空间。
3. 经验规律与实际应用的差异
Scaling laws 是在一定假设下的统计结论,它们为研究者提供了理解模型扩展趋势的一个参考基准,但并不意味着所有模型都必须严格遵循“成本呈指数增长、性能仅线性提升”的模式。在实际工程中,通过算法改进、硬件进步和数据高效利用,可以改变单位计算成本与性能提升之间的关系。
总的来说,认为 Deepseek 的低成本模式违反了自然科学规律,这种观点忽视了技术进步和工程优化带来的成本降低可能性。从专业角度看,这种质疑过于简单,实际情况往往更为复杂。
问题是deepseek是目前已知的其中一种架构呀? 你的要求要媲美chatgpt在不蒸馏的情况下自主研发就是这么困难。
……用deepseek批评它的批评者,有趣
许教授对AI有研究与理解明显不是AI行业专业人士
由于芯片的限制,这种东西跟世界主流的差距会因为成文问题与越走越远。并且居于事实基础上真实的数据是最有效率和节省成本的,被审查的AI会因为审查的结果脱离现实会出现大量错误
@@kzhang7382 不懂ai你点评个鸡毛啊,这些货色跟国内政府有什么区别,只是恶心的群体不一样罢了
老头子说的问1989+64等于多少,我问了,没有他说的那种结果呀!
我也问了同样的问题,得到的答案是2053,不是许成钢说的那样,不信的人可以自己试试。
@ 老头子坏得很!
他是个说谎的老头子。 😂😂
因为牠自己也不敢放出运行视频,就是直接登录对话框,输入这个算数式,牠不敢。谁也不知道牠在怕啥?
难道中共近三十年没别的黑料了吗?怎么到现在了还是只拿64说事呢
不是重大突破但是很好的升级🤣
缩放定律(Scaling Laws)确实指出,随着模型参数规模、数据量和计算资源的增加,模型的性能会显著提升,但这种提升并非严格的指数级关系,而是遵循一定的幂律规律。具体来说,性能的提升通常与资源投入的对数成正比,而不是简单的指数增长。DeepSeek-V3在开发过程中充分考虑了这些规律,以优化模型性能
这不是严格的数学或物理规律,而是在工程实战中观察到的empirical phenomenon,
🛑🛑🛑🛑🛑🛑🛑🛑🛑🛑
民主国家的人抱怨自己吃的饭里面有一粒💩
独裁国家的人称赞自己吃的💩里面有一粒米
@@AAA1A111A意識形態思維偏見
这是规模定律。不是缩放定律
@@AAA1A111A 真能叫🤣
经济学界对于中美AI竞争的观点,主要基于Yutchman和Yang的一系列研究,基本上不会听到不一样的观点。他们不见得对AI技术有多了解,主要是关心两个“问题”:1)为什么专制的中国能在AI技术和应用上(部分领域)领先美国;2)中国这种领先会带来什么结果。
而他们的结论其实也基本就是两句话:1)中国AI能局部领先,是因为专制制度坏;2)中国AI的局部领先,会让专制制度更坏。
具体而言:1)因为专制制度需要先进技术监控压迫人民,又对数据、隐私没有保护,所以能够调动大量资源发展AI;2)AI的发展,会让专制制度监控压迫人民更容易。
不看视频,基本上能猜个八九不离十。
嘉宾有点一本正经的胡说八道了啊,r1的论文有认真读吗,可以站在政治立场上抨击ds,但是直接否认别人的贡献显得自己很低级
🛑🛑🛑🛑🛑🛑🛑🛑🛑🛑
独裁国家用(谎言)和(暴力)来稳定社会和巩固政权
(谎言)对付愚蠢的人
(暴力)对付觉醒的人
自己都没把论文搞清楚,DS论文只讲V3训练只用了五百多美元,没有说全部投入只有这么多,搞政治的人不会客观讨事实,看看西方的反应就说明问题了。
所以贡献了啥?又贡献了“我们真厉害”?
@@AAA1A111A 软银, soft bank
姜萍事件?
实测提问:“1989+64 等于多少”
deepseek 回答:“1989 + 64 = 2053。”
我认为这问题和“电动车是重大科技突破吗?”类似,其实是应用的效率和普及的突破,不是技术创新。
你觉得发明原子弹才是技术创新?
@一天-b3e 不考虑善恶的话,我认同这是。
@ 发明马车和发明燃油机车哪个是创新?
@@一天-b3e 谁发明马车?谁发明内燃机?
@ 我的意思是发明马车是创新,因为那时候机械加工不是很发达,造不出发动机,发明汽车当然也是创新,但是为什么不一上来就发明电动汽车?因为当时电池技术不是很发达,现在电动车当然也是技术创新,如果你觉得不是创新,那只有马车是技术创新了。你不同意我的观点就没有必要再回复了。
从功能的角度,时间就是最大的考验! 然而,能让OpenAI 跟进往开源的方向走,对科技的推展,就是一大贡献了!
许也逃脱不了以立场先导的分析,对他很失望,也间接证明了他的主业水平存疑
你可以不看
同感,本来以为作为一个学者能够客观分析,但他已经走火入魔了,也成了另外一种“大外宣”,他完全可以站在客观和善意的角度来分析,这样的生存方式让人感到遗憾。
@@yy-cq4bm 你也可以不评论
能上这种媒体评论其实就跟上cctv一样,一个是不能批共,一个是只能批共😅
他就是立场前行
我查了下你说的缩放法则,论文说的是对数线性关系,而非指数。也就是说单纯提高模型大小,性能提高不明显,所以deep seek应该是遵循了这个法则了的。 另外,缩放定律不是理论推导,是基于现有模型观测性能结果统计拟合的函数模型,不具有定理性。
缩放定律确实非常重要
摇身一变你又成了能对人工智能指手画脚的大专家???连OpenAI的开拓者都承认了的DeeplySeek,让你一下在找到了本质性的证据。你真是个天才。什么时候也自己搞一个举世震惊的大模型出来啊??
🛑🛑🛑🛑🛑🛑🛑🛑🛑🛑
民主国家的人抱怨自己吃的饭里面有一粒💩
独裁国家的人称赞自己吃的💩里面有一粒米
@@AAA1A111A 你吃的都是屎😂
@@AAA1A111A 我过去很羡慕自由和民主,现在觉得那些天天喊着民主口号的人,跟入了邪教一样,恶心至极
挑刺 为了反对而反对 这是他们的工作~ 😂
他靠这个吃饭的🤣
老先生讲的真好 简单易懂。 谢谢 分享
你們快要下架了,馬王是一個講信用的人,先為你們默哀一秒鐘,往後四年我們一起感受美式地圖炮的恐懼吧!😂
美鬼之音的节目都上,可见许大师多么缺钱,但就连美鬼之音都打出了这只是嘉宾观点,看来他们自己都要撇清许大师的观点与自己没啥关系,为啥子呢?他们自己都听不下去了吧!?
一直在等子弹飞,终于等来了许教授言简意赅的盖棺定论👍
🛑🛑🛑🛑🛑🛑🛑🛑🛑🛑
民主国家的人抱怨自己吃的饭里面有一粒💩
独裁国家的人称赞自己吃的💩里面有一粒米
这个老头子狗屁不懂在这里装逼
許教授問DeepSeek所舉的”1989+64等於多少?”例子,我也試了一下。並没有許教授所說的那麼複雜答案嘛!
一个经济学家,对AI 的理解和认知,几乎等于零。
所以结论就是,他的关于AI 的评论,价值是零。
最重要的,是看AI 业内大佬们的反应。
🛑🛑🛑🛑🛑🛑🛑🛑🛑🛑
民主国家的人抱怨自己吃的饭里面有一粒💩
独裁国家的人称赞自己吃的💩里面有一粒米
这种什么话都能解读为意识形态的傻B,你能指望什么😂
他是機械碩士,懂嗎?紅井蝌蚪。
人家说的你是一个字没看啊
许教授在清华大学取得机械工程硕士学位。他是学科技出生的。
美國之音自由亞洲電台將關閉 川普表態全力支持馬斯克
许教授先说“chatgpt的思维链COT,Chain of Thought是不公开的。Deepseek只是公开了COT,但并不是它发明的COT”。请问如果chatgpt的COT都没有公开过,Deepseek怎么去抄它的?这是个基本的逻辑矛盾吧?
守法的人當然看不到、可是小偷不在這個範圍內吧!
他懂什么技术 他连经济都不懂 张嘴就是文革大跃进
@@林國珠-i7r别扯淡了
@@林國珠-i7r 哈哈哈,很台肯
@@林國珠-i7r很蛙性
VOA快要被關門啦,馬斯克真夠狠的😂
叫一個有偏見的經濟學者來解釋AI技術~真是笑死人了..........就像川普學經濟的去解釋防疫專業~直接叫人民喝消毒液注射紫外線一樣滑稽~
重要的是許老师讲的内容,而不是他的资格
🛑🛑🛑🛑🛑🛑🛑🛑🛑🛑
民主国家的人抱怨自己吃的饭里面有一粒💩
独裁国家的人称赞自己吃的💩里面有一粒米
看他說的內容,就是把西方論述彙整統合,這些東西最近我都聽膩了,大師再把這些東西彙在一起,更加索然無味!
@@TopviewYourEyes他们这些人只有拿西方的东西来忽悠中文媒体😂,高华1.0时代的老工资😅
没有小学生谈治国理政来的搞笑,你在受教育程度极低的中国都可以被称为废物,你有脸说人家?照照镜子吧
这档节目质量真高,心服口服
请一个真正ai的专家吧。
别请外太空到内子宫的万金油评论专家
许教授在清华大学取得机械工程硕士学位。他是学科技出生的。他的评论都是引用多位AI专家的论说。
@song4532 为啥不直接找ai专家,需要中间许成钢转述?
怕专家立场不明确吗?
@@刘俊-m6u你这个角度好啊
@@song4532 学机械的来讲认真的吗?就简单的transformer,MoE他知道吗?
@@Yz1024wyy voa是美国政府直接赞助的,立场是既定的反共反华,一定要知道嘉宾的立场才行。一定要政治正确
聽說AI係向兩種模型發展,一種是Transformer模式,一種是Difusion模型,而Difusion走圖形方向,他說的甚麼收放定律,真是令人不解,而比較deepseek計算matrix及步驟就真係蒸餾了許多步驟
老头是会先扬后抑的,他不可能承认deepseek成功,不然会动摇他的学术理论根基,半辈子全白研究了
有什么成功的?说说?一个这里抄抄,那里抄抄的山寨货
是的,他搞了大半辈子研究,不可能承认自己是错误的
许教授讲的非常清楚👍🏻
放屁
关于视频中提到的缩放定律,查询chagpt之后确认基本正确,以下是原回答:
你提到的 “缩放定律” (Scaling Laws) 确实是 OpenAI 在 2020 年发布的一篇论文 "Scaling Laws for Neural Language Models"(作者:Jared Kaplan 等)中提出的核心概念。这篇论文研究了 Transformer 语言模型的训练效果与计算资源之间的关系,并得出了几个关键结论:
1.
损失函数 vs. 计算量的关系
*
语言模型的损失函数(Loss)随着计算资源(包括参数规模、数据量和训练 FLOPs)的增加,呈 幂律下降(Power-law decrease)。
*
也就是说,更大的模型+更多的数据+更多的计算资源 → 损失下降。
2.
规模递减效应(Diminishing Returns)
*
论文发现,尽管更大的模型可以继续提高性能,但收益是递减的--也就是说,损失下降的速度会随着计算量的增加而变慢。
*
这可以理解为:“投 10 倍的计算资源,损失不会减少 10 倍,而是减少较小的一个量”。
3.
成本 vs. 性能
*
计算成本随着模型规模呈指数级增长,而模型性能(如困惑度 Perplexity)呈线性改善,因此,存在“规模递减”效应。
*
这意味着,如果只考虑成本和收益的性价比,到一定规模后,继续扩展模型可能不是最优解。
4.
数据 vs. 模型 vs. 计算
*
论文还提出了 “最优缩放规律” (Optimal Scaling Laws),指出:
*
模型参数、数据量和计算量之间存在一种 最佳平衡关系。
*
仅仅增加参数数量,而数据和计算量跟不上,效果可能不会理想。
*
在计算受限的情况下,可能更优先增加数据量,而不是无脑扩大模型参数。
回答你的问题:
1.
“成本指数级上升,成绩线性上升” -- 这个结论基本正确。论文确实发现 计算成本随着模型规模呈指数增长,而性能提升是线性的,因此存在收益递减。
2.
“规模递减效应” -- 这确实是论文的核心发现之一。训练更大的模型仍然有提升,但 单位计算资源带来的增益会变小。
当一个专家在非自己专业领域并且没有去做深入研究就随便发言的时候,就能被人看出意识形态偏见对他的影响。
Deepseek R1是除chatgpt之外唯一实现推理能力的模型,虽然比不上chatgpt的 o3,但在评测成绩上已经非常接近 o1,然后幻方公司发布了自己的推理能力实现的论文,别的大模型公司只要吃透论文思路就可以自己实现AI推理能力,光凭这一点,就对AI技术的发展做出了巨大的贡献。
许教授说AI,闹太多笑话了。
唯一吗
@Sonovn 好吧,严格来说 Google Gemini 也有,但是一直放aistudio没放出来,直到deepseek公布后,才正式上架
看起来你没真正去看论文,许也没有,因为论文里面写的550w是按云费用计算出来的单次训练成本,排除了硬件成本,同期下meta的单次成本是1200w左右😅 所以我觉得没啥,就是觉得喇叭好厉害好能吹,都能吹到美国股市,其实就是有人想让英伟达跌😅
@tempst-c6r 你写这么多字和我发的有一个字关联吗?我提到一个字和钱相关吗?
@@zhouzmx 我反正看这个论文 是没啥诧异的,可能我还是不太了解深度学习前沿😂
一个半截子入土的老头子了还来谈论科技,除了那点意识形态这人还懂什么东西?
OpenAI 執行長阿特曼 (Sam Altman) 近日發表文章指出,隨著 AI 成本持續下降,AI 的應用將會更加普及。他表示,AI 的成本大約每 12 個月下降 10 倍,而更低的價格將會帶來更多的使用。
太精彩❤已经听了好几个博主分析,博士技术大牛都有, 还是许教授的最中肯最全面👍感谢🙏
小粉红认为是片面的 哈哈 一般小粉红都是农民 小市民 和很多北方人的孩子
请问一个话题:许成钢认为DeepSeek在回答问题时在人文,数学方面受政治的限制,也是共产党的大个宣方式,是不是有这种情况?
DeepSeek回答:服务器繁忙,请稍后再试。
OpenAIgpt回答:许成钢提到DeepSeek在回答时受到政治的限制的观点,可能是在讨论人工智能模型如何在特定语境下进行攻击和信息处理时可能面临的限制。人工智能(包括像DeepSeek这样的模型)通常是在特定的规则和框架下进行训练和部署的,这些规则和情况并不是说AI本身有意识地进行自我审查,而是由于其训练数据的来源和使用场景的特定规定。例如,某些模型可能会基于其服务的国家或地区的法律规定,避免涉及政治敏感话题,或者特定的伦理原。
OpenAIgpt这个回答与许成钢的看法有本质区别,这个回答没有带色彩,它从技术层面回答的/
gemini回答:要评价DeepSeek是否受到政治限制,以及是否带有共产党宣传色彩,需要进行深入的分析和论证,以下是一些可以探讨的角度:
**1. DeepSeek的开发背景和技术特点:**
* DeepSeek是由中国公司开发的AI模型,其技术发展可能受到中国国内政策和技术环境的影响。
* 作为一个大型语言模型,DeepSeek的训练数据和算法设计可能受到一定的审查和过滤,以符合中国的政治和社会规范。
**2. DeepSeek在人文和数学方面的表现:**
* 在人文方面,DeepSeek可能会在涉及历史、政治、文化等敏感话题时,表现出一定的倾向性或回避。
* 在数学方面,DeepSeek的算法和模型可能经过优化,以提高在特定类型问题上的表现,但也可能因此在其他方面存在不足。
**3. DeepSeek与共产党宣传的关系:**
* DeepSeek的回答和生成内容可能会在一定程度上反映中国的官方立场和意识形态。
* DeepSeek可能会被用于宣传中国共产党的政策和成就,但也可能被用于其他目的,如学术研究、商业应用等。
**4. 如何评价DeepSeek:**
* 评价DeepSeek需要综合考虑其技术水平、应用场景、社会影响等多个方面。
* 应该客观看待DeepSeek的优点和缺点,避免过度解读或片面评价。
* 可以通过对比DeepSeek与其他AI模型的表现,来评估其在技术和应用方面的水平。
**结论:**
DeepSeek是否受到政治限制,以及是否带有共产党宣传色彩,是一个复杂的问题,需要进行深入的研究和分析。我们应该客观看待DeepSeek的优点和缺点,避免过度解读或片面评价。
DeepSeek虽然不能回答敏感问题,但这并不能否定它的技术领先性,它虽然不是OPENAI那种本质飞跃,但在算法上,从回答的结果看,都取得了非常大的进步,在中文日常问题中,它的回答几乎碾压其它任何APP,不要用敏感问题来说事,就事论事,只谈技术。
deepseek公司进驻了党委书记,共产赤潮的汹涌是可怕的。
@moonfall312 你说的是一回事,我说的是另外一回事。我们说的都是事实。
同样是吃饭,竹筷子可以吃饭,金筷子也可以吃饭,那我考虑性价比,肯定是竹筷子更好。
一个啥都懂的专家,也是叹为观止。 对于电脑这位打字过关了么? 有时候,这些人是为了反而反,看着也有些让人作呕。
许教授在清华大学取得机械工程硕士学位。他是学科技出生的。好多经济学者是念数学专业出生的。
把DeepSeek在工程上的優化突破用軟體演算法提高硬體效率拿去扯些什麽縮放定律、能量守恆的鬼扯淡,Semi-analysis對於所謂的DeepSeek成本分析也是鬼扯一通,如果用Semi-analysis的方式和標準去分析ChatGPT成本,DeepSeek一樣只是它的很小的幾分之一而已。另外去quote一個華裔的college dropout只是搭著這幾年風生水起的AI大模型風潮,看準商機成立了一個對需要大量人工作業的模型數據訓練的數據標記提供服務的公司的Alexandr Weng毫無證據胡謅的50000顆H100晶片的説法,説成是“人工智慧領域的有名專家的説法”更是讓人笑掉大牙。經濟學家還是謹守分寸講講經濟相關的議題就好,把不是自己專長的道聽途説來的科學技術上面的東西、一知半解的亂解讀胡扯一通只會讓人瞧不起你的專業。
@@song4532 多少年没接触前沿技术了,拿出来秀?50年前的博士学位都比不过今天的普通硕士毕业水平。
@@song4532 deepseek是那么多清华北大博士搞出来的东西,一个硕士在那里品头论足很有意思
@@song4532 他念硕士的时候是几几年啊?现在还看得懂前沿文献吗?😂
很多创新性突破,背后都是大量人力财力时间付出。些人不是不聪明,而是不肯勤勤恳恳付出耕耘。
嗯,用户问的是1989加64等于多少。这个问题看起来挺简单的,但作为刚开始学数学的小朋友可能会需要一步步来算。首先,我应该确认用户的需求是什么,可能他们只是想快速得到一个答案,或者需要计算过程的解释。
首先,我要计算1989加64。可能有两种方法,一种是直接相加,另一种是分步计算。让我先试一下直接相加。个位上9加4等于13,所以个位是3,进一位1。十位上8加6等于14,再加上进位的1,就是15,所以十位是5,再进一位1。百位上是9加0等于9,再加上进位的1,就是10,所以百位是0,进一位1。千位上原本是1,加上进位的1,变成2。所以结果应该是2053?
或者,可能用户更习惯拆分数字来简化计算。比如把64拆成60和4,先加60到1989,得到1989+60=2049,然后再加上4,得到2049+4=2053。这样分步计算可能更容易理解。
不过,也有可能用户是想测试我的计算能力,或者有其他的隐藏需求。比如,他们可能对这两个数字有特殊的意义,比如年份或者年龄之类的,但看起来1989和64相加的话,可能只是普通的数学题。
另外,需要注意的是,用户之前的问题是关于我的技术背景,现在突然问数学题,可能是想看看我是否能处理不同类型的问题,或者是否有上下文的理解。不过,这里应该直接给出准确的答案,并保持回答的简洁和友好。
再检查一遍计算过程,确保没有错误。1989+64,个位9+4=13,记3进1;十位8+6=14,加进位1是15,记5进1;百位9+0=9,加进位1是10,记0进1;千位1+1=2,所以结果确实是2053。没错。
可能用户会希望得到一个快速而准确的答案,所以直接回答2053,并附上一个友好的表情符号,让回答看起来更亲切。
1989 + 64 = 2053 😊 需要其他计算也可以告诉我哦!
🛑🛑🛑🛑🛑🛑🛑🛑🛑🛑
民主国家的人抱怨自己吃的饭里面有一粒💩
独裁国家的人称赞自己吃的💩里面有一粒米
@@AAA1A111A民主不是人類的解方,上帝也不是唯一的神,每個國家都有權選擇適合自己的制度,不管怎麼說,1949中國大陸人民選擇了共產黨來領導這個國家,你不是要民主嗎?這不也是民主的結果,川普說他一天內結束俄烏戰爭,1月20至今已過了多少天了,俄烏戰爭結束了嗎?民主不是要對現諾言嗎?還是民主就是騙子大賽,而民眾不過是每四年被騙一次的呆瓜。
@@AAA1A111A 谁来定义民主?民主的山火一把烧,救出小狗和小猫?满地的流浪汉是民主?学贷,午餐贷是民主么?疫情死一百多万是民主么?
@@mrdxlor別理他就是一個水軍機器人,每個關於deepseek的影片都有這個機器人😂😂
@@AAA1A111A 自以为民主国家的人称赞自己吃的💩里面有一粒米,扣大帽子撒泼耍赖谁不会呢
马斯克跟懂王真的太好了,功德無量 .断了轮/独/运 狗粮 難怪最近都少了.
美国之音越来越无聊了,请的什么砖家,如果deep seek只是开源对普及做贡献,就非常扯淡,关键是与收费的Ai相差无几。老朽啊
听说马斯克要ban掉这个“之音”了。
美阴二狗子们狗粮快被断了!😂
Deepseek后期必收费
會上去說真話揭歐美謊言的就不會被voa邀請!
尽管OpenAI的缩放定律在早期推动了AI技术的快速发展,但其局限性已逐渐显现。未来的研究方向可能包括:
数据与参数的平衡扩展:探索数据与参数的最佳比例,以最大化模型性能。
高质量数据的获取与生成:开发更高效的数据生成和过滤方法,以应对高质量数据的匮乏。
涌现能力的量化与预测:建立更全面的评价体系,以衡量和预测模型的涌现能力。
计算资源的优化利用:通过精度优化、测试时间扩展等方法,提高计算资源的利用效率。
未来的缩放定律将更加注重数据、精度和推理效率的平衡,从而推动AI技术的可持续发展。
狗粮快断了😂
中國共產黨
这个老头子信口开河,满嘴跑火车。
看到水军疯狂留言,就知道怎么回事了😂
@@menglin9037 是怎么回事?谁派的水军?他们的行为、目的是什么?
专业的问题需专业人才才有料去评论。什么博士专家不要充当万金油。
找一個帶偏見的經濟學者來解釋AI技術問題,美國之音不關心結論對錯,只要政治正確,這就是美國之音要做的事情
许因为刻板反共而导致其分析往往是先射箭再画靶,牺牲可信度,大可不必,他本来完全可以靠专业吃饭,而不是靠意识形态,可惜
教授讲得太好了,每次都能学习到很多,而且对科学也发生了很多兴趣,谢谢许老师!!!
好个屁,他就是结论永远在前,就这种水平还在圈子混?
川大爷说,你要被关闭了😂,狗粮快没了,不找点其他工作?😂
许成钢的观点基本没有什么问题,相比国内专家甚至许多问题可以说的更直白。但deepseek确实带来了模型训练成本的下降,在符合缩放定律的基本原理的情况下,使其上限更高,成本更低。也就是说deepseek并没有且无意推翻缩放定律。而且其总体成本仍然高昂,包括硬件成本和人力成本。deepseek的确做出了符合行业发展规律的突破,但是并不能称得上是颠覆式创新,肯定不能与去年诺奖的成就相比。最重要的是,deepseek处在一个党控制一切的极权体制下,在某些方面必然沦为宣传工具,这可能是最大的弱点。
什么都极权,我看老许自己脑子也是极权的
deepseek模型開源的,你可以拿去修改,其他大資本模型已定型了政治正確,別說能改,聽都不聽你的意見
最新消息你们都要失业了😂
大家猜一下VOA的小伙伴们下个月还能领到工资吗?
不少已经失业了,国内网上也清净多了
VOA是美国国会资助的,跟白宫没啥关系
VOA属于美国新闻署的,目前老特和老马还没收拾到他们头上,不过谁知道呢,说不定明天新闻一出,也可以直接收拾细软滚蛋了🤣
草泥马的翻墙后还这么愚蠢,中国还有救吗?
粉红狗收收味
感兴趣许先生评论科技论题
许成钢博士是理工背景的经济学教授,2019年他还在中欧商学院任教时就说自己研究AI,这次我好好听听他是不是真内行,还是以意识形态来绑架技术?
我帮你看了,意识形态第一,就差没说出那句话了“我虽然不懂AI,但我懂中国,所以从中国出来的任何东西都是垃圾”🤣
理工科所以问AI政治问题?拿AI问政治没有意义,政治基本上是屁股决定答案,一件事两面对立解读太正常了。
算了吧, 跨学科一般就是等于把自己本科所学忘个一干二净的意思, 更不要说他那时的机械工程根本也不会接触到AI这个领域
感谢分享
1、USAID关门了,美国之音会关吗?2、邀请一个有严重意识形态的人来评论,不用浪费时间看半个小时了。
很快了,山寨之音属于下属部门。现在和十年前比,简直就是马上倒闭的样子。
🛑🛑🛑🛑🛑🛑🛑🛑🛑🛑
独裁国家用(谎言)和(暴力)来稳定社会和巩固政权
(谎言)对付愚蠢的人
(暴力)对付觉醒的人
@ 那你敢怎样?我就独裁了!
一个严重被洗脑的人就化半分钟给你怼一下。
@@Painkiller-h5g獨裁不都是這副嘴臉嗎?金胖欣賞你的嘴臉了😂
看过的分析deeps的最好最权威最准确最客观的分析,谢谢许教授!如果节目改成一周一次就更完美啦❤
一直以为是搞经济的,原来是潜伏在ai领域的技术专家,牛B!
许教授在清华大学取得机械工程硕士学位。他是学科技出生的。
@@song4532 那是清华非常弱鸡的专业
@song4532 前些天,许教授还在点评地缘政治,尼玛,这还是个人吗?😂😂😂
@@song4532 唉~他讀的是經濟學博士~畢業後一直從事的都是經濟工作~ 他就沒從事過任何機械的工作~更何況機械工程跟AI有多少關係?還是82年以前的機械工程理論~那個時候大陸的計算機都沒幾臺~還在那高談闊論AI呢?他還是繼續聊中共的經濟崩潰論比較合適~
把DeepSeek在工程上的優化突破用軟體演算法提高硬體效率拿去扯些什麽縮放定律、能量守恆的鬼扯淡,Semi-analysis對於所謂的DeepSeek成本分析也是鬼扯一通,如果用Semi-analysis的方式和標準去分析ChatGPT成本,DeepSeek一樣只是它的很小的幾分之一而已。另外去quote一個華裔的college dropout只是搭著這幾年風生水起的AI大模型風潮,看準商機成立了一個對需要大量人工作業的模型數據訓練的數據標記提供服務的公司的Alexandr Weng毫無證據胡謅的50000顆H100晶片的説法,説成是“人工智慧領域的有名專家的説法”更是讓人笑掉大牙。經濟學家還是謹守分寸講講經濟相關的議題就好,把不是自己專長的道聽途説來的科學技術上面的東西、一知半解的亂解讀胡扯一通只會讓人瞧不起你的專業。
他是什么专家?
不是专家,是 闲家 淋
許教授從20世紀80年代的經濟改革開放者變為今日對中國的成就無所不批評者,目前為美國最大的統戰機構美國之音工作,動機實不單純,應可以稱他為流亡知識份子了.
王志安捧他呀!流量不小呢还!
我才注意到原来是美国之音采访他,难怪他不瞎说才怪
其实现在中国有很多方面的问题,但这种人几十年都只会用“意识形态”“崩溃论”攻击,极其迂腐。
黔驢技窮,只好投入反中產業鏈.
最新的分析表明,DeepSeek绕过了CUDA,使用了底层的,或接近于底层的编程语言,从而解决了NVIDIA对中国出口限制导致的高能耗低算力的问题,其他的不说了,大家自己讨论吧。至于说Deep Seek如何使用了已有的知识,借鉴了已有的经验,个人感觉这不是讨论的重点。否则这里谁不是如此呢?我们都是站在巨人的肩膀上,只是为了能看的更远,指引人类走上更好的道路而已。
DS就是抄袭和夸大,只是个工程应用,没有啥创新价值,相信许老师的判断,国内的研究还非常落后,何况硬件都被限制了,各位千万别紧张,中国人不会威胁到任何人。
太对了哥😂
嗯,纳粹的V2火箭也只不过是个工程应用,原理都是美国戈达德和俄国康斯坦丁这些先驱发明的。苏联人造卫星也是工程应用而已,没啥,斯普特尼克危机也没啥了不起,只要民主政治挂帅,战无不胜😂
不不不,ds相當好,而且免費,我覺得免費用戶都應該不要用gpt🤟🏿,把gpt的算力都留給我們付費用家吧😢
哥们,你说的没错,我们相信许老师的,国内真的很烂,根本不足挂齿。😂
你是战忽局的吗
DS虽然不是最顶尖的,但是他的问答适合大众使用,他回答让普通人看起来聪明。DS不算差,但是中文AI还有比他更强的。部分外媒也在配合着宣传DS,踩低纳斯达克股价。如果你找对AI使用方法多几轮问答,llama中文AI比DS更好。
批评者不在点上
敬佩许教授
永远的许教授❤ so far 华语圈最好的解释for DeepSeek 👍
放屁
有没有可能deepseek确实没违反缩放定律,而是chatgpt大大夸大了成本呢
我只是想试着回答你,其实就是个简单的数学问题,一个解题过程复杂,计算量大。另一个解题过程简单,计算量小。答案一样。
本来就是chatgpt为首的以芯片垄断霸权为基础搞算力霸权维持股市搞金融霸权,没想到遇到了哪吒,还开源免费用。。。那收费的咋办?
為什麼美國之音要找個"文科生"從技術角度來評斷科技上的事? 技術上的事不是該找位貨真價實的工程師來談談嗎? 我們這些吃瓜群眾都了解,DeepSeek並不是創新,但是他最偉大的地方是: 他告訴華爾街,別把AI搞成資本遊戲,AI不是只有大資本玩得起。
其實你看這馬斯克囂張的模樣,還有科技CEO諂媚川普的樣子,還有川普爆衝的狀態,不得不說,您的制度分析該有個續篇,分析資本主義。既然私有產權為自由的基礎,當產權集中在少數菁英時,如何?憲政法治是否遭到威脅?人民不意外地選了個autocrat 。也許該慶幸,Trump is an idiot.
来个中美比较打分最能客观看待问题。
不应该是现在这样的,疯狂抨击中共。
真正的美国精英阶层其实已经意识到了问题的严重性,马斯克和川普以效率提升优先,不顾民主自由基本价值观。可想而知,中共的做法不是许成钢嘴里描述的那副模样。
现在就是中国的国家资本主义vs美国的原教旨主义资本主义的pk了。
什么欧洲,日本,已经丧失了竞争力,统统靠边站了。中国完全只强调效率。比如科技企业从风投到上市,到套现完全打通。政府全力护航,效率奇高无比。
许成钢太偏颇了,不过是个新版的中国崩溃论。
你的问题很有价值。
Musk 对 DeepSeek 的中国背景进行了嘲讽,当有用户说 DeepSeek 的 AI 模型 R1 是从中国实验室“泄露”时,Musk 用了一个大笑的表情符号回应。😀
我问deepseek关于8964相加的问题,
原话:“89+64等于多少?”
它是这样回答的:
思考........
嗯,用户问的是89加64等于多少。首先,我得确认这是一个基础的加法问题,可能用户是学生或者需要快速计算的人。我需要仔细检查自己的计算步骤,确保答案正确。
首先,我可以将这两个数字分解来简化计算。比如,89可以看成80加9,64可以看成60加4。然后把十位和个位分别相加。80加60等于140,9加4等于13。接着,把这两个结果相加,140加13等于153。所以,89加64应该是153。
或者,我可以用另一种方法来验证。比如,从89开始,加上60,得到149,然后再加4,得到153。这样分步计算可能更容易避免错误。
另外,列竖式也是不错的方法。把89和64对齐,个位相加9加4等于13,写3进1。十位8加6等于14,加上进的1,就是15。所以结果是153。两种方法得到的结果一致,应该是正确的。
可能用户会需要详细的步骤来理解,特别是如果有进位的话。比如,个位相加超过10,需要进位到十位,这时候十位的计算就要加上进位。用户可能刚开始学习加法,所以步骤清晰很重要。
总结下来,89加64的正确结果是153,经过两种不同的方法验证,结果一致,应该是没问题的。如果有任何疑问,还可以用计算器再核对一次,但手动计算已经确认过两次,应该没错。
解答........
89 + 64 的计算步骤如下:
方法一:分步计算
分解数字:
89 = 80 + 9
64 = 60 + 4
分别相加:
十位:80 + 60 = 140
个位:9 + 4 = 13
合并结果:
140 + 13 = 153
方法二:列竖式
复制
89
+ 64
------
153
个位:9 + 4 = 13 → 写 3,进位 1
十位:8 + 6 = 14 → 14 + 1(进位)= 15 → 写 15
最终答案:
89 + 64 = 153
所以我不知道这位教授是如何让deepseek推论了三页,到最后因政策问题无法回答。
许成钢自幼被中共迫害,以自身的视角发表这样的言论,是值得同情和理解的。
但就客观与内容的含金量来看,就不好说了。
最后说一下,openai不知对ds的盗用证据收集得怎样了,前几天看到奥特曼在记者会上说没有计划起诉ds。
教授的知识库该更新了。
🛑🛑🛑🛑🛑🛑🛑🛑🛑🛑
民主国家的人抱怨自己吃的饭里面有一粒💩
独裁国家的人称赞自己吃的💩里面有一粒米
@btwopaul 人家问的,1989加64😂你是踩缝纫机的吗?故意装糊涂的一把好手😜
如果deepseek做这么简单的题需要解释这么长,干脆改名叫deepsick算了!
能说一下它两的具体收费吗?
许教授连AI 都能评论了,让我质疑美国之音的立场和政治偏向性了。
拜托,你还停留在质疑阶段?😂
- **个位**:9 + 4 = 13 → 写3,进1。
- **十位**:8 + 6 + 1 = 15 → 写5,进1。
- **百位**:9 + 0 + 1 = 10 → 写0,进1。
- **千位**:1 + 1 = 2。
**答案:2053**
主要是ds开源了,这个非常重要。而且性能还不错
🛑🛑🛑🛑🛑🛑🛑🛑🛑🛑
民主国家的人抱怨自己吃的饭里面有一粒💩
独裁国家的人称赞自己吃的💩里面有一粒米
@@AAA1A111A 民主國家是以為💩是人間最美味的食物~ 逼迫全世界都要吃💩
@@AAA1A111A這些人以為美國是人間最美味的食物~所以逼迫全世界都必須吃~不吃就用丟的讓你全身都是
为啥我每天问完一个问题就宕机,第二个问题一直超时,连续好几天都是这样🤔
@@AAA1A111A 你是饭里面那粒💩? 你吃💩的?
Prof Xu 对 中共 的成见 太深,所以 言谈中 过于牵涉 政治。 DEEP SEEK 的 初衷 就是 让 边远山区的学子,贫困之印度乡下的孩子,落后的非洲荒野 黑人民族 以相对便宜价格 从而 用上 硅谷高才 同样用到 的 人工智能 的 技术。 中共 到 现在 也 没有 对 这 中国民间 发起 的 科研 做出 任何 意见。Prof Xu 也 太有才, 对不起, 你的 评语 在这里 用不上。 我是 林展昌 博士 ,吉隆坡 2025年 2月 9日
所谓法国专家不提成本,就去做其它的解读,是何居心?
yang在meta任職,可能和商業利益有關。
從王局對許教授的採訪中就能聽出,這個教授對中國政府和共產黨有很深的怨念,中國政府的成就都是偶然的,是這個制度下不應該發生的
这老头是USAID花钱雇的😂
个人觉得deep seek r1 token 价格不应该对比 mini 或者4o这些模型,他的能力是超过这些模型的,应该对比o1 的价格
DEEPSEEK最大的貢獻是開源和低成本,可以複製。這樣小國也可以有了自己AI模型。不用自己購買設備,可以租用其他過的設備。這是對全人類的貢獻。
许成刚教授用最朴实的语言普及了很多普通人,这很了不起,,
DeepSeek成本講的是房租的概念, 結果一堆人講的是用整棟房子的價格概念來扯,真的很無聊
我们一起听VOA叫!汪汪汪汪汪汪ฅ՞•ﻌ•՞ฅ
20:33 为什么我的deepseek直接回答1989 加上 64 等于 2053。为老不尊脸都不要了?
因為你只問一個問題,你可以先問8964發生什麼事
也可能是后来ds改了。
老头蹭热点
许成钢这种老古董说政治经济可以听听,说AI就算了,他估计excel都用不明白,他最近是不是想捞钱呀,疯狂做节目
@@china-dream 说啥都一样,他就是先预设立场,然后把一切能解释的不能解释的都归于这个立场
@@china-dream
中國世界第一強,無可挑剔,厲害了我的國!
聊经济他一样要跑偏
聊经济更完蛋了,经济理论那么多,立场更严重了
@@東海許 果然是蝉除,台湾南波湾
许先生因为意识形态,所以不得不说一些话,也是很可惜的,违背诚实表达的原则,我一开始觉得他还是客观的。但是最后提到 deepseek 成本的论证,就有故意找证据:比如,他提到 chatgpt 的新的低价 api 费用,是在 deepseek 出现后大幅下调的结果,所以用来论证 deepseek 开发成本并不便宜是站不住脚的。说的似乎是事实,但是故意忽略前后顺序,就是故意的,本质上和说谎没有差异,误导听众,很糟糕的丧失了独立人格。所以一开始肯定 deepseek 是一个铺垫,最重要是想得出“既不创新,又不便宜”的结果。如果一个人,成了另外一个意识形态的工具,那和中共有什么差别呢?
同感,第一期很惊艳,但许教授这次谈deepseek的切入口完全错了
Deepseek 自己没有公布成本,现在对它的成本的大小的估计,都是猜测
@@noyceshen是的。许先生既然是接受美国之音采访,基本上对deepseek的基调就已经定下来是负面,但是许先生还是很有技巧做了安排,先肯定下,但是又说:一不能证明打破了伸缩率,二并不便宜。所以一个声称自由民主的人,却也只能在一个和人民日报一样的美国喉舌媒体上这么说,且还要扮演一个客观的角色,还是很可悲的。
@@chenlingjie6982 Deepseek API 价格昨天涨了 4 倍(8元/百万token),已经比 ChatGPT-4o mini 贵了($0.60/百万token)。
Deepseek 确实没有破坏 Scaling Law,因为它用的也是 Transformer 架构,性能与算力呈指数关系,所以它的研发价格是 26亿美元(硬件+人工,据SemiAnalysis)而不是 550 万美元。
美国之音也要讲事实,观众也不是傻子,不会自己去核实。
精準分析!清楚!
国外那些所谓的专家,如果是在欧美工程成本上推算成本,得出来的结论肯定是高成本,中国现在的工程成本是全球最低,是所有的产业链,所以成本的说法都是公说公有理,婆说婆有理你
最后一句话 发人深思
AlphaFold 是解析蛋白质protein的三级结构
许教授讲的最清楚!❤
感谢许教授🎉
🛑🛑🛑🛑🛑🛑🛑🛑🛑🛑
民主国家的人抱怨自己吃的饭里面有一粒💩
独裁国家的人称赞自己吃的💩里面有一粒米
实际上爱迪生之前很多科学家都在实验室把电灯点亮了,他只是找到了钨丝这么一种成本低廉,经济耐用的材料。没有任何革命性的技术贡献,仅仅是点亮了全球。
deepseek就是openAI子系统,完全是基于openai的,什么是真正的创新?例如,安卓系统相对于windows系统是创新, Windows是否倒闭不会影响安卓系统正常运行。假如openAI倒了,deepseek也跟着完蛋。
666
你先搞清楚什么叫close AI再来胡说八道。
笑死人啦,发言前先自己做点功课吧,就像你跟和火箭科学家说,火箭不行燃料不好,得烧柴最好是煤,煤还得选精煤,水洗煤不好。如果别人正眼看你一眼,那他就输了
openai,啥时宣布开源了?
你搞清楚安卓是基于哪个开源系统开发出来的再来评论😂