【漫士数学】数学算法如何帮你做出最好的人生选择?
HTML-код
- Опубликовано: 8 фев 2025
- 一位来自清华的人工智能博士生,日常思索和科普。
An artificial intelligence doctoral student from Tsinghua University who likes to delve into thinking and science popularization.
喜欢我的内容欢迎订阅、评论、点赞^_^
Welcome to subscribe, like, and leave comments under my videos^_^
打开小铃铛🔔获取频道最新动态
Turn on the little bell🔔 to receive my latest updates
--------------------------------------------------------------------------------------
#科学 #科普 #知识 #物理 #数学 Наука
所以:
『我不是花心,我只是為了不再愛他們,並且確認你就是那個最優解。』
恋爱也是这样,所以心善的人反而会不知道该如何做出抉择搞得大家不愉快
兄弟,你說得真對,我要三十歲了,我以前看過好多書和影片都常提到成長型思維,我總是騙自己,說服自己是成長型思維的人。
但UCB算法的精神,不得不讓我承認我現在的人生,僅僅被侷限在狹隘而固定的思維中,我就像你影片中說的不敢嘗試,或著永遠想一次找到最佳解(完美主義)結果反而錯失好多機會。
多了解 悟空之道 學習AI精神 卷積精神 重要的是新數據 亂槍打鳥多嘗試
懂了,所以當煩惱要吃什麼時,全都吃就對了(沒,我開玩笑的,感謝博主分享
品酒師表示:有種概念好像叫做試吃
这个模型有一个最大的缺陷,就是没有把试错成本(非时间)考虑进去。当拉拉杆不仅需要时间,还需要很大的力气,那么对于拉一次拉杆就要消耗全身力气的人来说,不会有几次拉动机会,遑论多拉几次试错了。
然後一次都不拉會更好嗎?本來就要試試看,多少人選擇別人覺得最好的最後還是選錯出來常是自己喜歡的,等妳要死的時候只會後悔自己沒常識什麼而很少人在後會自己做了什麼
(除炒股跳樓那些人)
@@c8c8c8ddd
我覺得他的意思應該是像高考這類的你只有一次選擇機會的不能套用這個模型
但其實透過平常對自己的認知,你在做的每個探索都可以算是拉一次拉桿吧(個人理解
@@c8c8c8ddd 我的意思是,不是所有人,不是所有事,都适用这个模型,特别对于一个身处成功机会不平等的社会,起点较低且原生家庭无法提供帮助实现阶级越迁的人来说,这个模型能起到的作用并不像视频标题说得那么夸张。
其实是已经考虑进去了的,或者说,很简单就可以把非时间的成本嵌入进这套方法中去。视频里是为了观众的接受度,说得比较简化抽象,拉动拉杆后老虎机反馈得到的数字其实并没有被很局限地定义。只要把替换为 ,就能解决你的担忧。
@@johnn7092 当你的本钱远远少于别人时,你拉动拉杆的次数也远远其他人,别人可能可以无限次拉动拉杆来找到最好的,而你的成本却限制你只能有几次机会,而且就算这几次有限的机会也不能选到最差的结果,因为你一旦选到最差的,付出的成本会直接把你本钱扣光甚至让你背上负债!在这种情况下,你能不处心积虑的去在拉动重要拉杆前做好一万倍的准备吗?所以这个视频完全没有意义,除非世界实现共产主义了
之前設計遊戲的AI的時候就有看過這個算法,通常跟蒙地卡羅搭配使用,非常實用。
高手
先給肯定 這部是 神作中的神作
給幾個修正的點
我認為 表面上是大數定律 而真實的是貝葉斯定理 (貝氏定理)
我個人認為世界上最唬人的定理 就是大數定律 (因為大無法定義 反觀貝葉斯沒有這條規則 大數定律有滯後性 白話就是馬後炮)
因為大數定律的底層是貝葉斯定理 (個人主觀 雖然兩派吵很兇), 很多能證明為大的前提是有貝葉斯撐腰
繼續 而真正產生類似效益增益魔法效果理論 是基於概率論中的貝葉斯條件概率中的蒙地卡洛分析(蒙地卡洛方法)
外行的人 可以直接用"三門問題"來對比理解 就會理解 為何這是我們現實世界中的真實魔法了
另外我給個訣竅
初次不要用0~10分 任何事件 初次接觸 先用世界學界公認的1~5分 (這是基於機率論抽樣分布的簡單技術 李克特五點尺度)
就是古人常說的瞭若指掌 指1掌5 用1~5抓區間 (特此注意 小白只要會用就好 但需要深度理解這是機率打分)
若有重要性或者高風險性 需要細刻度 在增加到 1~10 或者 1~100分 (另外學界的1~7分 就是邪魔歪道 會摧毀自己原有1~5分習慣的大腦評分系統)
若你轉生成為AI 可以用係數0.000~1 之間
另外有些人在討論成本考量問題 我就直言不諱了
想要做當前"成本考量"也需要多花成本去考量 這一連串考量就是"成本考量鏈"
只能大致理解就是這些人較無法舉一反三 或者無健全的系統關聯思維 環境較為資訊封閉 信息繭房的犧牲者
因為照這個成本考量鏈 可以無限細推的結果 則代表 每一次細推的節點 都可以代入多臂老虎機去分析
直到多條考量鏈的"蒙地卡洛分析" 可以大致穩定收斂 就會產生越高勝率的一個高品質的決策鏈
另外蒙地卡洛分析 並不是甚麼高大上的玩意
是可以玩得很複雜 也可以玩得很簡單 不需要用到5分標準的蒙地卡洛 用大腦簡單思考的1分蒙地卡洛也行
畢竟這玩意當初只是一個賭徒 隨便發現出來的玩意 但就是神奇的正確
當你評估"這我可以反殺"或"這裡哪間好吃"或"他是不是喜歡我的"時候 就已經正在用蒙地卡洛了 只是技能等級沒升級罷了
很棒的回覆,碰見好多人總覺得他哪裡蠢,不知道怎麼形容,看完你回覆就覺得是無健全的關聯思維或舉一反三能力
大哥 你的回覆也是神作
想請問這位大哥你是從哪裡學到這些東西的?這些理解真的太深刻了
我看了一些之前的评论,发现很多人说试错成本,和考试制度,这里说说我的理解。首先说考试制度,其实在考试制度下,都不需要这个模型,因为大家都只有高考A这一个选项,对于大部分有且仅有一个选项的人来说,不存在什么试这个试那个,努力就行了。这也是为什么我们都是在大学时期迷茫,因为我们不再仅有考研一个选项了,我们可以工作实习,我们可以搞创业等等,这时候这个模型才有用。再说回高考,有些家底殷实的孩子的确有别的选项,如果高考A不行,可以出国留学,那对于他们来说,也可以拿这套模型来使用。这里就可以谈谈试错成本这个概念,当你只有一个选择高考A的时候,高考失利就不能算你选错了,因为你从来没得选。试错成本其实也一样,如果有一个拉杆D,拉了之后如果结果很差(结果很好就不赘述了,恭喜发财),也不能重新再拉ABC了,那我们不妨直接不考虑拉D,除非你想赌个大的,那建议去买个彩票。高考失败也可以选择去那个不理想的学校上学,努力学习,也可以考虑复读,也不是万劫不复不是吗。我们怕失败,羡慕别人有更多的选择,那个高考不理想的同学可以回去继承家业,而我没考上辜负了家里人的期待。的确这个世界是不公平的,但是这个模型从来都不是拿对别人来说轻而易举的DEFGH选项和我仅有的ABC三个选项作比较。而是当我有且仅有ABC三个选项甚至AB两个选项的时候,我该如果尽自己最大努力选择出最佳答案。
🎉🎉
但是博主所說的UCB演算法解K臂老虎機有幾個侷限性:
1 模型中假設選擇次數遠大於選項數目,但是人生中很多時候反而是選項很多、選擇次數很少,例如高考有幾千幾萬個大學、科系,但是卻只能讀一個,就算選錯重考,一輩子又能重考幾次呢
2 模型中假設能零成本切換選項,錯了還能改回來,但是很多選擇是難以修改的,例如談戀愛,總不能今天和A約會明天和B約會後天和C約會吧 (除非你是五河士道),現實是一旦放棄A,這個選項可能就永久關閉了,這時37%法則可能更適合,但37%法則沒有考慮不確定性
3 模型中假設「永遠有下一次博弈」,未考慮「摔得粉身碎骨」的結局,例如1949入國軍還能逃到台灣,1945入皇協軍直接槍斃了
這算法可行的前提是試完每個選項之後可以重選,但它與人生根本就沒有可比性。
學業上,你不可能先選幾門有興趣的學科,然後每個都試讀一個學期才做正式選科的決定。
工作上,如果你辭職轉公司了,基本上不可能再回到舊公司。就算你進了N家公司工作然後發現第1家最好也不可能回去了。
愛情上,同理,你要確定交完N個對象之後前面幾任不會跑走,還在等你選欸。事實上很多人的出生身份就不是皇帝,不能任意選妃。
更遑論有些人甚至沒有多項選擇的餘地,有書讀有工作有對象已經很不錯了。但要是都沒有這些機會呢?要是溫飽也成問題呢?那還選擇個什麼?
其實也沒有所謂最好的選項,只是根據交互結果做選擇罷了,別人的最好對你來說可能很爛,然後影片裡也沒要你試到最接近平均值再做選擇,根據一兩次經驗選擇相對好的
學業上,除非你完全沒聽過,不然每個學科多少都知道是在學什麼
工作上,每家公司都有優缺點,覺得第一家最好不過是第一家的缺點對你來說可以忽略,優點可接受,如果都有辦法找到好幾次工作了,那找到相似條件的也不難吧
愛情上,相處幾個月就知道對方是什麼樣的人了,而且如果能交很多任,也沒有選前面的必要吧?
沒得選的人哪需要作選擇? 就是因為有得選所以才會想選比較好的,如果只能選一次,每個選項都通向未知的話選哪條有差嗎?
任何一條都是新的經驗,沒有所謂好壞
你提的問題比較適用麥穗理論,只是這個37%要怎麼具體定義實在很困難。
而且也是理論上的最優而已,臉黑的人就是不適用。
@@TozoKoyasu 學老祖宗 掐手指 打1~5分就好 2~3分就差不多梭了
臉黑則代表 她沒有將更多因素抓比例 所以沒產生蒙地卡洛效益
也就是他的37% 實際上少了很多% 重點就在 有張圖表會向右作收斂
那張很重要 必須要條件概率的思維去應用 這就是你想知道那個未知進度的關鍵 相信蒙地卡洛+條件機率 數字就出來
你都沒出來 也不用擔心別人會出來 例如地震預知 天氣模型描繪
今天是人比人的世界 只要你算過別人 就你贏 不用真的算出精確答案 只要你的答案決策 誤差比人小 就你全拿
最優解的正確翻譯 應該是最優於別人解的解 而不是最正確的解答
其實這算法也暗示了對選擇越多的人越也有利,當然可以想成條件越好的人選擇機會越多
可是現實情況是你看到可以選擇的女孩、工作、學科可以選而沒選
很多人覺得對方太醜而不選擇開始一段關係,美其名為寧缺勿濫,實際上是放棄試錯機會
還有找工作,明明大學每年暑假都可以實習、兼職、比賽、幫教授做研究去做類工作的嘗試,很多人沒意識而錯過
學科選擇方面,因為學生年紀小,對學科多少了解很多時候就要靠家長給孩子去接觸,家長沒意識也是會錯過
說的很對
但我還是沒辦法把所有餐點吃一遍(惱
很有幫助的影片,這個知識成功解決我的三餐選擇困難,而且不須要太多自制力便可以做到。支持👍
謝謝Up主 非常好視頻
這也正反映寒門難出貴子的情況。大部份人在考試制度下,又能承受多少試錯...
你这个说法不正是一种固定式思维吗?
@@leaflin56 正洽是時間成本問題,多臂老虎機 持有多次嘗試的機會,如果只能拉三次呢?
在未知收益情況下,各拉一次絕對不是最優解,但你不拉其他也不知道收益。
每個人只能玩一輪,每輪最多拉三次,且不得看前人得到的經驗。
有誰能知道中間的是平均收益最高?
回到出去旅遊所說的那個問題,你不知道挑哪間餐館最好的情況下,又無過多時間去嘗試,那本來就是選擇困難。
如果每個月都去同一個旅遊地點一次,哪有選擇困難,因為你已知下一次的機會在哪。
那就進入循環了,因為時間成本就是不夠去試
@@leaflin56 他說的是事實,現實生活中窮苦人家的確難以承受試錯的後果,簡單舉例來說,當你在讀書的時候,或許他們跟著父母在外擺攤拼博,只能在忙裡偷閒讀書,當你在好好吃飯的時候,他們或許在擔心家裡的欠債、溝通問題、未來,所以窮苦人家固定性思維是很難避免的,因為他們或許真的只能靠兒子、女兒一舉翻轉人生,期待兒女力爭上游,賺多點錢拯救整個家。
@@胡椒醬 有一個很殘酷的現實 需要被考量
可以翻閱一下研究 我忘記出處了
但實驗證明 人在受到壓迫的狀態下 判斷力會變得狹隘
這件事情包括受到貧窮本身的壓迫 可以了解一下 有點像是無限死循環
穷人家孩子固定型思维也是对生活的最优解。谁不知道长期主义好,但你试试和一个明天就没饭吃的人说说长期主义看。
我觉得最难做到的是拥有拿得起(尝试新的拉杆)的勇气和放的下(放弃期望不高的拉杆)的魄力。
不是魄力,是你的家底能承担多大风险。承担能力强的话谁都有魄力。
@@xlgnepo 我觉得你所说的魄力是一个相对概念,王思聪能用一个亿创业,失败也大不了干别的去,而我借一个亿创业,失败了就负债累累。如果这么比魄力,那我的确是没有他那样的魄力。但是如果这么比较对我们人生也并没有什么帮助,因为我们并不是王思聪。我想表达的魄力是指,假设我是一个大学生,我可以A考研,B找工作实习,C创业,在我准备考研的过程中,发现我成绩并不理想,可能考不到很好的研,如果我能够果断放弃考研,选择找工作实习或者去创业,或者我在创业过程中发现的确是无法继续下去,我能够果断放下创业去考虑别的事情,这何尝不是一种魄力。更何况有很多时候和家底无关,一段失败的感情后是否能够果断放下去追求新的感情,也是很需要勇气和魄力的事情。
欸,剛好看影片到一半,想到一個故事
就是我小時候去參加一個寫生比賽,預期自己可以拿那個組別的幾名吧(大部分都是現場畫,可以走走看看那種小型比賽)
結果成績很爛
原因是圖被誤分到低年級組,然後評審覺得是代考所以給低分
然後我對競爭的認識突然就變得有點微妙......具體表現是大考特放鬆,呈現一種反正我先做了,誰知道後面會有什麼破事那種心態
直接衝就行了w
就是mean + standard error 作为决策根据吗!真有趣
高手
所以重點是勇氣
求讲Monte Carlo Tree Search
13:25 現實中其實是綜合兩者,意即天賦的上限是預設的,但透過學習可以逐步成長接近上限
另外個人的背景和資源應該不是天賦,那是外部條件
新上限
大學有學過bandit algo, UCB的regret analysis也有聽懂, 但就是沒有悟出12:00之後的道理, 只是應付了考試就算了。還好RUclips有推薦這影片, 不然東西都白學了
I'm also from Cal : )
不是什么都可以让你这样反复横跳的,甚至大部分情况都不允许你这样做,就好比三个杆只要你拉一个另外两个就会消失。或许你会抬杠,我能力强一次可以拉三杆,这样做在现实生活中往往就是三个杆同时消失的下场,而这也仅仅是最好的结果,更糟糕的结果是不但选择没了还永远被拉黑。
在我20多年的职业生涯里,所遇到的人90%无法做出正确和恰当的决策。决策存在于我们工作和生活的时时处处,学会决策对于过好一生至关重要。我观察了难以做出决策的人,我觉得大部分人是没有掌握一种科学的方法,还有一小部分是有方法,但是本身的性格不适合决策而只适合执行。毕竟具体的生活和数学模型差距很大。
以我的人生经验,要学好数学和哲学。
光學好數學,在投資理財上就會很有底氣
以此為基礎,除非遭逢不測(例如:家人罹癌),基本工資也能很自然解決財富累積的問題
有了財富這個時間以外的現實資本,真的會更加轉往成長型思維,不做出僵化的爛決策
repeat
result = ubc()
pruning(result)
until GAMEOVER
03:55 6:20 09:46 11:50
13:10 14:30 16:43
15:49
Conclude 16:50
這影片和頻道太好了
這個影片太有意思了👍
高手
5:49 每次选择都要考虑试错成本,不然就与你前面的论述矛盾了。假设只能三次试错机会,有人第一下就点在均线附近,有人三点还游离在九天之外,这才是真实的人生
这个视频告诉我们一个其实早已为我们熟知的道理,不能一条道走到黑,东方不亮的时候也许西方亮呢?
這個模型其實很好。只不過還是會有那麼幾個倒霉蛋在拉中間那條桿子的時候不斷拉到低於實際平均值的數。這概率很低,但是確實可以發生,而且還能以翻身。
人生和做题的区别就在于,越是重大的抉择越不允许试错和比较。
有趣,很喜觀這種科學又帶入人生哲理
但是用科學去看人群,腦袋會死亡。
因為人類這生物總是不按牌理出牌,基本原理可以靠科學解釋,但是一整群人在一起,很多科學就無法解釋了。
社會科學,比傳統科學更難搞~
能催更吗?很久没看到新视频了
但這不適用於買車這種事,畢竟一般人沒辦法時不時換車
有收益很棒的视频
但每種選擇的嘗試代價不一定一樣
已点赞
兩小時!
從來沒試過這麼早
wow,It‘s amazing~!
为什么我感觉这个算法很海王呢,哈哈哈,每个人都先处一遍,然后挑活儿最好的。
所以说要适可而止以及接受可能迎来的风险
Algorithms to Live By 有提到這個算法,影片並沒有提到太多新的東西
能做一个微积分的集合吗? 学不会微积分
11:40 紙上談兵
大前提有一个漏洞。还有一种选择困难是因为都想要。就像不知道吃哪家,不是因为不知道哪家做的好吃不好吃,而是因为都想吃。 认真的!
全部選項都是996icu怎解?
後面那個小遊戲畫面跟鬼一樣,選擇困難跟拖延症好像也有點像
勇于尝试的前提是还留在牌桌上。对于口袋不深家底不厚的普通人,尝试的风险不小心无法负担的话,这个方法还是没那么有用的,因为人生很多关键的事情对普通人没机会尝试多次。说到底还是每个人机会和风险承担不均等,简称运气。
记住选钱少的,人家觉得你是傻子,就会不断给你钱,让你选。
central limit theorem
0:39 我也是
播主标题党,自己开始都说了学生不能上完课再回来选,不要吹过了。人生的选择哪有什么优解,谁能判定?
😊多臂老虎机的ucb算法远远不是最优解
不需要那么升华主题
真正的最优解叫做gittin index
@@SophnesHsu 所以我用的是接近,在量级上根号T就是最优的了
@@manshi_math
想請問樂觀分數具體要怎麼算,有沒有實際例子?
@@manshi_math 很棒的视频,能不能出一期中国的孩子应该如何学数学的视频吗?初中的孩子该如何学数学?如何培养数学思维?数学的底层逻辑是什么?课堂学到的数学应该怎么输出?如何检测自己是否真正懂了学到的数学知识?分析数学难题的拆解步骤是如何操作的?以及刷题是否还有用?现在国内的学数学模式(预习--上课---刷题)有什么需要修正的地方?望回复,拜谢!拜谢!拜谢!
高手
@@fakedoors.
蒙地卡洛
白話就是 多臂老虎機 只是形象
改成 章魚老虎機 或者 病毒老虎機
數學很爛 感謝大大科普
感覺這算法應該是貪心策略 會不會找不到全局最優?
目標不是找最優 而是不要低於平均
另外 這方法其實用不太到複雜數學計算 主要用的是概率機率論 跟分布
Multi-Armed Bandit
所以我還是不知道要吃甚麼
10:43 為什麼油管總是推送我一看了就討厭的廣告!
難道是因為這個算法,還是我就討厭所有廣告!
還有 我真不了解為什麼谷歌幾乎只推送詐騙廣告!!!
谷歌到底有沒有在用算法?我舉報N多次了谷哥都算不出來?
我很震惊,法语居然是高薪专业之一(虽然只排第9)
可是有一個問題,人總是會做出錯誤期待
所以影片後面就講了,在樂觀中選擇最好 ,在交互中降低樂觀,你多次嘗試不同選擇才不會對某一事物過度樂觀
@@rongzh1209 還有問題是一次該降多少,太多會導致一個比較差的結果直接讓那個選項被放棄,太少又會浪費時間
@@ShiShen_Huang 额,主要问题是,这个世界上的东西不是一成不变的,事物都是发展的,可能它不会那么服从概率分布……
@@ShiShen_Huang 能夠量化分析的問題就取平均,通常在這種條件下敘述性統計足以解決大部分問題了,若想得知一組資料的離散程度用變異數跟標準差,這兩個指標可以去了解一下,最大和最小落差過大表示上下限差距非常多,表示很不穩定,反之亦然
就像国内考公务员,短短几十年,大家对考公务员的态度发生了好几次变化,这都是不能够简单地用概率分布去模拟的,每一次投入到时间成本会对后面的人生产生影响,而上述的模型中,每次进行抉择时,都不考虑各个事物间的相关性以及每次选择的不独立性。嗯,把复杂问题简单化,把简单问题复杂化都不是那么理智的做法,所以,还是继续选择焦虑吧……
SJOC的,果然是好论文啊
这个算法真的总是管用吗?假设一个拉杆每次都给500,另一个拉杆平均9次900和1次100。但是小概率的情况下,第二个拉杆连续出现了多次100,基于这个算法,第二个拉杆会不会失去被拉的机会?
這個算法並非總是管用。但前面有個樂觀常數C影響你的信心水準,C越大找到最好策略的機率越高但相對收斂速度越慢。
如果會,請大幅提升樂觀加分,樂觀加分的用途就是避免這種情況
在中國你那3部機都是同一部 你什樣拉都一樣因為一切都是黨!
请问哪个国家不是?人类本来就是等级社会,认识几个名词还真以为你有选择了?本质都一样啊。
昇華了
草原二蛋?
原來我的電子陽痿是這樣來的
高手
人中龙凤!
我悟了
大胆想象 小心求证
普林在读?hhh可以约个饭哈
当年没由管看这种视频,错过了成亿万富翁的机会
請教採樣次數和平均值關係的統計問題,就是Type B error的估計值嗎?
蒙地卡洛
把简单的事情讲得更复杂了