如何理解“梯度下降法”？什么是“反向传播”？通过一个视频，一步一步全部搞明白

“损失函数”是如何设计出来的？直观理解“最小二乘法”和“极大似然估计法”

任务109：梯度下降法

What Flavor Works Best in Popsicles?

38 Hours on Amtrak Overnight Train (WANTED FUGITIVE ONBOARD)

Helene's impact felt far and wide across several southern states

如何通俗地解释梯度下降法

马同学图解数学

Просмотров 6 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 29 сен 2024
马同学淘宝店铺 shop464696853....
马同学官方网站 www.matongxue....

Комментарии • 6

@薇季芬 Год назад ⁺⁵
0:12 - 0:13
梯度下降法就是快速找到最低點的一個方法
0:13
思路很簡單，山上有一個球，經過幾次運動後，就會來到谷底附近
思路雖然簡單，但是要實現這個過程必須回到三個問題
1.往哪個方向滾？（0:24）
2.每一次滾多遠？（0:32）
3.滾到哪裡算結束（0:41）
雖然一開始說滾到谷底附近，但是這個附近是多大？
1:01
簡單的例子
1:11
一元函數只有兩個運動方向
一個朝左，一個朝右
越走越高的方向叫做梯度方向
越走越低的方向叫做梯度方向的反方向
1:32
如果要走到最低處，就要往梯度的反方向走
1:38
走了一次之後，我們又會對方向進行判斷
同樣這個點也有
梯度方向和梯度方向的反方向
1:51
就這樣持續重複這樣的邏輯
不斷朝梯度的反方向移動
運氣好，我們就能走到最低點附近
2:03
為什麼要說＂運氣好＂？
就是因為如果要達到目的，我們還要考慮每一次走多遠
這個要從計算中反應，所以這裡給出一些具體數值
2:14
假設
f=x^2
梯度就 = 2x
這個梯度就是 gradient of f
gradient vector的定義一定要記住
=〉〈fx(x,y) , fy(x,y)〉
忘記的話可以在這裡複習
9-4 ruclips.net/video/BTExmI3bPao/видео.html
9-5 ruclips.net/video/X2I3iMevFwo/видео.html
2:25
實際帶入數字計算，以方便理解
3:13
需要一個參數來控制移動的距離，這個參數被稱為學習率
3:25
如果將學習率調過大，可能會讓結果離我們的目標越來越遠
3:41
如果學習率太小，可能會讓每次學習進度太小，這樣要達到目標就需要很長的時間學習
4:09
要完成梯度下降，需要選擇合適的學習率
4:15
來看終止條件，首先計算出每次跌代後的梯度值
在學習率=0.2時，每次跌代後，梯度的絕對值都在不斷下降
（再講一次梯度就是 gradient of f
gradient vector的定義一定要記住
=〉〈fx(x,y) , fy(x,y)〉
）
4:18
梯度方向的意義是如果往這個方向走，z的值的增長會最大
那麼梯度方向的絕對值就是指說往梯度方向走 z的值增長的量
詳細定義可以看下面這支影片
ruclips.net/video/Dhou27Ergkk/видео.html
4:19
可以看到在學習率為0.2時，每次迭代後，梯度的絕對值都在不斷下降
表示 z的值增長的量持續下降
這也是將這個方法命名為梯度下降法的原因
4:39
梯度為0的位置，就是最低點的位置
因此通常會選擇較小的梯度值作為終止條件
比如希望最後的梯度值小於等於0.01
5:03
理論支撐
5:13
最後看個例子
@Jacob.D. 10 месяцев назад
为什么梯度要选用导数？随便用一个x变量不行吗？
@大白话AI 10 месяцев назад
一元函数的梯度就是导数
@chenwilliam5176 Год назад
會有複數個「低谷」，我們要找到「最低谷」，
對損失函數而言，我們要找到最「最低谷」，損失值才會極小 ❤
梯度值為 0，
不一定是「最低谷」，如果它不是最低谷，稱為
local minimum
，不是我們據以建構模型的
「地點」😅
@123kkk-vx7yq 8 месяцев назад
什么叫梯度阿？
@byw8396 2 месяца назад
斜率

Следующие

Автовоспроизведение

如何理解“梯度下降法”？什么是“反向传播”？通过一个视频，一步一步全部搞明白

如何理解“梯度下降法”？什么是“反向传播”？通过一个视频，一步一步全部搞明白

“损失函数”是如何设计出来的？直观理解“最小二乘法”和“极大似然估计法”

“损失函数”是如何设计出来的？直观理解“最小二乘法”和“极大似然估计法”

What Flavor Works Best in Popsicles?

What Flavor Works Best in Popsicles?

38 Hours on Amtrak Overnight Train (WANTED FUGITIVE ONBOARD)

38 Hours on Amtrak Overnight Train (WANTED FUGITIVE ONBOARD)

Helene's impact felt far and wide across several southern states

Helene's impact felt far and wide across several southern states

I Created NEW Mega Pokemon, Then Used Them in Battle!

I Created NEW Mega Pokemon, Then Used Them in Battle!

如何通俗地解释特征值与特征向量

如何通俗地解释特征值与特征向量

20190325 共軛梯度法介紹

20190325 共軛梯度法介紹

【漫士科普】为什么数学不允许除以0，却定义了根号- 1？#数学 #science #maths

【漫士科普】为什么数学不允许除以0，却定义了根号- 1？#数学 #science #maths

机器能像人一样思考吗？人工智能（一）机器学习和神经网络

机器能像人一样思考吗？人工智能（一）机器学习和神经网络

“随机梯度下降、牛顿法、动量法、Nesterov、AdaGrad、RMSprop、Adam”，打包理解对梯度下降法的优化

“随机梯度下降、牛顿法、动量法、Nesterov、AdaGrad、RMSprop、Adam”，打包理解对梯度下降法的优化

5 分钟理解偏导数和梯度 - 数学知识的动画解析

5 分钟理解偏导数和梯度 - 数学知识的动画解析

如何理解梯度 _1 (gradient)

如何理解梯度 _1 (gradient)

“神经网络”是什么？如何直观理解它的能力极限？它是如何无限逼近真理的？

“神经网络”是什么？如何直观理解它的能力极限？它是如何无限逼近真理的？

Кран в 40тонн стоял 27 лет! Сможет ли он поехать?

Кран в 40тонн стоял 27 лет! Сможет ли он поехать?

С Максимом Шевченко. Мирные планы и конец света: Хезболла, Израиль, Украина. 29.09.24

С Максимом Шевченко. Мирные планы и конец света: Хезболла, Израиль, Украина. 29.09.24

ПРО ПЕРВЫЕ ГОДЫ "ИМПРОВИЗАЦИИ" #мнесмешно #шастун #импровизация #воронин #бабьяк #mediumquality

ПРО ПЕРВЫЕ ГОДЫ "ИМПРОВИЗАЦИИ" #мнесмешно #шастун #импровизация #воронин #бабьяк #mediumquality

ПИ ДИДДИ: "белые" вечеринки, приёмная дочь, 50 Cent и весь криминал (часть 1)

ПИ ДИДДИ: "белые" вечеринки, приёмная дочь, 50 Cent и весь криминал (часть 1)

Кто Последний Перестанет ИДТИ ПРЯМО Челлендж !

Кто Последний Перестанет ИДТИ ПРЯМО Челлендж !

БАДАБУМЧИК vs ОСКАР БОЙ! ВЫЗВАЛ на ГОНКУ?!

БАДАБУМЧИК vs ОСКАР БОЙ! ВЫЗВАЛ на ГОНКУ?!

▼ КАПИТАН НАШЁЛ НЕФТЬ В 🍑

▼ КАПИТАН НАШЁЛ НЕФТЬ В 🍑