【深層学習】word2vec - 単語の意味を機械が理解する仕組み【ディープラーニングの世界 vol. 21】#089 #VRアカデミア #DeepLearning

【深層学習】GPT - 伝説の始まり。事前学習とファインチューニングによるパラダイムシフト【ディープラーニングの世界vol.31】#109 #VRアカデミア #DeepLearning

【Deep Learning研修（発展）】系列データモデリング (RNN / LSTM / Transformer)　第４回「RNN」

Demetrious Johnson Trains w/ KHABIB & ISLAM MAKHACHEV! | EXCLUSIVE FOOTAGE!

Felix "Unfair" | [Stray Kids : SKZ-PLAYER]

The White Lotus Season 3 | Official Teaser | Max

【深層学習】RNNLM - 自然言語処理に革命を起こした RNN について【ディープラーニングの世界 vol. 20】

AIcia Solid Project

Просмотров 14 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 1 янв 2025

Комментарии • 19

@yukio_takagi6429 4 года назад ⁺¹
毎回、解説ありがとうございます。１つ質問させてください。w(t)+s(t-1)はベクトルの足し算ですが、次元が合わないのではないでしょうか？
@AIcia_Solid 4 года назад ⁺⁴
w(t) と s(t-1) は足しているのではなくて、縦につなげているのです。
3次元のベクトルと、5次元のベクトルを縦につなげて、8次元にしている感じです。
伝わりますでしょうか？
@yukio_takagi6429 4 года назад ⁺¹
@@AIcia_Solid なるほど、すっきりしました。ありがとうございます。
@susumuyoshida2069 2 года назад
いつも楽しく拝見しています。
質問です。
今回の動画の一番最後の部分で出てきたことですが
BPTT と通常のback-propagation の違いがよくわかりませんでした。
もう少し詳しく教えていただけますか？
基本的な質問ですみません。
@AIcia_Solid 2 года назад
BPTT も BP の一種なので、大した違いはありません！
かんたんに言うなら、y^{(k)} 由来の誤差情報が、BP を通して t = k-1, k-2,..., 1, 0 まで流れていくのが BPTT で、今回の RNNLM では、 t = k のところの処理部分だけのパラメタ更新しかしていないという感じです。
伝わりますでしょうか、、？🙇‍♀️
@susumuyoshida2069 2 года назад
@@AIcia_Solid
ありがとうございます。
(AIcia さんの動画に限らず)BPTTを見るたびに
BPTTって「勾配が時間軸を遡る方向に伝わるBP」にBPTTって大げさな名前をつけただけじゃね？
って思うのですが、そんな理解でいいですか？
@AIcia_Solid 2 года назад
だいたいそんなのでいいとおもいます😊
実装や計算にあたってメモリ管理（など）が若干大変なので、そこは乗り越えるべき壁があったということだけなんとなく感じていれば良い気がします😊
@susumuyoshida2069 2 года назад
@@AIcia_Solid わかりました。
ありがとうございます。
いただいた説明を元に、原論文を読んでみます。
@s.t6238 4 года назад ⁺²
2010年ってことは、AlexNetよりも前なんですね
@AIcia_Solid 4 года назад ⁺³
そうなんです！
AlexNet ほどは騒がれなかったと思いますが、この時代も研究はあったのです😊
@ken8392 3 года назад
次の単語予測モデルなのにまともな文章を選択するというのがいまいち分からなかったです。
文章候補から文章を選択する基準はその文の単語の同時確率でしょうか？例えばw_1, w_2, w_3という文があれば、
p(w_1) × p(w_2 | w_1) × p(w_3 | w_1, w_2) = p(w_1, w_2, w_3)　みたいな感じです。
@AIcia_Solid 3 года назад ⁺¹
鋭い質問ですね！
まさにその通りです！
最近では、 length penalty など様々な工夫も使われていますので、そういうのも合わせてみてみるとよいと思います🎉
@ken8392 3 года назад
ありがとうございます！同時確率だと単語数が少ない方ががすごく有利だと思っていたのですが、length penaltyというものがあるんですね。勉強になりました！
@ken8392 3 года назад
論文だと活性化関数はtanhではなく、sigmoidになってますね。
@AIcia_Solid 3 года назад ⁺¹
ほんとだ！ありがとうございます！
概要欄に追記しました！
@manbodama 3 года назад
20:00　教師強制とは違うんかな
@AIcia_Solid 3 года назад
教師強制というのは始めて聞きました👀
どのような概念ですか？
@manbodama 3 года назад
@@AIcia_Solid 教師強制はRNNの学習時、入力値に1つ前の出力値を使うのではなく教師ラベルを用いるというものみたいです。そうすることで、推論時と学習時の条件は変わってしまうものの、学習が安定し、学習を1ステップごとに区切ることができるので並列化ができると習いました。GRUやLSTMが出る前に色々試行錯誤された手法の一つらしいです。
今回のとはちょっと違うみたいです。
@AIcia_Solid 3 года назад
なるほど！
そんなのがあるんですね！
ありがとうございます！🎉
今回のはそれとは少し違います！
誤差逆伝播の伝播範囲が狭いという感じです✌️

Следующие

Автовоспроизведение

【深層学習】word2vec - 単語の意味を機械が理解する仕組み【ディープラーニングの世界 vol. 21】#089 #VRアカデミア #DeepLearning

【深層学習】word2vec - 単語の意味を機械が理解する仕組み【ディープラーニングの世界 vol. 21】#089 #VRアカデミア #DeepLearning

【深層学習】GPT - 伝説の始まり。事前学習とファインチューニングによるパラダイムシフト【ディープラーニングの世界vol.31】#109 #VRアカデミア #DeepLearning

【深層学習】GPT - 伝説の始まり。事前学習とファインチューニングによるパラダイムシフト【ディープラーニングの世界vol.31】#109 #VRアカデミア #DeepLearning

【Deep Learning研修（発展）】系列データモデリング (RNN / LSTM / Transformer)　第４回「RNN」

【Deep Learning研修（発展）】系列データモデリング (RNN / LSTM / Transformer)　第４回「RNN」

Demetrious Johnson Trains w/ KHABIB & ISLAM MAKHACHEV! | EXCLUSIVE FOOTAGE!

Demetrious Johnson Trains w/ KHABIB & ISLAM MAKHACHEV! | EXCLUSIVE FOOTAGE!

Felix "Unfair" | [Stray Kids : SKZ-PLAYER]

Felix "Unfair" | [Stray Kids : SKZ-PLAYER]

The White Lotus Season 3 | Official Teaser | Max

The White Lotus Season 3 | Official Teaser | Max

NEW DRAGON HUNTER NPC FULL GUIDE | DRAGON HEART QUEST? | Blox Fruits...

NEW DRAGON HUNTER NPC FULL GUIDE | DRAGON HEART QUEST? | Blox Fruits...

【深層学習】GPT-2 - 大規模言語モデルの可能性を見せ、社会もざわつかせたモデルの仕組み【ディープラーニングの世界vol.33】#113 #VRアカデミア #DeepLearning

【深層学習】GPT-2 - 大規模言語モデルの可能性を見せ、社会もざわつかせたモデルの仕組み【ディープラーニングの世界vol.33】#113 #VRアカデミア #DeepLearning

今話題のTransformer徹底解説【Vol.1】

今話題のTransformer徹底解説【Vol.1】

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

【深層学習】Attention - 全領域に応用され最高精度を叩き出す注意機構の仕組み【ディープラーニングの世界 vol. 24】#095 #VRアカデミア #DeepLearning

【深層学習】Attention - 全領域に応用され最高精度を叩き出す注意機構の仕組み【ディープラーニングの世界 vol. 24】#095 #VRアカデミア #DeepLearning

【深層学習】畳み込み層の本当の意味、あなたは説明できますか？【ディープラーニングの世界 vol. 5 】 #057 #VRアカデミア #DeepLearning

【深層学習】畳み込み層の本当の意味、あなたは説明できますか？【ディープラーニングの世界 vol. 5 】 #057 #VRアカデミア #DeepLearning

【深層学習】word2vec の数理 - なぜ単語の計算が可能なのか【ディープラーニングの世界 vol. 22】#090 #VRアカデミア #DeepLearning

【深層学習】word2vec の数理 - なぜ単語の計算が可能なのか【ディープラーニングの世界 vol. 22】#090 #VRアカデミア #DeepLearning

【深層学習】BERT - 実務家必修。実務で超応用されまくっている自然言語処理モデル【ディープラーニングの世界vol.32】#110 #VRアカデミア #DeepLearning

【深層学習】BERT - 実務家必修。実務で超応用されまくっている自然言語処理モデル【ディープラーニングの世界vol.32】#110 #VRアカデミア #DeepLearning

Attention in transformers, visually explained | DL6

Attention in transformers, visually explained | DL6

GPTとは何か Transformerの視覚化 | Chapter 5, Deep Learning

GPTとは何か Transformerの視覚化 | Chapter 5, Deep Learning

Акмаль круто перепел Пугачеву😍

Акмаль круто перепел Пугачеву😍

Корги борется с лишним весом

Корги борется с лишним весом

Встречаем 2025 с Паша Техник, CMH, Федя Букер и Magnum Opus #VSRAP2025

Встречаем 2025 с Паша Техник, CMH, Федя Букер и Magnum Opus #VSRAP2025

Can You Guess The Fake Ball?

Can You Guess The Fake Ball?

Лучший подарок на Рождество

Лучший подарок на Рождество

Sigma Boy $1,000 Impossible Wave Spam Challenge!

Sigma Boy $1,000 Impossible Wave Spam Challenge!

Неожиданный подарок для братика #iribaby #shorts

Неожиданный подарок для братика #iribaby #shorts