【深層学習】fasttext - 単語の内部構造を利用した版 word2vec 【ディープラーニングの世界 vol. 25】
HTML-код
- Опубликовано: 8 апр 2021
- ▼テーマ
subword を利用することで、単語の内部構造を利用して単語埋め込みを作ります。
ほぼ word2vec なのに性能良くなる & 言語によって改善幅が違うのがおもしろポイント!
▼関連プレイリスト
Deep Learning の世界 • Deep Learning の世界
自然言語処理シリーズ • 自然言語処理シリーズ
▼目次
(後で追加します。暫くお待ちください)
▼参考文献
Bojanowski, Piotr, et al. "Enriching word vectors with subword information." Transactions of the Association for Computational Linguistics 5 (2017): 135-146.
direct.mit.edu/tacl/article/d...
現論文です。この中の pdf というボタンを押すと読めます。
言語別比較はとっても面白いので、ぜひ見てみてください!
【2019年版】自然言語処理の代表的なモデル・アルゴリズム時系列まとめ - Qiita qiita.com/LeftLetter/items/14...
いろいろこれを参考にして動画を作っています
▼終わりに
ご視聴ありがとうございました!
面白かったら高評価、チャンネル登録お願いします。
動画の質問、感想などは、コメント欄やTwitterにどうぞ!
お仕事、コラボのご依頼は、TwitterのDMからお願い致します。
動画生成:AIcia Solid (Twitter: / aicia_solid )
動画編集:AIris Solid (妹) (Twitter: / airis_solid )
=======
Logo: TEICAさん ( / t_e_i_c_a )
Model: 3d.nicovideo.jp/works/td44519
Model by: W01fa さん ( / w01fa ) Наука
字と図がきれいですね
ありがとうございます(^o^)
元データの量が少なくてもある程度の精度確保しやすいのすごいなぁ
subwordも学習させることで効率はより上がる可能性があるし未知語に対応できるチャンスもあるんだなあ…
今まで早く学習できるとしか考えてなかったけど内容がわかりやすかったので少し理解できた気がします。
ありがとうございました。
そういっていただけると何よりです😍
是非活用してあげてください!🎉
大学受験で英単語覚えるのに、subwordを意識してたのを思い出しました。
漢字は表意文字なので、一文字の中に含まれる文字や部首にベクトルつけるとメチャ強くなりそうな予感
人間がやってることを素直に応用すると精度向上したりするのが深層学習の面白いところです🎉
漢字についても、そういう研究がありますよ!
最近は、そもそも入力を文字画像にして分析する手法なんかもあったりします😋
Gensim のword2vecで精度に不安があったのでfasttextを利用してみます。ありがとうございます。
お試しあれ!😋
ただ、日本語でどこまでよくなるかは半信半疑です!(文字数が多いのと、単語がそもそも短いので、、、!)
ただ、 Deep Learning は何が起こるか分かりませんし、試してみる価値は大です!
最近word2vecについて細かく勉強したのですごく面白かったです
強化学習について解説する予定はありますか??
ご視聴コメントありがとうございます😊
あります!
NLP の次は生成モデルか強化学習か、どちらかをやろうと思っています✌️
毎度、分かりやすい解説ありがとうございます!予習復習に活用させて頂いております。
自然言語処理編で今後GloVeやELMoについて解説する予定はありますか?
ご視聴コメントありがとうございます!
ぜひご活用ください!🎉
ELMo は扱う予定ですが、 GloVe は割愛予定です😭
要望が強ければどちらもやります~!(^o^)
ようやくシリーズすべてを視聴しました。たぶん10%くらいしか理解できていないのでしょうが^^;、こういうことを知って使うのと、知らずに使うのとでは雲泥の差があります。fasttextもなんとなく学習が速そうだから使ったくらいでしたが、こんなすごい技術だったとは。どの動画もとてもためになりました。作ってくれてありがとうございます。博士課程のも素敵でした^^
ご視聴コメントありがとうございます!
そして全視聴ありがとうございます😍🎉🎉
お疲れさまでした!🎉
博士の方もみていただいてありがとうございます😊✌️
面白かった
ありがとうございます😊
良き
でしょ😎
単語ベクトルは人工知能の文字コードのようなもので翻訳などで使用時に文字コードを学習済み単語ベクトルに変換される?
コメントありがとうございます(^o^)
なにか混乱させてしまったでしょうか、、、?🤔
もしご質問あればご遠慮なく!
すごーーい!!つよつよ\(^o^)/
でしょー!(^o^)
他の動画もぜひ!☆
日本語だとどうなのだろう?
どうなのでしょうね🤔
実験などもたくさん出ているので、ぜひ調べてみてください😋