【解説】10分で機械翻訳を理解する - Transformer

Поделиться
HTML-код
  • Опубликовано: 6 сен 2024
  • Google翻訳に代表される機械翻訳の中身について解説します。Googleの論文であるAttention is All You Needを眺める機会があったので、主にTransformerについて説明しています。
    Twitter: / yoidea

Комментарии • 128

  • @うめはち
    @うめはち 3 года назад +220

    問題)6分18秒が10分になるのは何進法?
    ❌6.3進法
    6分18秒=6.3分(10進数)=10分(6.3進数)
    (誤答理由)
    6.3分とは、1分の束が6束と1/60分の束が3束あるという意味ですので、10進法ではなく60進法です。
    これでは1分=6.3秒なので、
    10分(6.3進数)=63秒=1分3秒(60進数)
    になってしまいます。
    ⭕37.8進法
    6;18(60進数)=378(10進数)=1;000(378進数)
    =2;000(189進数)=10;00(37.8進数)
    6分18秒が60進数であることを意識すれば、
    1分=37.8秒になるような進法だとわかるので
    37.8進法が答えだと分かります。

    • @user-es4ug4gl8b
      @user-es4ug4gl8b 3 года назад +7

      このコメ伸びてww

    • @kazato333
      @kazato333 3 года назад +1

      10分(37.8進数)=37.8分(10進数)になっちゃうから、1分が37.8秒(10進数)なら10分(37.8進数)は1428.84秒(10進数)になっちゃうような

    • @kazato333
      @kazato333 3 года назад +1

      √63進数が正解じゃないかと
      1分=60秒(√63進数)=6√63秒(10進数)
      10分=√63分=√63×6√63=378秒(10進数)

    • @user-xe7dl2fo1d
      @user-xe7dl2fo1d 3 года назад +4

      難しい

    • @Sraver
      @Sraver 3 года назад +4

      6進法での10分が10進法での6分
      7進法での10分が10進法での7分なんだから、6〜7の間の何進法なのかくらいは分かるやろ笑

  • @ajinori2941
    @ajinori2941 3 года назад +93

    「10分で分かる」より
    「6分で分かる」の方が凄いのにわざわざ6進数にするの最高にすこ

    • @lambdatech
      @lambdatech  3 года назад +69

      こうすることで先にサムネとタイトル作れるんですよ

    • @ajinori2941
      @ajinori2941 3 года назад +18

      @@lambdatech 革新的過ぎる

  • @____Nw
    @____Nw 4 года назад +27

    なんとなく分かったような気になれる動画をつくってくれる主
    人に説明とか絶対にできないけど

  • @AA-nc6dt
    @AA-nc6dt 4 года назад +118

    DeepL翻訳の精度えげつい

    • @user-fi2og6wr7v
      @user-fi2og6wr7v 3 года назад +10

      今までGoogleが最強とか思ってたけど初めてDeepL使った時は人間が翻訳してんじゃ無いか心配になった

    • @espresso5324
      @espresso5324 2 года назад +3

      DeepLって長文でかけると内容が重複したり、脱落したりするから細切れで翻訳するのが良い。
      脱落するのはマジでやばいからDeepLが最強とも一概にはいえない。

  • @RR59235
    @RR59235 4 года назад +143

    10分(6程度)

  • @810gami00
    @810gami00 4 года назад +65

    「単語ベクトル」って聞いてウヘェ、ってなったけど、そもそも線形代数で扱ってうまくいくのなんでやねん(笑)。

    • @810gami00
      @810gami00 3 года назад +2

      @@Marshey あれから僕も考えていましたが、やはり「線形代数で考えるのが人間にとって分かりやすいから」という結論に達しました。非線形系だと解析的な困難もあるようですし。

  • @papilioulysses6764
    @papilioulysses6764 4 года назад +7

    唐突なポケモンで
    分かりやすさが上がったの凄い

  • @user-sm1jm8cc3q
    @user-sm1jm8cc3q 3 года назад +10

    読んだとは言えませんが眺めたので、っていう表現が謙虚で素晴らしいですね。
    ベクトルとか行列まではふーんと思いながら聞けたけど、つながりを考慮するあたりから数学なのかわからなくなりました、

  • @22eypy
    @22eypy 4 года назад +14

    単語ベクトルのイメージが、ポケモンの種族値風にHAB…Sなの良き
    高校で行列の意味分からんかったけど、種族値からポケモン分かるあの感じかってなった

  • @HEADJOCKAA
    @HEADJOCKAA 2 года назад +4

    日本の翻訳者の悪い所は「原作者よりも自分のほうが文才がある」という驕りがある事。「ばかっぽい言葉遣いに改変して可愛くしてやろうかな、ぐへへ」みたいな事が過去にたくさんあり、自動翻訳の進歩によってはその辺が是正されていくだろうなあ、という期待を持っています。

  • @lilu8738
    @lilu8738 3 года назад +48

    ほんと、ASMRなんかよりもよく眠れる(死ぬほど文系)

    • @lambdatech
      @lambdatech  3 года назад +28

      活用してください

  • @user-zl6oz1yc7d
    @user-zl6oz1yc7d 4 года назад +285

    この人6進数で生きてんのか

    • @user-xk1fn4hg8m
      @user-xk1fn4hg8m 4 года назад +39

      6進数で生きているならその「6」進数も「10」進数なのか…

    • @mentosukoala
      @mentosukoala 4 года назад +11

      jon jon ややこしや

    • @user-uu2zt7bs9h
      @user-uu2zt7bs9h 4 года назад +4

      イチゼロ進数(6進数)

    • @mentosukoala
      @mentosukoala 4 года назад

      ケイルワイージ え、いまカッコの中でなんていった?

    • @user-uu2zt7bs9h
      @user-uu2zt7bs9h 4 года назад +2

      oto oto (6進数)の6も1 0進数と表すべきでしたね。((6進数))

  • @sshhiioo
    @sshhiioo 4 года назад +31

    途中で置いてかれたけど、なんか凄いんやな

  • @user-wo3yc6sk3x
    @user-wo3yc6sk3x 4 года назад +4

    Decoder の入力部分は、masked attentionになっていて、先をマスクすることで、mono directional になっている。Birtは、このmono dirなデコーダ部分を取っ払い、bidirectionalなエンコーダのattention部分をうまく学習させたこと

  • @user-pe6wf3ri3s
    @user-pe6wf3ri3s 4 года назад +92

    DeepLのほうが好き

    • @user-zd5pb9jn1z
      @user-zd5pb9jn1z 4 года назад +8

      DeepLまじですごくて感動した

    • @tsicsafjapan9371
      @tsicsafjapan9371 4 года назад +21

      直訳するならgoogle翻訳、意訳するならdeepLの印象。

    • @user-lo4ri4hi9c
      @user-lo4ri4hi9c 3 года назад +2

      DeepL無茶苦茶大好き

  • @linp_in
    @linp_in 4 года назад +18

    ページ数は6進数で表示しないんですね

  • @user-tv5gx3oe7d
    @user-tv5gx3oe7d 3 года назад +4

    本来、
    秒から分へは60進数
    10分という表記は10進数ですね
    今回の10分という表記に使われた進数を考える時、上記の2つの進数がそれぞれ何かを考える必要があります。
    ここで、
    2つの整数n,mを用いて(n.m>1)
    秒から分がn進数
    10分という表記がm進数
    とおきます。
    (n.mは10進数と考えます。)
    この時、
    1分=n秒
    10分=m分
    となります。
    (10分というのは1から数えてm番目の整数分ということです。)
    つまり、10分というのはn×m秒ということになります。
    この動画はn=60,m=10の時、6分18秒なので、378秒であることが分かります。
    378=2×3×3×3×7
    なので、
    (n,m)の組み合わせは14通り考えられます。(n.mのどちらかが1となる組み合わせを排除したため)

  • @user-bb2mc6cb2s
    @user-bb2mc6cb2s 4 года назад +25

    速度を0.75倍にすると聞き取りやすい

    • @user-mh7dz9bo4g
      @user-mh7dz9bo4g 4 года назад +19

      そうしたらだいたい10分やな

    • @Penguin-Goat
      @Penguin-Goat 3 года назад +2

      10進数の世界へようこそ

  • @koheinakatsu2014
    @koheinakatsu2014 3 года назад +2

    言語を行列式で表すという発想が凄いです。。

  • @user-kp9df8yf3z
    @user-kp9df8yf3z 2 года назад +3

    人工知能関連(特にディープラーニング関連)のおすすめ書籍があれば教えて欲しいです!
    入門でもかなり専門的なものでも助かります!!

  • @HK-bq4zz
    @HK-bq4zz 4 года назад +3

    とてもわかりやすい〜!

  • @user-hb3rl6ze5o
    @user-hb3rl6ze5o 5 лет назад +7

    面白い!
    ざっくり分かった気がする!

  • @KanimisoKing
    @KanimisoKing 4 года назад +2

    これつまり、Is this a penとThis is a penで出力される文章が同じになってしまうんじゃね?って思ったんだけど

  • @moroha10085
    @moroha10085 4 года назад +117

    多分6進数だな()

    • @xy8066
      @xy8066 4 года назад +2

      なんのコメント?って思ってたら動画時間見て納得

    • @user-bq6dn7ru6z
      @user-bq6dn7ru6z 4 года назад +6

      マジレスするとこの動画を6分だとすると5進数

    • @moroha10085
      @moroha10085 4 года назад +3

      @@user-bq6dn7ru6z 言われてみれば、そうか。

    • @user-bq6dn7ru6z
      @user-bq6dn7ru6z 4 года назад

      ぼくもここで1回つまずいたことがあるので…

    • @user-gs6zc1ec6l
      @user-gs6zc1ec6l 4 года назад +8

      @@user-bq6dn7ru6z 10進数は
      0〜9までの10種類で、十になる時に桁が上がる…
      てことは、6に行く時に桁が上がるから6進数では…?

  • @Dalai_Mala_810th
    @Dalai_Mala_810th 3 года назад +3

    クッソ分かりやすくて草
    言語は必ずしも文系領域ではないってはっきりわかんだね

  • @harumiffy
    @harumiffy 3 года назад +1

    10分解説が8分で盛り上がるコメント欄が好き🎵
    とあるチャンネルでは10分とサムネイルに書きつつ、23分の規模になり非難ごうごうのコメント欄に辟易した
    更に投稿者がコメント固定して「説明以外のおしゃべりを除けば10分程度だから間違ってない‼️」と苦しい言い訳が更に焚き付けとなり、グイグイコメント伸びてて大草原
    つまりは日本語翻訳って大変なんだと思った。

  • @seasidelabel
    @seasidelabel 3 года назад +1

    とても分かりやすいですね。みなさんは十分理解出来ましたか?

  • @user-yr9de3ok6h
    @user-yr9de3ok6h 4 года назад +1

    楽しく学ばせてもらってます🍀

  • @norinori8988
    @norinori8988 3 года назад +1

    なるほど!
    つまり単語をエンコードする事で、車が人型ロボットにトランスフォームするって訳か~

  • @vincent-uh5uo
    @vincent-uh5uo 4 года назад +4

    I am a beginner of NLP and Japanese then youtube gives me this

  • @user-ut7vr5qd2w
    @user-ut7vr5qd2w 3 года назад +1

    会話bot作ろうとして文脈を感情パラメータを付けて判別させようとしてたなあ…単語ベクトル使えば簡単かつ感情より正確じゃん…

  • @user-cz7zo1ti1b
    @user-cz7zo1ti1b 4 года назад +1

    これ最初に思いついた人凄いなあ

  • @uncertainty
    @uncertainty 3 года назад

    "tags": [
    "ラムダ",
    "ラムダ技術部",
    "理系",
    "プログラミング",
    "情報",
    "人工知能",
    "雑学",
    "機械学習",
    "word2vec",
    "ベクトル",
    "数値化",
    "単語"
    ]

  • @user-es4ug4gl8b
    @user-es4ug4gl8b 3 года назад +13

    google翻訳はわかったけど
    deepLってどんな手法で翻訳してんだあれ

    • @user-es4ug4gl8b
      @user-es4ug4gl8b 3 года назад +6

      @a 俺が言いたかったのは同じ手法ならなんであんなに精度が差が出るんだろうってことね

    • @Penguin-Goat
      @Penguin-Goat 3 года назад

      @@user-es4ug4gl8b わかりみ

  • @northsouth575
    @northsouth575 3 года назад

    音声関係の話なんかも取り上げて欲しいです
    例えばバ美肉とか
    声の変換も似たようなもんなんだと思いますが

  • @A_Grounded_Outlet
    @A_Grounded_Outlet 2 года назад +1

    こんにちは。今回は、今回の動画の冒頭で、10分で機械翻訳を理解する(※"10分"は10進法ではない可能性があります。)と書かれているので、何進数なんだということを求めていきたいと思います。
    まず、動画の長さが10分だったら良いなと思いつつ、動画の長さを見てみます。すると、案の定6分18秒となっていました。というわけで、取りあえず、6分18秒を分変換していきます。
    (6×60+18)÷60=6.3
    この動画の長さが6.3分ということが分かりました。
    ここから、?進法なのかを求めていくわけですが、二進法を例に考えてみましょう。二進法では、
    (01)2=(1)10
    (10)2=(2)10
    という式が成り立ち、10進法で2になったとき、2進法で繰り上がることが分かります。同じように考えていくと、
    (10)6.3=(6.3)10
    という式が成り立ちます。
    こんな感じで求めていくと、10分というのは正しくは(10)6.3分ということが分かり、6.3進法で表記されていることが分かりました。もしかしたら間違っているかもしれないので、是非皆さんも試してみてください。

  • @tolennon5935
    @tolennon5935 4 года назад +1

    スゴい。感動した

  • @Penguin-Goat
    @Penguin-Goat 3 года назад +1

    なんかわからんけどエクセルで翻訳機作れないかと思ってたワイは背伸びしすぎてたってことかな

  • @user-ui7gm8fw4q
    @user-ui7gm8fw4q 3 года назад

    人間の脳細胞、シナプス回路の模倣と感じました。「本」、「猫」、「これ」、「です」、などは神経ニューロンの何個かに分散記憶されているはず、これが単語ベクトル、エンコーダーとはシナプス結合シミュレーション、デコーダーとは発声回路シナプス回路、、、、神経細胞層は何層にもあるので重ねている、、、などと想像しました

  • @xxojiyaxx
    @xxojiyaxx 3 года назад

    4分を過ぎた辺りで睡眠系の呪文を唱えだしてますよね?
    何回見ても4分から先に進めないんですけど
    残りの2分を見れるようにしてください

  • @CinnamonSea2073
    @CinnamonSea2073 4 года назад +12

    0:05
    いちぜろふん
    10進数じゃ無くて草

  • @tyannneru
    @tyannneru 2 месяца назад

    chatgptの前身ってことか…

  • @user-zx6de9gh1b
    @user-zx6de9gh1b 3 года назад

    理解できた

  • @user-gr7fx6vg9y
    @user-gr7fx6vg9y Год назад +2

    めちゃわかりやすく説明してて、びっくり〜(о´∀`о)
    G検定勉強してますが、おぉってなりました
    ありがとうございます✨

  • @eeeg
    @eeeg 4 года назад +4

    10分!?

    • @user-or2uw2dr3d
      @user-or2uw2dr3d 4 года назад +6

      ※ただし10進数とは限らない

  • @hirohidetokoro9423
    @hirohidetokoro9423 3 года назад

    全然まだ初めの段階で聴いてなくて恐縮ですが、元データって?プロ訳者の打ち込んだデータの気がしますが?違ってたら失礼します。版権ってどうなるんだろう?ありがとうございました。

  • @user-uo3ge6qg2c
    @user-uo3ge6qg2c 3 года назад +1

    3倍速で見たから2進数ってことかな

  • @dm_99
    @dm_99 4 года назад +1

    要するに6進数で10分ってことなんですね...

  • @jamon6940
    @jamon6940 4 года назад +15

    わからん

  • @mikamatsuura3561
    @mikamatsuura3561 4 года назад +2

    行列?ラーメン?

  • @kosetei1
    @kosetei1 4 года назад +3

    注意っていうより注目では

  • @Ilikekaf
    @Ilikekaf 4 года назад +20

    6分って言えばいいやんwww

    • @fo__ga
      @fo__ga 4 года назад +1

      だいたい10分ってことじゃない?

    • @Ilikekaf
      @Ilikekaf 4 года назад +1

      @@fo__ga 冒頭的に6進数かな
      一応説明しておくと、(専門的な知識は全くないのでご了承ください)いつも使っている「123」は10進数で、1×10²+2×10¹+3×10º=123とされている。
      しかし、6進数で「123」とは10進数に直すと1×6²+2×6¹+3×6º=51を表すのです。
      ただ123と言うと紛らわしいのでイチニサンという言い方をします

  • @now7017
    @now7017 4 года назад

    エンコーダー重ねるのは言語によって応用きかせるため?
    誰か詳しい人!

  • @user-xe7dl2fo1d
    @user-xe7dl2fo1d 3 года назад +1

    10 が10進法ではないと見て、何進法か分からなくなった。

  • @internodd29
    @internodd29 4 года назад +1

    続編希望

  • @村田愼一
    @村田愼一 4 года назад +1

    《自己注意》は「内省」かな?

  • @taiki7826
    @taiki7826 3 года назад +1

    下の赤文字の存在感

  • @user-nq3uz6in6m
    @user-nq3uz6in6m 4 года назад +3

    こういう語句ってどこで学べるのか知りたいです!

  • @ご当地走り研究所
    @ご当地走り研究所 4 года назад +1

    いやー凄いっすね(^^;;

  • @xy8066
    @xy8066 4 года назад +5

    理系かつ情報系だからスラスラわかるけど、文系の人にはキツそう(偏見

    • @dm_99
      @dm_99 4 года назад +8

      地味に自分賢いですよアピールしてて草
      まぁ僕もスラスラわかるけど⭐︎

    • @T_A_K_O_
      @T_A_K_O_ 4 года назад +5

      まあ噛み砕いて説明してるからある程度知識があれば余裕だよな
      俺はわからんけど

  • @eeeeeeeezummoney
    @eeeeeeeezummoney 7 месяцев назад +1

    高評価数を1918から1919にしてしまった……

  • @ZOZO-mw2sc
    @ZOZO-mw2sc 5 лет назад +5

    動画とは関係ないですが、神戸高専から大学編入されたんですか?

    • @lambdatech
      @lambdatech  4 года назад +9

      神戸高専から工学部編入ルートです

  • @sheat
    @sheat 4 года назад +5

    10は確実に10進数やない?この10進数の10が何進数かわからんけど。

    • @dakiba_2562
      @dakiba_2562 4 года назад +2

      10[じゅう](書き方が10で読み方が10)は確実に10進数ですが10[いちぜろ]は何進数かわからない、、、はずです

    • @taiten0807
      @taiten0807 4 года назад +3

      ???
      2進数で2がどう書かれるか知らんのかな

    • @xy8066
      @xy8066 4 года назад +1

      じゅうではなく、イチゼロの方が理解しやすいですね。
      ジュウという数に対応する記号はAです。11進数以上ではこれが採用されてます。

    • @Gajum4ru
      @Gajum4ru 4 года назад

      くわわ n進数のnは10(A)進法で書くんやで

    • @taiten0807
      @taiten0807 4 года назад

      ガジュマル 俺はコメ主のそっち(後者)の話してない!前者のほう

  • @user-ln8eo4fl1h
    @user-ln8eo4fl1h 4 года назад +1

    機械語かと思った

  • @g.s.89
    @g.s.89 4 года назад

    10(n)=n(10)

  • @yu100nabeyan
    @yu100nabeyan 3 года назад

    あーなるほどね。うんうん。わかるー(思考放棄)

  • @user-xe7dl2fo1d
    @user-xe7dl2fo1d 3 года назад

    何進法だよ!

  • @ay-oha
    @ay-oha 4 года назад

    うーん、わからん。

  • @qdkqdk
    @qdkqdk 3 года назад

    なんでこの人加減算苦手なんや。