Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
❌人口⭕人工
いつも予測変換のまま間違えますwすいません
予測変換を強化学習
強化変換を予測学習
予測強化を変換学習
強化学習を予測変換
5:10あたりのすげー速度で右に行く子かわいい
5:07 同じ「バランスを取ること(生き残ること)」が目的でも、その方法に個性が生まれてくる、、、生物の進化みを感じるぜ
強化学習の動画見るといつもナルトの修行が思い浮かぶ
教子の部屋〜ニュートンのゆりかご〜 多重影分身で成果共有するアレか
3重振り子についてはウチの研究室でも話題になっていたので、ぜひ完成させて欲しいです!
関節に少し抵抗を与えてみれば多少安定するのでは?
初めて見た強化学習で「報酬」って言ってたけど見てたら何が言いたいのかは何となく分かってたけど説明しろって言われると無理。2:44アリガタヤー
コージさんの強化学習ほんと面白いなぁ…と思いつつふと呟きたいことを。強化学習は万能のように感じますが今回の様にまだ苦手なことも多いです。大学レベルの物理になると強化学習ではまだ解けないような問題を人の知恵と理論によって解いた本当にすごい研究や論文等がたくさん出てきます。これまでの物理学者のとてつもない努力をひしひしと感じ先人の知恵に唖然とする中で、人工知能の可能性とそれらの相乗効果にワクワクしっぱなしの毎日です。つまり、受験生頑張れ!笑(特に理系)この世界を外から見て面白いと感じるなら、飛び込むと更に面白いぞ!今年受験じゃない人も同じ。どうせ知るなら基礎から。コージさんの動画をモチベーションにして、その根幹にある世界を見に来よう!
5:05問題児居て草
前から三番目「コンビニ行ってくる」
呪 /えるみづ 尊師で草
やるしかGO!(ジョジョ)
奇行種だ!
スピード感与えちゃったかな。
0:22実は逆再生動画だったら草
zxc1524 維持できなかった動画は草
センスある
もしそうなら最後に全く揺れてないから諦めきってて草
AI達に可愛いという感情を抱いてしまった
二重振り子でもあれだけ安定させられるのは素直にすげぇなぁと思った
動画の最後のあれに三重ふりこが追加される時を願って
随分遅い新年の挨拶ですねwあけましておめでとう⛩
強化学習好きなのでもっと上げてくれると嬉しいです
リンクの材質長さが同じ、多重振り子の制御は機械学習でなくとも難しいです。各リンクの固有振動数が同じであるため、あるリンクをコントロールする制御入力が他のリンクの動きに影響を強く与えます。リンクの長さや質量を調整して、リンク間の固有振動数をずらせば、うまくいきやすいかと思います。
お、これか! 冒頭の三重振り子のバランスロボは凄いですね。演算での結果が、一重から二重振り子でこんなにもかかる時間が違うとなると、三重振り子が完成するのって…かなり掛かりますよね(;'∀')またいつか、結果が出る時を期待してます。お疲れ様です。
1:00 毎回NARUTOの影分身特訓思い出す
めちゃめちゃわかるw
愛すべき個性ですね(笑)あけおめでございます(^^今年も動画楽しみにしてます〜✨
ほぉーと感心してるところでさらっとコマーシャルしてた(OvO)
こーじさん毎回面白い❗
あけましておめでとうございます! 真ん中でうまくやってるコのそばで行ったり来たりして、あたふたしてる子が可愛くて笑いましたw
投稿まだかなーって思ってたら丁度きた😲
5分くらいで成長って、初期の数値の設定が上手いだけでしょ...僕がやったらとんでもないこと起きますよ、いいんですかね?
人口70億人の知能を合わせてすればなんとかなりそう。
バカがいたらどうすんだ
@@ラブピコ9 それ馬鹿いらないやつで笑う
@@鐘-g7c バカと天才は紙一重つまりバカもなかなか馬鹿に出来ない
@@with3557 既にバカなのに馬鹿に出来ないという矛盾いやまて、これ以上パラメータを下げようがないと考えれば矛盾にはならないのか?
@@SATOU-Kan バカを下げると数値がオーバーフローして天才になってしまう
今度は強化学習で釣りをAIにやらせてほしいです。釣り人:気合で魚を釣りあげる魚 :何とかして釣られないように逃げる両者はお互いに糸でつながってて、互いに引っ張り合っている。魚と釣り人がある程度離れると糸が切れて、魚の勝利、釣り人の敗北。魚と釣り人の距離が0になると魚の敗北、釣り人の勝利。引っ張り続けると疲労度が増加して、引っ張る力が弱くなる仕様があれば多分面白いかも
うぽつです動画面白かったです今年も宜しくお願いします
キーホルダー買おうかな
あけおめぇぇえぇ
棒読みちゃんのSUGEEEEEEEなんか好き。何回かそれだけ聞くために動画巻き戻した。
制御方法は強化学習では無いとサラッとやばい事言ってて草
ローリングスカイガチ勢 強化学習の方が難しいと思うなぁ多分三重振り子を維持する理論があるんだと思うどちらにせよ制御できるのはやべぇ
トロタマ あのツイートのリプで見たんですが、多重ふりこはほんの僅かに位置や角度などの条件が違うだけで数秒後には全く違うバラバラな動きをする、っていうので挙動の予測は不可能と言われてるらしいですこーじさんが出した10連ふりこの動画見ると面白いです
三重振り子の完全な制御は現段階では不可能と言われてた筈元動画がマジならかなり凄い話
時間経過と共に系がカオスになりますが初期時間においては一応可制御ですよ
@@トロタマ-o5v まじかけれど時間掛ければできるようには成るんだろ?無知ですまんが。
二重振り子すら難しいのに三重ではもう理解不能です。さて、今回の学習の事ですが入力情報を数フレーム前の情報も加えてみてはどうでしょうか?現状の棒が大きく動いている途中か否かが、結果に反映されるような気がします。次回の動画も、楽しみにしています。
あけおめ〜
多重振り子の場合は、それぞれの振り子の共振周波数を変えないと成立しません。
こーじさん、質問ですUnityをやっているのですが強化学習はどうすれば導入出来るのですか?
あけおめー
こーじさんあけおめ!!!
待ちに待った
三重振り子いつか完成させて下さい。楽しみにしています。
三重振り子楽しみですねー 進捗待ってます!!!
(角)速度情報も報酬に含ませるといいかも知れませんね。少なくとも制御理論における倒立振子の問題は全ての可動部分の座標と速度の組(のうち独立なもの)を目標の値にまでもっていく問題として解かれていたハズです。
タイムリーなネタですね助かる助かる
誰かの研究結果の続きを別分野の人がやるのすごく科学してる
パーカーほしぃー✨キーホルダーもホシィ
すげぇ3重振り子だと、長さを変えないとできないって聞いたことがあります。(現代制御理論を専攻していた人から)
実際は関節の部分で若干の摩擦が起こって動き辛くなってるのかも知れませんね物理演算だと滑らかに関節が曲がるから立たせにくいのでは
関節に摩擦を与えたらいいんじゃない?(三重振り子の場合)
あけおめー( ´ ▽ ` )ノ
この前スキーに行って気になったのですが、スキー場のリフトが乗るときと降りる時に遅くなって、でも移動中の速度は速いまま変わらない仕組みを知りたいです!
リフトの速度は基本的には変わらなくてもしかしたら自分の乗る時だけ遅くして貰えてるのかもとか言おうとしたんですけど、前にゴンドラに乗った時にゴンドラの速度は変わらないけど上のぐるぐるにレールがついててゴンドラに乗れるようになるって言うのがあって気になった
単純に別の軌道に移っているだけかと
@@glayzoneeste8526 …あ、そういうことですか!上手いこと弛めたり遠回りして調整しているものだとばかり思い込んでました…ありがとうございます!
学習が完了した時に表示される動きはリアルタイムでコンピュータが状況判断しているのでしょうか、それとも学習の結果として出された動きを完全にシミュレートしているのでしょうか
人間のバランサーも再現出来ますかね…?
2重振り子でバランスとってるAI見てるとゲーム「Euro Truck Simulator2」でトレーラーのバック入庫している時の感覚を思い出しました。普通車のバック入庫もややこしいですがトレーラートラックの場合、トレーラーヘッドを大きなタイヤに見立てて運転するという入れ子構造の視点を持つと出来るようになりました。もちろんそれだけ先読みや緩急が要りますが・・・2重振り子の学習結果をもう一本の棒の上で実現するという段階学習をしてみては?
5:07 奥から3番目「コンビニ行ってくるぅーっ!」
投稿本数100ポンテことは3日に一本か、楽しみだなぁ
概要欄読んでくれてありがとうございます😊
やっぱりモデル制御が計算量少なくて精度いいんでしょうかね。制御工学ってすごい。
2:44 言ってしまえば人間のドーパミンもただの物質だよね...
初動が左でも良い、って気づく個体がいるのも面白いよね。
おもしろかったです。
この時点で人間を超えてきている
三重振り子のことで質問なのですけど一つ一つに真上を向いたら報酬、横は0、下に向いたらー1にしたら良いのでしょうか
学習していく様子をノーカットとかで見てみたいです
物理エンジンだと、摩擦がなくて静止することが不可能になってしまうので、僅かに軸と棒の間に摩擦をつけてはどうでしょう?
久しぶりにこういう系キター
報酬の与え方が難しいとおっしゃってますが、その与え方も人工知能に任せたら面白そうですね。まあ、時間かかりそうですけど
振り子かわええ
こーじの頭のぼこぼこがマグネットでくっ付くこーじマグネットアフロマスコットとか作れませんか?
おかえりなさいの子が一番可愛い、ウチで飼いたい
言ってることがよくわからん…これを理解して説明できるってすごいよな。
物理エンジンでやってみて欲しい事があります。普通人間は急な坂を登れませんよね?でも大体の坂は断面が平坦です。↓(こんな感じに切ると)◢ ▅(こんな断面になるように)↓ならば👢こんな感じで足をのせれば▅ どんな坂でも登れるんじゃないでしょうか?これってコジビアになりませんか?
暇すぎる時の為のリアル練習用作ってみよかなけん玉並みの競技に育つかも?
これ評価と報酬は同じままで人間が手動操作で参加あるいは動画冒頭のような機械が参加する台を少数混ぜると学習速度(上達?)はどう変わるんだろ ?
人工知能じゃ...
通知キターー!!
強化学習のたくさんのサンプルを見るたびにナルトの多重影分身修行が思い出される
影分身の術って、すげぇ理にかなってたよね。
報酬を節ごとに区切って立った時の状態を場合分け(1つめの節までたった時と2つ目の節までたった時とか)すれば行けそうな希ガス
振り子を立てる様子がまるでアレのメタファー
棒読みちゃんの玉乗り学習を見てみたいです。
すげー
いつからだろうか、、、強化学習ならなんでも出来ると錯覚していたのは、、、
最初からグキッで草
振り子が一周したときも負の報酬+リセットにすれば学習速度上がりそうですね
初期位置からの距離で罰じゃなくて台の移動速度が早い程罰みたいにした方が良さそう
この人の計算機サーバのスペックどうなってんねん。RAMどんくらいかだけ気になる
二重振り子の最終型から三重振り子にステップアップしたら上手くいきますか?
○重振り子というものは、ひとつ腕が増えただけで挙動が大きく変わります。つまり全くの別物です。ステップアップは段階を踏んで学習する分、悪く行ってしまえば前回のルールや技術に頼りがちになります。卓球のルールや技術でラグビーが出来ないのと同じで、今回の場合はステップアップ学習は不可能では無いものの成功しにくい選択かと思います。空っぽなAIに1から覚えさせた方がむしろ早いのでは無いかと私は思いますね。
@@User_GinbustiMegane2001 腕が全部同じ長さの三重振り子じゃなくて、比率を100:100:1ぐらいから始めれば二重振り子の学習を生かせないですかね?
tal ratten ちょっと難しいかもしれないですね。スタート地点の0.1度の角度のズレ、腕のナノレベルの長さの違い、精密機械でしか測れないような小さな差が大きな差に繋がるのが○重振り子の挙動。それ故にその挙動の名が『カオス』なのです。100:100:1どころか1000:1000:1でさえも既に『別物』と云える挙動をしてしまいます。
まず、報酬設定ですが振り子が真上を向けば報酬が貰えます。しかしこのAIから見れば、「振り子が真上を向かす」ではなくて「台座を左右に動かす」ことで多く報酬を貰おうとしています、つまりAIにとっては振り子見えていなく台座しか見えていません。これは、目隠しをしてマリオカートをしているようなもので、アクセル・ブレーキ・方向キーの押下タイミングが良いときに報酬(1万)を貰えると同じことです。で、ステップアップですが。マリオカートに例えましたが、実はその時の設定が50cc(報酬1万)のレースでした。そこでステップアップとして同じコースを100cc(報酬2万)とした場合どうでしょうか?先程は多く報酬を貰っていたタイミング達が全く通用しなくなりました。または同じ50ccでコースが変わっていたならば・・・と言うお話し。我々は経験則で振り子の倒れる側に台座を移動させればバランスが取れるとわかりますが、それをAIに認識させるためにはどうするか。報酬の与え方もセンスが必要なのでしょうね。
バランス持ち直す為に凄い勢いで遠くまで突っ走って行ってしまうの、何かに引っかかった時のセグウエイもやるよね北京五輪でボルトがカメラマンのセグウエイに轢かれたの思い出した
振り子の先端のy座標が高いほど高い報酬になるのじゃダメなんでしょうか??
二重振り子でもいいや。三重振り子期待してます
この人工知能掃除の時のほうき逆立ち持ち最強説
視聴前:流石に強化学習は無理だろぉ視聴後:ですよね
棒が一回転する度にマイナス報酬を与えて見てはどうですか?適当に考えただけなので無視してくださって結構ですが
Twitterでバランス取る動画見ましたがまさかそれでやるとは
僕は多重振り子を倒さないようにするために作られた誰よりも高い報酬を求めて
あけましておめでとうございますまた舞ってないといけないんですね…
頑張ってる子の後ろで二重振り子振り回してる子好き
圧倒的尺不足・・・今年も宜しくお願いしますm(._.)m
相当難しいんだな。だとすると最初のあの動画は一体何だったんだろう
100年後の未来が見てみたい
こーじキーホルダーめちゃ欲しい()
これ、紐が立つようなものだからありえないってリプ欄で言ってた人いるけど、どうなの?
❌人口
⭕人工
いつも予測変換のまま間違えますwすいません
予測変換を強化学習
強化変換を予測学習
予測強化を変換学習
強化学習を予測変換
5:10あたりのすげー速度で右に行く子かわいい
5:07 同じ「バランスを取ること(生き残ること)」が目的でも、その方法に個性が生まれてくる、、、生物の進化みを感じるぜ
強化学習の動画見るといつもナルトの修行が思い浮かぶ
教子の部屋〜ニュートンのゆりかご〜 多重影分身で成果共有するアレか
3重振り子についてはウチの研究室でも話題になっていたので、ぜひ完成させて欲しいです!
関節に少し抵抗を与えてみれば多少安定するのでは?
初めて見た強化学習で「報酬」って言ってたけど見てたら何が言いたいのかは何となく分かってたけど説明しろって言われると無理。
2:44アリガタヤー
コージさんの強化学習ほんと面白いなぁ…
と思いつつふと呟きたいことを。
強化学習は万能のように感じますが今回の様にまだ苦手なことも多いです。
大学レベルの物理になると強化学習ではまだ解けないような問題を人の知恵と理論によって解いた本当にすごい研究や論文等がたくさん出てきます。
これまでの物理学者のとてつもない努力をひしひしと感じ先人の知恵に唖然とする中で、人工知能の可能性とそれらの相乗効果にワクワクしっぱなしの毎日です。
つまり、受験生頑張れ!笑(特に理系)
この世界を外から見て面白いと感じるなら、飛び込むと更に面白いぞ!
今年受験じゃない人も同じ。どうせ知るなら基礎から。コージさんの動画をモチベーションにして、その根幹にある世界を見に来よう!
5:05
問題児居て草
前から三番目「コンビニ行ってくる」
呪 /えるみづ 尊師で草
やるしかGO!(ジョジョ)
奇行種だ!
スピード感与えちゃったかな。
0:22実は逆再生動画だったら草
zxc1524 維持できなかった動画は草
センスある
もしそうなら最後に全く揺れてないから諦めきってて草
AI達に可愛いという感情を抱いてしまった
二重振り子でもあれだけ安定させられるのは素直にすげぇなぁと思った
動画の最後のあれに三重ふりこが追加される時を願って
随分遅い新年の挨拶ですねw
あけましておめでとう⛩
強化学習好きなのでもっと上げてくれると嬉しいです
リンクの材質長さが同じ、多重振り子の制御は機械学習でなくとも難しいです。
各リンクの固有振動数が同じであるため、あるリンクをコントロールする制御入力が他のリンクの動きに影響を強く与えます。
リンクの長さや質量を調整して、リンク間の固有振動数をずらせば、うまくいきやすいかと思います。
お、これか! 冒頭の三重振り子のバランスロボは凄いですね。
演算での結果が、一重から二重振り子でこんなにもかかる時間が違うとなると、三重振り子が完成するのって…かなり掛かりますよね(;'∀')
またいつか、結果が出る時を期待してます。お疲れ様です。
1:00
毎回NARUTOの影分身特訓思い出す
めちゃめちゃわかるw
愛すべき個性ですね(笑)
あけおめでございます(^^
今年も動画楽しみにしてます〜✨
ほぉーと感心してるところでさらっとコマーシャルしてた(OvO)
こーじさん毎回面白い❗
あけましておめでとうございます!
真ん中でうまくやってるコのそばで行ったり来たりして、あたふたしてる子が可愛くて笑いましたw
投稿まだかなーって思ってたら丁度きた😲
5分くらいで成長って、初期の数値の設定が上手いだけでしょ...
僕がやったらとんでもないこと起きますよ、いいんですかね?
人口70億人の知能を合わせてすれば
なんとかなりそう。
バカがいたらどうすんだ
@@ラブピコ9 それ馬鹿いらないやつで笑う
@@鐘-g7c バカと天才は紙一重つまりバカもなかなか馬鹿に出来ない
@@with3557 既にバカなのに馬鹿に出来ないという矛盾
いやまて、これ以上パラメータを下げようがないと考えれば矛盾にはならないのか?
@@SATOU-Kan バカを下げると数値がオーバーフローして天才になってしまう
今度は強化学習で釣りをAIにやらせてほしいです。
釣り人:気合で魚を釣りあげる
魚 :何とかして釣られないように逃げる
両者はお互いに糸でつながってて、互いに引っ張り合っている。
魚と釣り人がある程度離れると糸が切れて、魚の勝利、釣り人の敗北。
魚と釣り人の距離が0になると魚の敗北、釣り人の勝利。
引っ張り続けると疲労度が増加して、引っ張る力が弱くなる仕様があれば多分面白いかも
うぽつです
動画面白かったです
今年も宜しくお願いします
キーホルダー買おうかな
あけおめぇぇえぇ
棒読みちゃんのSUGEEEEEEEなんか好き。何回かそれだけ聞くために動画巻き戻した。
制御方法は強化学習では無いとサラッとやばい事言ってて草
ローリングスカイガチ勢
強化学習の方が難しいと思うなぁ
多分三重振り子を維持する理論があるんだと思う
どちらにせよ制御できるのはやべぇ
トロタマ あのツイートのリプで見たんですが、多重ふりこはほんの僅かに位置や角度などの条件が違うだけで数秒後には全く違うバラバラな動きをする、っていうので挙動の予測は不可能と言われてるらしいです
こーじさんが出した10連ふりこの動画見ると面白いです
三重振り子の完全な制御は現段階では不可能と言われてた筈
元動画がマジならかなり凄い話
時間経過と共に系がカオスになりますが初期時間においては一応可制御ですよ
@@トロタマ-o5v
まじか
けれど時間掛ければできるようには成るんだろ?
無知ですまんが。
二重振り子すら難しいのに
三重ではもう理解不能です。
さて、今回の学習の事ですが
入力情報を
数フレーム前の情報も加えてみてはどうでしょうか?
現状の棒が大きく動いている途中か否かが、結果に反映されるような気がします。
次回の動画も、楽しみにしています。
あけおめ〜
多重振り子の場合は、それぞれの振り子の共振周波数を変えないと成立しません。
こーじさん、質問です
Unityをやっているのですが
強化学習はどうすれば導入出来るのですか?
あけおめー
こーじさんあけおめ!!!
待ちに待った
三重振り子いつか完成させて下さい。楽しみにしています。
三重振り子楽しみですねー 進捗待ってます!!!
(角)速度情報も報酬に含ませるといいかも知れませんね。少なくとも制御理論における倒立振子の問題は全ての可動部分の座標と速度の組(のうち独立なもの)を目標の値にまでもっていく問題として解かれていたハズです。
タイムリーなネタですね
助かる助かる
誰かの研究結果の続きを別分野の人がやるのすごく科学してる
パーカーほしぃー✨
キーホルダーもホシィ
すげぇ
3重振り子だと、長さを変えないとできないって聞いたことがあります。(現代制御理論を専攻していた人から)
実際は関節の部分で若干の摩擦が起こって動き辛くなってるのかも知れませんね
物理演算だと滑らかに関節が曲がるから立たせにくいのでは
関節に摩擦を与えたらいいんじゃない?
(三重振り子の場合)
あけおめー( ´ ▽ ` )ノ
この前スキーに行って気になったのですが、
スキー場のリフトが乗るときと降りる時に遅くなって、
でも移動中の速度は速いまま変わらない仕組みを知りたいです!
リフトの速度は基本的には変わらなくてもしかしたら自分の乗る時だけ遅くして貰えてるのかもとか言おうとしたんですけど、
前にゴンドラに乗った時にゴンドラの速度は変わらないけど上のぐるぐるにレールがついててゴンドラに乗れるようになるって言うのがあって気になった
単純に別の軌道に移っているだけかと
@@glayzoneeste8526 …あ、そういうことですか!
上手いこと弛めたり遠回りして調整しているものだとばかり思い込んでました…
ありがとうございます!
学習が完了した時に表示される動きはリアルタイムでコンピュータが状況判断しているのでしょうか、それとも学習の結果として出された動きを完全にシミュレートしているのでしょうか
人間のバランサーも再現出来ますかね…?
2重振り子でバランスとってるAI見てるとゲーム「Euro Truck Simulator2」で
トレーラーのバック入庫している時の感覚を思い出しました。
普通車のバック入庫もややこしいですがトレーラートラックの場合、
トレーラーヘッドを大きなタイヤに見立てて運転するという
入れ子構造の視点を持つと出来るようになりました。
もちろんそれだけ先読みや緩急が要りますが・・・
2重振り子の学習結果をもう一本の棒の上で実現するという段階学習をしてみては?
5:07 奥から3番目「コンビニ行ってくるぅーっ!」
投稿本数100ポンテことは3日に一本か、楽しみだなぁ
概要欄読んでくれてありがとうございます😊
やっぱりモデル制御が計算量少なくて精度いいんでしょうかね。制御工学ってすごい。
2:44 言ってしまえば人間のドーパミンもただの物質だよね...
初動が左でも良い、って気づく個体がいるのも面白いよね。
おもしろかったです。
この時点で人間を超えてきている
三重振り子のことで質問なのですけど一つ一つに真上を向いたら報酬、横は0、下に向いたらー1にしたら良いのでしょうか
学習していく様子をノーカットとかで見てみたいです
物理エンジンだと、摩擦がなくて静止することが不可能になってしまうので、僅かに軸と棒の間に摩擦をつけてはどうでしょう?
久しぶりにこういう系キター
報酬の与え方が難しいとおっしゃってますが、その与え方も人工知能に任せたら面白そうですね。まあ、時間かかりそうですけど
振り子かわええ
こーじの頭のぼこぼこがマグネットでくっ付くこーじマグネットアフロマスコットとか作れませんか?
おかえりなさいの子が一番可愛い、ウチで飼いたい
言ってることがよくわからん…
これを理解して説明できるってすごいよな。
物理エンジンでやってみて欲しい事があります。
普通人間は急な坂を登れませんよね?
でも大体の坂は断面が平坦です。
↓(こんな感じに切ると)
◢ ▅(こんな断面になるように)
↓
ならば
👢こんな感じで足をのせれば
▅ どんな坂でも登れるんじゃないでしょうか?
これってコジビアになりませんか?
暇すぎる時の為のリアル練習用作ってみよかな
けん玉並みの競技に育つかも?
これ評価と報酬は同じままで人間が手動操作で参加あるいは動画冒頭のような機械が参加する台を少数混ぜると学習速度(上達?)はどう変わるんだろ ?
人工知能じゃ...
通知キターー!!
強化学習のたくさんのサンプルを見るたびにナルトの多重影分身修行が思い出される
影分身の術って、すげぇ理にかなってたよね。
報酬を節ごとに区切って立った時の状態を場合分け(1つめの節までたった時と2つ目の節までたった時とか)すれば行けそうな希ガス
振り子を立てる様子がまるでアレのメタファー
棒読みちゃんの玉乗り学習を見てみたいです。
すげー
いつからだろうか、、、強化学習ならなんでも出来ると錯覚していたのは、、、
最初からグキッで草
振り子が一周したときも負の報酬+リセットにすれば学習速度上がりそうですね
初期位置からの距離で罰じゃなくて台の移動速度が早い程罰みたいにした方が良さそう
この人の計算機サーバのスペックどうなってんねん。RAMどんくらいかだけ気になる
二重振り子の最終型から三重振り子にステップアップしたら上手くいきますか?
○重振り子というものは、ひとつ腕が増えただけで挙動が大きく変わります。
つまり全くの別物です。
ステップアップは段階を踏んで学習する分、悪く行ってしまえば前回のルールや技術に頼りがちになります。
卓球のルールや技術でラグビーが出来ないのと同じで、今回の場合はステップアップ学習は不可能では無いものの成功しにくい選択かと思います。
空っぽなAIに1から覚えさせた方がむしろ早いのでは無いかと私は思いますね。
@@User_GinbustiMegane2001 腕が全部同じ長さの三重振り子じゃなくて、比率を100:100:1ぐらいから始めれば二重振り子の学習を生かせないですかね?
tal ratten
ちょっと難しいかもしれないですね。
スタート地点の0.1度の角度のズレ、腕のナノレベルの長さの違い、精密機械でしか測れないような小さな差が大きな差に繋がるのが○重振り子の挙動。
それ故にその挙動の名が『カオス』なのです。
100:100:1どころか1000:1000:1でさえも既に『別物』と云える挙動をしてしまいます。
まず、報酬設定ですが振り子が真上を向けば報酬が貰えます。しかしこのAIから見れば、「振り子が真上を向かす」ではなくて「台座を左右に動かす」ことで多く報酬を貰おうとしています、つまりAIにとっては振り子見えていなく台座しか見えていません。これは、目隠しをしてマリオカートをしているようなもので、アクセル・ブレーキ・方向キーの押下タイミングが良いときに報酬(1万)を貰えると同じことです。
で、ステップアップですが。
マリオカートに例えましたが、実はその時の設定が50cc(報酬1万)のレースでした。
そこでステップアップとして同じコースを100cc(報酬2万)とした場合どうでしょうか?先程は多く報酬を貰っていたタイミング達が全く通用しなくなりました。または同じ50ccでコースが変わっていたならば・・・と言うお話し。
我々は経験則で振り子の倒れる側に台座を移動させればバランスが取れるとわかりますが、それをAIに認識させるためにはどうするか。報酬の与え方もセンスが必要なのでしょうね。
バランス持ち直す為に凄い勢いで遠くまで突っ走って行ってしまうの、何かに引っかかった時のセグウエイもやるよね
北京五輪でボルトがカメラマンのセグウエイに轢かれたの思い出した
振り子の先端のy座標が高いほど高い報酬になるのじゃダメなんでしょうか??
二重振り子でもいいや。
三重振り子期待してます
この人工知能掃除の時のほうき逆立ち持ち最強説
視聴前:流石に強化学習は無理だろぉ
視聴後:ですよね
棒が一回転する度にマイナス報酬を与えて見てはどうですか?
適当に考えただけなので無視してくださって結構ですが
Twitterでバランス取る動画見ましたがまさかそれでやるとは
僕は多重振り子を倒さないようにするために作られた
誰よりも高い報酬を求めて
あけましておめでとうございます
また舞ってないといけないんですね…
頑張ってる子の後ろで二重振り子振り回してる子好き
圧倒的尺不足・・・今年も宜しくお願いしますm(._.)m
相当難しいんだな。だとすると最初のあの動画は一体何だったんだろう
100年後の未来が見てみたい
こーじキーホルダーめちゃ欲しい()
これ、紐が立つようなものだからありえないってリプ欄で言ってた人いるけど、どうなの?