Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
落とし穴恐怖症のマリオになっちゃうのすごいな
これって罰と報酬の与え方によるけど、人間と圧倒的に違うところは敵の座標を機械はわからないってところよなぁ
こうして見ると人間の学習能力すごい
開始直後の無駄ジャンプは人間もAIもやってしまうんやね
待ってた!
面白かったです〜
ディープラーニングで各行動の選択率を出して、その確率でランダムに行動を選ぶってこと?選択率がいちばん高い行動をするのではなくて、算出した確率に応じたルーレットを作って、ルーレットを回して行動を決めてるってことですか?
開始直後の無駄なジャンプ、AIもするのか。実は無駄じゃないのかな。
これはAIに画面を認識させたって言ってたけど、事前知識無しでやってるの?例えば、最初にクリボーに当たってた時にAIマリオはクリボーを当たってはいけない敵とは認識してないと思うけど、クリボーを「モブ」だと認識してたのか、それとも「茶色い何か」と認識してたのか、そもそも「背景だと思ってた」のか?
イニシャルDとかレースゲームでやってみて下さい
入力情報とAIのところの数値化の部分が知りたいです人間からすると学習のステップが効率的ではないなあ。まず画面の構成の認識をすれば途中の穴で落ちたり、敵に当たったりしないよなあ。AIの評価が行動→結果→報酬→評価だからかな?場面の評価→行動→結果→報酬にすれば無駄な失敗が減る気がしました。
プログラミング勉強してからほざけ
あ人間がロボットっぽくやってるんだと思うなぜならこんな動きしないから
落とし穴恐怖症のマリオになっちゃうのすごいな
これって罰と報酬の与え方によるけど、人間と圧倒的に違うところは敵の座標を機械はわからないってところよなぁ
こうして見ると人間の学習能力すごい
開始直後の無駄ジャンプは人間もAIもやってしまうんやね
待ってた!
面白かったです〜
ディープラーニングで各行動の選択率を出して、その確率でランダムに行動を選ぶってこと?
選択率がいちばん高い行動をするのではなくて、算出した確率に応じたルーレットを作って、ルーレットを回して行動を決めてるってことですか?
開始直後の無駄なジャンプ、AIもするのか。実は無駄じゃないのかな。
これはAIに画面を認識させたって言ってたけど、事前知識無しでやってるの?
例えば、最初にクリボーに当たってた時にAIマリオはクリボーを当たってはいけない敵とは認識してないと思うけど、クリボーを「モブ」だと認識してたのか、それとも「茶色い何か」と認識してたのか、そもそも「背景だと思ってた」のか?
イニシャルDとかレースゲームでやってみて下さい
入力情報とAIのところの数値化の部分が知りたいです
人間からすると学習のステップが効率的ではないなあ。まず画面の構成の認識をすれば途中の穴で落ちたり、敵に当たったりしないよなあ。
AIの評価が行動→結果→報酬→評価だからかな?場面の評価→行動→結果→報酬にすれば無駄な失敗が減る気がしました。
プログラミング勉強してからほざけ
あ人間がロボットっぽくやってるんだと思うなぜならこんな動きしないから