Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
これって罰と報酬の与え方によるけど、人間と圧倒的に違うところは敵の座標を機械はわからないってところよなぁ
落とし穴恐怖症のマリオになっちゃうのすごいな
こうして見ると人間の学習能力すごい
面白かったです〜
待ってた!
開始直後の無駄ジャンプは人間もAIもやってしまうんやね
開始直後の無駄なジャンプ、AIもするのか。実は無駄じゃないのかな。
ディープラーニングで各行動の選択率を出して、その確率でランダムに行動を選ぶってこと?選択率がいちばん高い行動をするのではなくて、算出した確率に応じたルーレットを作って、ルーレットを回して行動を決めてるってことですか?
これはAIに画面を認識させたって言ってたけど、事前知識無しでやってるの?例えば、最初にクリボーに当たってた時にAIマリオはクリボーを当たってはいけない敵とは認識してないと思うけど、クリボーを「モブ」だと認識してたのか、それとも「茶色い何か」と認識してたのか、そもそも「背景だと思ってた」のか?
イニシャルDとかレースゲームでやってみて下さい
入力情報とAIのところの数値化の部分が知りたいです人間からすると学習のステップが効率的ではないなあ。まず画面の構成の認識をすれば途中の穴で落ちたり、敵に当たったりしないよなあ。AIの評価が行動→結果→報酬→評価だからかな?場面の評価→行動→結果→報酬にすれば無駄な失敗が減る気がしました。
プログラミング勉強してからほざけ
あ人間がロボットっぽくやってるんだと思うなぜならこんな動きしないから
これって罰と報酬の与え方によるけど、人間と圧倒的に違うところは敵の座標を機械はわからないってところよなぁ
落とし穴恐怖症のマリオになっちゃうのすごいな
こうして見ると人間の学習能力すごい
面白かったです〜
待ってた!
開始直後の無駄ジャンプは人間もAIもやってしまうんやね
開始直後の無駄なジャンプ、AIもするのか。実は無駄じゃないのかな。
ディープラーニングで各行動の選択率を出して、その確率でランダムに行動を選ぶってこと?
選択率がいちばん高い行動をするのではなくて、算出した確率に応じたルーレットを作って、ルーレットを回して行動を決めてるってことですか?
これはAIに画面を認識させたって言ってたけど、事前知識無しでやってるの?
例えば、最初にクリボーに当たってた時にAIマリオはクリボーを当たってはいけない敵とは認識してないと思うけど、クリボーを「モブ」だと認識してたのか、それとも「茶色い何か」と認識してたのか、そもそも「背景だと思ってた」のか?
イニシャルDとかレースゲームでやってみて下さい
入力情報とAIのところの数値化の部分が知りたいです
人間からすると学習のステップが効率的ではないなあ。まず画面の構成の認識をすれば途中の穴で落ちたり、敵に当たったりしないよなあ。
AIの評価が行動→結果→報酬→評価だからかな?場面の評価→行動→結果→報酬にすれば無駄な失敗が減る気がしました。
プログラミング勉強してからほざけ
あ人間がロボットっぽくやってるんだと思うなぜならこんな動きしないから