スーパーマリオブラザースをAIに学習させてみた【強化学習】

Поделиться
HTML-код
  • Опубликовано: 27 ноя 2024

Комментарии • 14

  • @sktakezo
    @sktakezo 2 года назад +13

    落とし穴恐怖症のマリオになっちゃうのすごいな

  • @痴漢車デンマス
    @痴漢車デンマス 2 года назад +7

    これって罰と報酬の与え方によるけど、人間と圧倒的に違うところは敵の座標を機械はわからないってところよなぁ

  • @えんもり炎堂紋守
    @えんもり炎堂紋守 3 года назад +10

    こうして見ると人間の学習能力すごい

  • @メレンゲ犬
    @メレンゲ犬 Год назад +4

    開始直後の無駄ジャンプは人間もAIもやってしまうんやね

  • @meida_umihime
    @meida_umihime 3 года назад +3

    待ってた!

  • @えんもり炎堂紋守
    @えんもり炎堂紋守 3 года назад +4

    面白かったです〜

  • @サブサフィ
    @サブサフィ Год назад +1

    ディープラーニングで各行動の選択率を出して、その確率でランダムに行動を選ぶってこと?
    選択率がいちばん高い行動をするのではなくて、算出した確率に応じたルーレットを作って、ルーレットを回して行動を決めてるってことですか?

  • @ぶきようくん
    @ぶきようくん 3 года назад +9

    開始直後の無駄なジャンプ、AIもするのか。実は無駄じゃないのかな。

  • @サブサフィ
    @サブサフィ Год назад +2

    これはAIに画面を認識させたって言ってたけど、事前知識無しでやってるの?
    例えば、最初にクリボーに当たってた時にAIマリオはクリボーを当たってはいけない敵とは認識してないと思うけど、クリボーを「モブ」だと認識してたのか、それとも「茶色い何か」と認識してたのか、そもそも「背景だと思ってた」のか?

  • @たつ-b1n
    @たつ-b1n 3 года назад +1

    イニシャルDとかレースゲームでやってみて下さい

  • @石原歩-c8t
    @石原歩-c8t 3 года назад +3

    入力情報とAIのところの数値化の部分が知りたいです
    人間からすると学習のステップが効率的ではないなあ。まず画面の構成の認識をすれば途中の穴で落ちたり、敵に当たったりしないよなあ。
    AIの評価が行動→結果→報酬→評価だからかな?場面の評価→行動→結果→報酬にすれば無駄な失敗が減る気がしました。

  • @りくわか
    @りくわか 2 года назад +3

    あ人間がロボットっぽくやってるんだと思うなぜならこんな動きしないから