Обучение с подкреплением Q-learning, Policy Gradient (Reinforce), Actor-Critic Практика на gym

Поделиться
HTML-код
  • Опубликовано: 26 ноя 2024

Комментарии • 25

  • @viktorperov9020
    @viktorperov9020 8 месяцев назад +3

    Божественная серия лекций, которая раскладывает по полочкам все несвязанные знания. Просмотрел его перед написанием диплома, и неимоверно доволен!

  • @МихаилЮрков-т1э
    @МихаилЮрков-т1э Год назад +2

    Это одна из самых лучших лекций (если не самая лучшая) по Обучению с подкреплением. Павел, огромное Вам спасибо за Ваш труд. Очень ясное и понятное объяснение, замечательная подача материала, подробное объяснение важных моментов.

  • @ЛёликСидоркин
    @ЛёликСидоркин 3 года назад +11

    Такое понятное объяснение по RL, как у Вас, редко встретишь. Все ясно и понятно по ходу лекции. Я слушал Воронцова, хорошо, но сразу не укладывается, нужно повторять. Слушал Нейчева, слишком общо и по верхам. Спасибо Вам за Ваш труд.

  • @vladislavrodin8036
    @vladislavrodin8036 Год назад +2

    спасибо за лекцию. Многое уложилось в голове именно после ее просмотра

  • @lucky-twins4213
    @lucky-twins4213 Год назад

    Очень полезное видео, всё очень четко и понятно объяснили. Прочитала до этого несколько статей по RL, но только после этого видео всё встало на свои места. Благодарю !!!

  • @vg835
    @vg835 3 года назад +3

    шикарное объяснение. спасибо

  • @ИванКутиков-з8и
    @ИванКутиков-з8и 4 года назад +2

    Отлично объясняешь!

  • @masterpro2288
    @masterpro2288 3 года назад +3

    Спасибо огромное за ваш труд, лекции очень помогли мне!
    Только еще если бы была литература с помощью которой вы готовили это материал, что б детальнее разобраться, да и если б вы выложили эти презентации на сайт, тогда б было вообще супер. Но и так спасибо)

  • @ToshbI4
    @ToshbI4 Год назад

    Лучше, чем куча перечитанных статей. Стоит потраченного времени.

  • @alexanderalexandrov3972
    @alexanderalexandrov3972 3 года назад +2

    первое понятное видео)

  • @georgeurumov5673
    @georgeurumov5673 2 месяца назад

    отличная лекция. есть ли у вас ссылка на jupyter notebook?

  • @beksaf1088
    @beksaf1088 2 года назад

    Отличное обьяснение. Спасибо

  • @Виктор-н8р7д
    @Виктор-н8р7д Год назад

    Спасибо.

  • @Елена-к8б8п
    @Елена-к8б8п 2 года назад

    Потрясающая лекция, огромное спасибо! Реально первое понятное объяснение!

  • @arsen_i
    @arsen_i Год назад

    Спасибо за видео. Возник вопрос - когда мы рассматривали на 48 минуте values V1 и V2, не должно ли там где было -1 быть -1+гамма, а где 1 быть 1-гамма?

  • @Анастасия-ы8ж5ъ
    @Анастасия-ы8ж5ъ 2 года назад

    Спасибо, в целом хорошая лекция
    ПС: c 50:00 непонятно почему пересчитывая из V2 в V3 клетку с гамма^2 мы получаем гамма^2. Хотя должны получить гамма^2 + гамма

  • @roman445
    @roman445 3 года назад

    Здравствуйте, а где можно посмотреть код, который использовался в практике? Заранее спасибо!

  • @BQ-201
    @BQ-201 2 года назад

    Кто может подсказать какая это версия gym ?

  • @alexanderkurzenkov9679
    @alexanderkurzenkov9679 4 года назад

    а где обещанный и анонсированый Actor-Critic???

    • @plyuspavel
      @plyuspavel 4 года назад

      Начиная с 1:49:54

    • @eduardtsuranov712
      @eduardtsuranov712 4 года назад +1

      @@plyuspavel Практические примеры бы еще на PG, A2C (может даже A3C). Вообще бы красота была! А так Спасибо!!!

  • @rubi6228
    @rubi6228 7 месяцев назад

    24:49 доллар? поздравляю, вы получаете награду - статус иноагента!