DRL Course 2023 |Dynamic Programming. Policy and Value Iterations

Поделиться
HTML-код
  • Опубликовано: 29 янв 2024
  • Курс Deep Reinforcement Learning 2023: ods.ai/tracks/drlcourse23
    Сезон курсов:ods.ai/events/course_season_a...
    В третьей лекции:
    - Поговорили про принцип динамического программирования
    - Рассмотрели понятия v- и q-функций, а также понятия оптимальной политики.
    - Выписали уравнения Белламана и научились их решать методами Policy Iteration и Value Iteration.
    Автор курса: Антон Плаксин, исследователь в группе Yandex.Research и доцент Уральского федерального университета.
    Наши соц.сети:
    Telegram: t.me/datafest
    Вконтакте: datafest
    Канал с вакансиями в telegram: t.me/odsjobs
    Канал с апдейтами по курсам: t.me/odscourses
    Как попасть в чат сообщества ODS Mattermost: ods.ai/tracks/mattermost

Комментарии •