DRL Course 2023 |Dynamic Programming. Policy and Value Iterations
HTML-код
- Опубликовано: 29 янв 2024
- Курс Deep Reinforcement Learning 2023: ods.ai/tracks/drlcourse23
Сезон курсов:ods.ai/events/course_season_a...
В третьей лекции:
- Поговорили про принцип динамического программирования
- Рассмотрели понятия v- и q-функций, а также понятия оптимальной политики.
- Выписали уравнения Белламана и научились их решать методами Policy Iteration и Value Iteration.
Автор курса: Антон Плаксин, исследователь в группе Yandex.Research и доцент Уральского федерального университета.
Наши соц.сети:
Telegram: t.me/datafest
Вконтакте: datafest
Канал с вакансиями в telegram: t.me/odsjobs
Канал с апдейтами по курсам: t.me/odscourses
Как попасть в чат сообщества ODS Mattermost: ods.ai/tracks/mattermost