DRL Course 2023 | Практическое занятие 3. Policy Iteration

Искусственный интеллект - не пропустите открытие тысячелетия! // Vital Math

Python - полный курс для начинающих. Этот навык изменит твою жизнь.

Quavo, Lana Del Rey - Tough (Official Video)

KOENIGSEGG Jesko Absolut | 0-400-0 km/h - NEW WORLD RECORD

7-Eleven Is Reinventing Its $17B Food Business to Be More Japanese | WSJ The Economics Of

DRL Course 2023 |Dynamic Programming. Policy and Value Iterations

ML Trainings

Просмотров 838

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 29 янв 2024
Курс Deep Reinforcement Learning 2023: ods.ai/tracks/drlcourse23
Сезон курсов:ods.ai/events/course_season_a...
В третьей лекции:
- Поговорили про принцип динамического программирования
- Рассмотрели понятия v- и q-функций, а также понятия оптимальной политики.
- Выписали уравнения Белламана и научились их решать методами Policy Iteration и Value Iteration.
Автор курса: Антон Плаксин, исследователь в группе Yandex.Research и доцент Уральского федерального университета.
Наши соц.сети:
Telegram: t.me/datafest
Вконтакте: datafest
Канал с вакансиями в telegram: t.me/odsjobs
Канал с апдейтами по курсам: t.me/odscourses
Как попасть в чат сообщества ODS Mattermost: ods.ai/tracks/mattermost

Комментарии •

Следующие

Автовоспроизведение

DRL Course 2023 | Практическое занятие 3. Policy Iteration

DRL Course 2023 | Практическое занятие 3. Policy Iteration

Искусственный интеллект - не пропустите открытие тысячелетия! // Vital Math

Искусственный интеллект – не пропустите открытие тысячелетия! // Vital Math

Python - полный курс для начинающих. Этот навык изменит твою жизнь.

Python — полный курс для начинающих. Этот навык изменит твою жизнь.

Quavo, Lana Del Rey - Tough (Official Video)

Quavo, Lana Del Rey - Tough (Official Video)

KOENIGSEGG Jesko Absolut | 0-400-0 km/h - NEW WORLD RECORD

KOENIGSEGG Jesko Absolut | 0-400-0 km/h - NEW WORLD RECORD

7-Eleven Is Reinventing Its $17B Food Business to Be More Japanese | WSJ The Economics Of

7-Eleven Is Reinventing Its $17B Food Business to Be More Japanese | WSJ The Economics Of

Rob Parker - Bronny to the Lakers is the WORST Decision That's EVER Happened in Pro Sports

Rob Parker - Bronny to the Lakers is the WORST Decision That's EVER Happened in Pro Sports

DRL Course 2023 | Model-Free Reinforcement Learning: Monte-Carlo, SARSA, Q-Learning

DRL Course 2023 | Model-Free Reinforcement Learning: Monte-Carlo, SARSA, Q-Learning

Нейросетевое ранжирование для рекомендательных систем / Кирилл Хрыльченко

Нейросетевое ранжирование для рекомендательных систем / Кирилл Хрыльченко

Open source LLM: большие языковые модели - что это, какие кейсы можно решить, LLM для русского языка

Open source LLM: большие языковые модели - что это, какие кейсы можно решить, LLM для русского языка

Деревья и их ансамбли 2023 | Растим дерево

Деревья и их ансамбли 2023 | Растим дерево

But what is a GPT? Visual intro to transformers | Chapter 5, Deep Learning

But what is a GPT? Visual intro to transformers | Chapter 5, Deep Learning

Как работает ChatGPT: объясняем нейросети просто

Как работает ChatGPT: объясняем нейросети просто

Машинное обучение. Вводная лекция. К.В. Воронцов, Школа анализа данных, Яндекс.

Машинное обучение. Вводная лекция. К.В. Воронцов, Школа анализа данных, Яндекс.

Data Fusion Contest 2024 - митап по задачам Геоаналитика и Модели оттока (29.02.2024)

Data Fusion Contest 2024 - митап по задачам Геоаналитика и Модели оттока (29.02.2024)

Ростовский VS Гарри. Джанго-Конфликт. Акаб VS Джавид VS Фара. Сивый VS Сушист. Дауд. Вызов Киборгу

Ростовский VS Гарри. Джанго–Конфликт. Акаб VS Джавид VS Фара. Сивый VS Сушист. Дауд. Вызов Киборгу

Сколько стоит жить в США #сша #штаты #цены

Сколько стоит жить в США #сша #штаты #цены

Как так вышло, что младшей сестре уже 18?

Как так вышло, что младшей сестре уже 18?

КАКОЙ У ТЕБЯ ЛЮБИМЫЙ МАРМЕЛАД?

КАКОЙ У ТЕБЯ ЛЮБИМЫЙ МАРМЕЛАД?

Wow 👌 #yolohouse #kpop #dovetail #dance #yolohousemedia #housedesign #yolohouse #blackpink #new

Wow 👌 #yolohouse #kpop #dovetail #dance #yolohousemedia #housedesign #yolohouse #blackpink #new

ГЕВОРГЯН: Эту мафию кто-то покрывает! // Теракт в Дагестане, путь Беларуси, британская агентура

ГЕВОРГЯН: Эту мафию кто-то покрывает! // Теракт в Дагестане, путь Беларуси, британская агентура

ДПС ОСТАНОВИЛИ ДЕВУШКУ (ОБЛАЖАЛСЯ) В ГТА 5 (GTA 5 RMRP / Криминальная Москва)

ДПС ОСТАНОВИЛИ ДЕВУШКУ (ОБЛАЖАЛСЯ) В ГТА 5 (GTA 5 RMRP / Криминальная Москва)