Продвинутый Actor-Critic: A2C и A3C

Actor Critic Algorithms

Comedy Club: Натальная карта в полиции | Иванченко, Харламов, Батрутдинов @TNT_television

The UPDATED GOATMAN mod is EVIL.. Minecraft: From the Fog

TRYING VIRAL TIKTOK SNACKS because i dont care for my health...

TFT Dev Drop: 6-Costs Enter Into the Arcane I Dev Video - Teamfight Tactics

Actor-Critic

Центр digital профессий ITtensive

Просмотров 370

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 26 ноя 2024
Развлечения

Комментарии • 2

@Brovenko 2 года назад
👍
@gregorygorbov4669 Год назад
2:58 что вы несете? Q(s, a) не аппроксимирует R, оно и не сумму взешанную возможных наград, Q аппроксимирует кумулятивную награду в эпизоде. А именно награду от действия "а" принятого в состоянии "s" плюс дисконтированная суммарная награда которую агент получит до конца эпизода, если будет придерживаться текущей стратегии. Вы бы хотя бы с теорией ознакомились прежде чем видео такие делать.
4:51. Боже мой все алгоритмы семества Actor Critic являются on policy, A2C, A3C, TRPO, PPO. То что у нас есть отдельная нейросеть для оценки полезности состояний, никак не влияет на подход on policy или off policy. ( on policy - в вашей охуенной терминологии это будет ЕДИНАЯ СТРАТЕГИЯ, кстати совершенно кошмарный урок про on policy и off policy после которого не ясно в чем отличие ).
Еще раз, ознакомьтесь с теорией и не выпускайте до этого видеоролики.

Следующие

Автовоспроизведение

Продвинутый Actor-Critic: A2C и A3C

Продвинутый Actor-Critic: A2C и A3C

Actor Critic Algorithms

Actor Critic Algorithms

Comedy Club: Натальная карта в полиции | Иванченко, Харламов, Батрутдинов @TNT_television

Comedy Club: Натальная карта в полиции | Иванченко, Харламов, Батрутдинов @TNT_television

The UPDATED GOATMAN mod is EVIL.. Minecraft: From the Fog

The UPDATED GOATMAN mod is EVIL.. Minecraft: From the Fog

TRYING VIRAL TIKTOK SNACKS because i dont care for my health...

TRYING VIRAL TIKTOK SNACKS because i dont care for my health...

TFT Dev Drop: 6-Costs Enter Into the Arcane I Dev Video - Teamfight Tactics

TFT Dev Drop: 6-Costs Enter Into the Arcane I Dev Video - Teamfight Tactics

Kendrick Perkins CALLS OUT Jamal Murray to HELP OUT Jokic! 😤 Concerns in Denver?! 👀 | First Take

Kendrick Perkins CALLS OUT Jamal Murray to HELP OUT Jokic! 😤 Concerns in Denver?! 👀 | First Take

Markov Decision Processes (MDPs) - Structuring a Reinforcement Learning Problem

Markov Decision Processes (MDPs) - Structuring a Reinforcement Learning Problem

ШЕНДЕРОВИЧ: Что изменил «Орешник». Ядерная угроза Путина и реакция Запада. Живая программа в студии

ШЕНДЕРОВИЧ: Что изменил «Орешник». Ядерная угроза Путина и реакция Запада. Живая программа в студии

Третья мировая будет самой короткой // Константин Сивков

Третья мировая будет самой короткой // Константин Сивков

Обучение с подкреплением Q-learning, Policy Gradient (Reinforce), Actor-Critic Практика на gym

Обучение с подкреплением Q-learning, Policy Gradient (Reinforce), Actor-Critic Практика на gym

«Осень». Самая большая загадка Windows XP

«Осень». Самая большая загадка Windows XP

#11. Не дай шесту упасть или как нейросеть держит баланс | Генетические алгоритмы на Python

#11. Не дай шесту упасть или как нейросеть держит баланс | Генетические алгоритмы на Python

Глуховский - будет ли Третья мировая, почему не доверяет Кацу, что замышляют Трамп и Маск

Глуховский — будет ли Третья мировая, почему не доверяет Кацу, что замышляют Трамп и Маск

#10. Обучение с подкреплением или как загнать машину на гору | Генетические алгоритмы на Python

#10. Обучение с подкреплением или как загнать машину на гору | Генетические алгоритмы на Python

Глубокое мультиагентное обучение с подкреплением

Глубокое мультиагентное обучение с подкреплением

Попросили отклеить обои

Попросили отклеить обои

Когда отвлеклась во время пробежки 😁 #фильм #сериал #моменты #shorts

Когда отвлеклась во время пробежки 😁 #фильм #сериал #моменты #shorts

Бедный муж заревновал жену к начальнику 😂 | Шоу Однажды в России | #юмор #смех #однаждывроссии

Бедный муж заревновал жену к начальнику 😂 | Шоу Однажды в России | #юмор #смех #однаждывроссии

Когда отвлеклась во время пробежки 😁 #фильм #сериал #моменты #shorts

Когда отвлеклась во время пробежки 😁 #фильм #сериал #моменты #shorts

Поставил наглого хама на место и помог бабушке #кино #фильмы #сериалы

Поставил наглого хама на место и помог бабушке #кино #фильмы #сериалы

Когда отвлеклась во время пробежки 😁 #фильм #сериал #моменты #shorts

Когда отвлеклась во время пробежки 😁 #фильм #сериал #моменты #shorts

СМЕШНОЙ😆 анекдот от ОТАРИКА слушать до конца 😆#кушанашвили #отар

СМЕШНОЙ😆 анекдот от ОТАРИКА слушать до конца 😆#кушанашвили #отар

Уличный художник нарисовал вора в законе #shorts #фильмы #сериалы #сериал

Уличный художник нарисовал вора в законе #shorts #фильмы #сериалы #сериал