Lecture 4: Imitation from Interventions

Lecture 5: Imitation as a Stairway to Self-Improvement

Barbara Oakley | Learning How to Learn | Talks at Google

BLIND DEAF & MUTE COOKING

Adding Smallmouth Bass to the Pond!

Are We Witnessing The Greatest Peak In NBA History?

Lecture 3: Interaction in Imitation Learning

Sanjiban Choudhury

Просмотров 1,2 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 11 дек 2024

Комментарии • 4

@seanl2061 11 месяцев назад
Hi Sanjiban, thank you greatly for the lecture! I have a question at 15:28. As for the first inequality, as long as all possible policies don't incur the same loss value, the equality wouldn't hold. Correct? Also, in the last inequality terms, isn't that simply showing that for any policy the regret is lower-bounded by 0? How can one conclude that at least one policy must be pretty good as written in the lecture note? Thanks.
@quonxinquonyi8570 2 года назад
Such a brilliant lecture
@Messiah-000 Год назад
Would using a neural network-based policy to perform dataset replacement rather than aggregation at each batch of training using standard gradient descent still be considered as a no-regret learner?
@sanjibanc Год назад ⁺²
Great question! So online gradient descent over a convex loss function is no-regret. Neural networks are, unfortunately, not convex so the theory doesn't hold for them. But the theory does hold for kernels (like RKHS) and there is work that shows deep networks are approximately equivalent to kernel machines (such as arxiv.org/pdf/2012.00152.pdf)

Следующие

Автовоспроизведение

Lecture 4: Imitation from Interventions

Lecture 4: Imitation from Interventions

Lecture 5: Imitation as a Stairway to Self-Improvement

Lecture 5: Imitation as a Stairway to Self-Improvement

Barbara Oakley | Learning How to Learn | Talks at Google

Barbara Oakley | Learning How to Learn | Talks at Google

BLIND DEAF & MUTE COOKING

BLIND DEAF & MUTE COOKING

Adding Smallmouth Bass to the Pond!

Adding Smallmouth Bass to the Pond!

Are We Witnessing The Greatest Peak In NBA History?

Are We Witnessing The Greatest Peak In NBA History?

Shadow 3.0 Damage Report from Hitting Cleetus’ Crown Vic

Shadow 3.0 Damage Report from Hitting Cleetus’ Crown Vic

Lecture 1: What is Imitation Learning?

Lecture 1: What is Imitation Learning?

УЗНАЛ ВСЮ ПРАВДУ ОБ АНЖЕЛЕ И БАТЕ ЗЛЫХ РОДИТЕЛЕЙ В SCHOOLBOY RUNAWAY В МАЙНКРАФТ!

УЗНАЛ ВСЮ ПРАВДУ ОБ АНЖЕЛЕ И БАТЕ ЗЛЫХ РОДИТЕЛЕЙ В SCHOOLBOY RUNAWAY В МАЙНКРАФТ!

Qizim 161-qism (milliy serial) | Қизим 161 қисм (миллий сериал)

Qizim 161-qism (milliy serial) | Қизим 161 қисм (миллий сериал)

🔥Что он хочет ИЗМЕНИТЬ в ваших отношениях Срочно ⁉️ Таро расклад 🔮 онлайн гадание

🔥Что он хочет ИЗМЕНИТЬ в ваших отношениях Срочно ⁉️ Таро расклад 🔮 онлайн гадание

Lecture 6: Inverse Reinforcement Learning -- From Maximum Margin to Maximum Entropy

Lecture 6: Inverse Reinforcement Learning -- From Maximum Margin to Maximum Entropy

Session 03: Multi-Sectoral Partnerships for Achieving Universal Health Coverage

Session 03: Multi-Sectoral Partnerships for Achieving Universal Health Coverage

Lp. Сердце Вселенной #59 ДРУГОЕ ВРЕМЯ [Последняя Концовка] • Майнкрафт

Lp. Сердце Вселенной #59 ДРУГОЕ ВРЕМЯ [Последняя Концовка] • Майнкрафт

Мы сильно накосячили! Нужно красить заново 😩 Конец проекта Passat CC!

Мы сильно накосячили! Нужно красить заново 😩 Конец проекта Passat CC!

Похожа ли Ида Галич на Иришку Чики-Пики? #идагалич #иришкачикипики #галич #чикипики

Похожа ли Ида Галич на Иришку Чики-Пики? #идагалич #иришкачикипики #галич #чикипики

Lp. Сердце Вселенной #59 ДРУГОЕ ВРЕМЯ [Последняя Концовка] • Майнкрафт

Lp. Сердце Вселенной #59 ДРУГОЕ ВРЕМЯ [Последняя Концовка] • Майнкрафт

Кто был на вечеринке P.Diddy? / Шоу «Ху из Ху»

Кто был на вечеринке P.Diddy? / Шоу «Ху из Ху»

🔴 СРОЧНО БОМБАРДИРОВКИ СИРИИ ИЗРАИЛЕМ, США, ТУРЦИЕЙ, РОССИЯ МОЛЧИТ #новости #сирия #израиль #асад

🔴 СРОЧНО БОМБАРДИРОВКИ СИРИИ ИЗРАИЛЕМ, США, ТУРЦИЕЙ, РОССИЯ МОЛЧИТ #новости #сирия #израиль #асад

Старый JEEP для зомби-апокалипсиса! Его собрали из двух машин!

Старый JEEP для зомби-апокалипсиса! Его собрали из двух машин!

ГОНКА ВЕНГАЛБИ vs ТАМАЕВ! Кто заберет АВТОПАРК?!

ГОНКА ВЕНГАЛБИ vs ТАМАЕВ! Кто заберет АВТОПАРК?!