DL2022: Трансформер (часть 2)

Attention in transformers, step-by-step | DL6

DL2022: Языковые модели (часть 2)

REBUILDING A PORSCHE 911 GT3RS FROM SCRATCH

"BENDY: LONE WOLF" - Official Trailer - Coming 2025

Islam Makhachev DENIES Arman Tsarukyan as toughest opponent👀 'I'll make everyone shut up' | ESPN MMA

DL2022: Трансформер (часть 1)

Alexander D'yakonov

Просмотров 2,8 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 4 фев 2025

Комментарии • 2

@boriswithrazor6992 2 года назад ⁺⁵
Спасибо за лекцию!
Благодаря ней я окончательно разобрался с трансформерами и весь пазл про них в голове сложился
@VladyslavHadzhykhanov Год назад
Подскажите, пожалуйста, как соотносится то, что размерности матриц W^Q, W^K, W^V не зависят от числа объектов -- s и то, что трансформер работает с батчами, "добитыми" паддингом до фиксированной длины, а не до максимальной длины по батчу?
То есть по сути модель таки требует фиксированное число токенов на вход, но не понятно, почему?

Следующие

Автовоспроизведение

DL2022: Трансформер (часть 2)

DL2022: Трансформер (часть 2)

Attention in transformers, step-by-step | DL6

Attention in transformers, step-by-step | DL6

DL2022: Языковые модели (часть 2)

DL2022: Языковые модели (часть 2)

REBUILDING A PORSCHE 911 GT3RS FROM SCRATCH

REBUILDING A PORSCHE 911 GT3RS FROM SCRATCH

"BENDY: LONE WOLF" - Official Trailer - Coming 2025

"BENDY: LONE WOLF" - Official Trailer - Coming 2025

Islam Makhachev DENIES Arman Tsarukyan as toughest opponent👀 'I'll make everyone shut up' | ESPN MMA

Islam Makhachev DENIES Arman Tsarukyan as toughest opponent👀 'I'll make everyone shut up' | ESPN MMA

AMAD WORLD CLASS! MAN CITY 1-2 MAN UTD GOLDBRIDGE MATCH REACTION

AMAD WORLD CLASS! MAN CITY 1-2 MAN UTD GOLDBRIDGE MATCH REACTION

ФИЗИК Семихатов: Квантовые парадоксы, Мультивселенные, Телепортация, Понять невидимое

ФИЗИК Семихатов: Квантовые парадоксы, Мультивселенные, Телепортация, Понять невидимое

Инженерия квантовых состояний света в схемах с измерениями - Татьяна Голубева

Инженерия квантовых состояний света в схемах с измерениями - Татьяна Голубева

LLM4 CNN for text classification

LLM4 CNN for text classification

КАК УСТРОЕН TCP/IP?

КАК УСТРОЕН TCP/IP?

DL2022: Трансформеры++ (Эффективные трансформеры)

DL2022: Трансформеры++ (Эффективные трансформеры)

Время ускоряется, чтобы ОСТАНОВИТЬСЯ? Алексей Семихатов о парадоксах времени и квантовой теории

Время ускоряется, чтобы ОСТАНОВИТЬСЯ? Алексей Семихатов о парадоксах времени и квантовой теории

Татьяна Черниговская ("Как научить мозг учиться?")

Татьяна Черниговская ("Как научить мозг учиться?")

DL2022: Языковые модели (часть 1)

DL2022: Языковые модели (часть 1)

Профессор Дадали: Как в 87 лет чувствовать себя на 60. Топ-5 витаминов и привычек

Профессор Дадали: Как в 87 лет чувствовать себя на 60. Топ-5 витаминов и привычек

Что это если не жиза ? 🥲 #юмор #отношения

Что это если не жиза ? 🥲 #юмор #отношения

😰Я Прокачал ОРУЖИЕ На МАКСИМУМ в Майнкрафт!

😰Я Прокачал ОРУЖИЕ На МАКСИМУМ в Майнкрафт!

На ТАКОЙ ПОСТУПОК способен только человек с по-настоящему ДОБРЫМ СЕРДЦЕМ #shorts

На ТАКОЙ ПОСТУПОК способен только человек с по-настоящему ДОБРЫМ СЕРДЦЕМ #shorts

Who is that baby | CHANG DORY | ometv

Who is that baby | CHANG DORY | ometv

Понимаю, что это практически невозможно, но если внимательно присмотреться…

Понимаю, что это практически невозможно, но если внимательно присмотреться…

Электрички больше не в тренде - проблемы с зарядкой, низкий запас хода, неликвид на вторичке.

Электрички больше не в тренде - проблемы с зарядкой, низкий запас хода, неликвид на вторичке.

DID YOU EXPECT THOSE DANCE MOVES? 🤣 #shorts

DID YOU EXPECT THOSE DANCE MOVES? 🤣 #shorts

Купил ЗАКРЫТЫЙ КОНТЕЙНЕР на Аукционе и нашел ИГРОВОЙ АВТОМАТ!

Купил ЗАКРЫТЫЙ КОНТЕЙНЕР на Аукционе и нашел ИГРОВОЙ АВТОМАТ!