Обзор архитектуры Detection Transformer (DETR)
HTML-код
- Опубликовано: 8 фев 2025
- DETR - одна из самых популярных архитектур для детекции на основе трансформера. DETR позволяет избавиться от сложного постпроцессинга, довольно прост в использовании и отлично показывает себя на датасете COCO, занимая 4 место в лидерборде. В этом видео мы расскажем вам, как устроена данная архитектура.
Спикер: Михаил Лиз - CV-инженер в компании 2gis, куратор курса по повышению квалификации в Computer Vision deepschool.ru
Наш телеграм: t.me/+2iFq-56o... - в нем мы напоминаем теорию, разбираем статьи и делимся советами по обучению нейросетей
Полезные ссылки:
Оригинальная статья DETR: arxiv.org/abs/...
Официальный репозиторий с кодом: github.com/fac...
Оригинальная статья про трансформер: arxiv.org/abs/...
Разбор с картинками метрики Generalized Intersection over Union (GIoU): giou.stanford....
Разбор Венгерского алгоритма на Хабре: habr.com/ru/ar...
Разбор позиционного кодирования в трансформерах: machinelearnin...
на 20 минут очень приятное объяснение. спасибо!
Первая фраза в субтитрах "... для детекции гетр" 😂