Под Капотом | Игорь Ильин о мире 3D CV, SLAM и лидарах. Часть 1
HTML-код
- Опубликовано: 14 авг 2024
- #computervision #3d #3dcv #lidar #slam #cv #career
На подкасте «Под капотом» мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
В этот раз поговорили с Игорем Ильиным, Senior SLAM разработчиком и спикером курса 3D CV от DeepSchool.
Вместе мы обсудили:
- SLAM и как он связан с теорией управления
- принципы работы лидаров
- отличия компьютерного зрения в 3D от 2D
- сложно ли найти работу в 3D CV
Курс 3DCV: deepschool.ru/...
Курс СV Rocket: deepschool.ru/...
Курс Ускорение нейросетей: deepschool.ru/...
Наш телеграм, в котором мы напоминаем теорию и делимся советами по обучению нейросетей: t.me/deep_school
Мы в linkedin: / deep-school
Подписывайтесь, чтобы развиваться в ML и DL вместе!
00:00:00 | Введение, знакомство
00:00:32 | История о том, как разные люди ориентируются в пространстве
00:02:30 | Какие задачи решаются при локализации и о постановке задачи SLAM
00:06:30 | Ограничения по скорости работы и расстоянию
00:09:06 | В каких областях нужно делать SLAM
00:12:45 | Что такое LIDAR
00:18:15 | Сколько стоит LIDAR
00:20:15 | Что такое хорошая камера для SLAM и что такое Rolling Shutter
00:24:03 | Какие изображения хорошо подходят для SLAM
00:28:38 | Различия фото для «нейроночных» 2D-задач и для 3D-SLAM
00:33:10 | Почему в SLAM не так охотно приходят нейросети
00:35:23 | Про проблемы с движущимися объектами
00:36:50 | Что такое IMU и причём здесь 1-й закон Ньютона
00:39:56 | Какие датчики используются для SLAM и какие бывают проблемы у GPS
00:43:45 | Что такое теория управления
00:45:17 | Как прототипировать и писать рабочий код для 3D
00:49:28 | Тюнинг параметров для конкретной задачи
00:56:03 | Калибровка датчиков
00:57:28 | На каких языках программируем
00:59:43 | Тестирование новых алгоритмов
01:03:57 | Как проходят продажи
01:06:10 | Пример SLAM в жизни: роботы-пылесосы
01:07:49 | Какие знания и навыки нужны в работе
01:09:41 | SLAM в AR/VR: Apple Vision Pro, Pokemon GO
01:12:31 | Тяжело ли собрать свой SLAM
01:14:05 | Как развивается SLAM: от классических алгоритмов к большим нейросетям
01:18:59 | Говорим про данные
01:20:43 | AI в беспилотниках и немного о Detroit: Becoming Human
01:26:20 | Ещё раз обсуждаем теорию управления
01:35:20 | Продолжение следует
#SLAM #3d_CV #lidar #Теория_управления #CV #computervision
Спасибо большое! Очень интересно и познавательно! Гость - молодец!
Ребята, очень интересно! Зашёл посмотреть на минутку, не могу теперь перестать слушать))
Я также)))
Леня супер! Ждем еще!
Ребята, спасибо, с удовольствием послушал! Ждем новых выпусков!
Очень интересно! Жду продолжение выпуска
Выпуск -- огонь!! Но есть пара моментиков (ни в коем случае не упрёк -- просто душный коммент к дискуссии))):
1. Минус Roller Shutter на КМОП-матрицах проявляется только при сверхкоротких выдержках съёмки быстрых объектов (иначе сдвиг луча на матрице будет накладывать бОльшую ошибку и смазывать движение) -- не вижу смысла брать Global Shutter, если наша скорость (или скорость сцены относительно нас, если угодно) не больше ~30 км/ч
2. Кошки и собаки... Как минимум, кошки мяукают, а собаки гавкают. Ну ок, если только по зрению -- глаза у кошки с вертикальным зрачком, у собак -- нет (и даже если есть такая порода собаки, -- если я её увижу, я сначала подумаю, что это кошка, ибо эти глаза -- дескриптор кошачьих). Нейронки нужны именно для того, чтобы найти признаки, которые сложно найти не-брут-форс-математикой -- они перебирают варианты в сторону меньшей ошибки с эталоном (и всё-таки, этот перебор -- это тоже матан). Но признаки должны быть, если признаков нет -- нет и решения.
3. По теории управления, -- мне кажется, что обратная связь -- это одно из самых важных понятий в предмете. Управляющее устройство -> система -> датчик -[back to]-> управляющее устройство. А там уже навешиваются всякие критерии устойчивости и прочая веселуха)
4. Мы хотим, чтобы нейронка думала, как человек, но не всегда действовала, как он -- в цитатник)
Спасибо за развёрнутый коммент) Приятно)
Про глаза у кошек и собак как дескриптор никогда не думал, хороший момент, запомню)
Кошки vs собаки это такой классический примерчик того, что решить в общем случае задачку с одним признаком на уровне качества человека тяжело, а строить комбинации признаков - дорого и больно. А так 100% правда, что, если нет специфичных признаков, то и решение отсутствует)
Отлично! :)