Под Капотом | Игорь Ильин о мире 3D CV, SLAM и лидарах. Часть 1

Поделиться
HTML-код
  • Опубликовано: 14 авг 2024
  • #computervision #3d #3dcv #lidar #slam #cv #career
    На подкасте «Под капотом» мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
    В этот раз поговорили с Игорем Ильиным, Senior SLAM разработчиком и спикером курса 3D CV от DeepSchool.
    Вместе мы обсудили:
    - SLAM и как он связан с теорией управления
    - принципы работы лидаров
    - отличия компьютерного зрения в 3D от 2D
    - сложно ли найти работу в 3D CV
    Курс 3DCV: deepschool.ru/...
    Курс СV Rocket: deepschool.ru/...
    Курс Ускорение нейросетей: deepschool.ru/...
    Наш телеграм, в котором мы напоминаем теорию и делимся советами по обучению нейросетей: t.me/deep_school
    Мы в linkedin: / deep-school
    Подписывайтесь, чтобы развиваться в ML и DL вместе!
    00:00:00 | Введение, знакомство
    00:00:32 | История о том, как разные люди ориентируются в пространстве
    00:02:30 | Какие задачи решаются при локализации и о постановке задачи SLAM
    00:06:30 | Ограничения по скорости работы и расстоянию
    00:09:06 | В каких областях нужно делать SLAM
    00:12:45 | Что такое LIDAR
    00:18:15 | Сколько стоит LIDAR
    00:20:15 | Что такое хорошая камера для SLAM и что такое Rolling Shutter
    00:24:03 | Какие изображения хорошо подходят для SLAM
    00:28:38 | Различия фото для «нейроночных» 2D-задач и для 3D-SLAM
    00:33:10 | Почему в SLAM не так охотно приходят нейросети
    00:35:23 | Про проблемы с движущимися объектами
    00:36:50 | Что такое IMU и причём здесь 1-й закон Ньютона
    00:39:56 | Какие датчики используются для SLAM и какие бывают проблемы у GPS
    00:43:45 | Что такое теория управления
    00:45:17 | Как прототипировать и писать рабочий код для 3D
    00:49:28 | Тюнинг параметров для конкретной задачи
    00:56:03 | Калибровка датчиков
    00:57:28 | На каких языках программируем
    00:59:43 | Тестирование новых алгоритмов
    01:03:57 | Как проходят продажи
    01:06:10 | Пример SLAM в жизни: роботы-пылесосы
    01:07:49 | Какие знания и навыки нужны в работе
    01:09:41 | SLAM в AR/VR: Apple Vision Pro, Pokemon GO
    01:12:31 | Тяжело ли собрать свой SLAM
    01:14:05 | Как развивается SLAM: от классических алгоритмов к большим нейросетям
    01:18:59 | Говорим про данные
    01:20:43 | AI в беспилотниках и немного о Detroit: Becoming Human
    01:26:20 | Ещё раз обсуждаем теорию управления
    01:35:20 | Продолжение следует
    #SLAM #3d_CV #lidar #Теория_управления #CV #computervision

Комментарии • 10

  • @vladmob
    @vladmob 4 месяца назад +1

    Спасибо большое! Очень интересно и познавательно! Гость - молодец!

  • @user-or4gh3bq4l
    @user-or4gh3bq4l 4 месяца назад +3

    Ребята, очень интересно! Зашёл посмотреть на минутку, не могу теперь перестать слушать))

  • @romanlyskov9785
    @romanlyskov9785 4 месяца назад +1

    Леня супер! Ждем еще!

  • @user-jl1ij9rj3o
    @user-jl1ij9rj3o 4 месяца назад

    Ребята, спасибо, с удовольствием послушал! Ждем новых выпусков!

  • @user-bf8ed3ut6w
    @user-bf8ed3ut6w 4 месяца назад

    Очень интересно! Жду продолжение выпуска

  • @romankovtun9167
    @romankovtun9167 3 месяца назад

    Выпуск -- огонь!! Но есть пара моментиков (ни в коем случае не упрёк -- просто душный коммент к дискуссии))):
    1. Минус Roller Shutter на КМОП-матрицах проявляется только при сверхкоротких выдержках съёмки быстрых объектов (иначе сдвиг луча на матрице будет накладывать бОльшую ошибку и смазывать движение) -- не вижу смысла брать Global Shutter, если наша скорость (или скорость сцены относительно нас, если угодно) не больше ~30 км/ч
    2. Кошки и собаки... Как минимум, кошки мяукают, а собаки гавкают. Ну ок, если только по зрению -- глаза у кошки с вертикальным зрачком, у собак -- нет (и даже если есть такая порода собаки, -- если я её увижу, я сначала подумаю, что это кошка, ибо эти глаза -- дескриптор кошачьих). Нейронки нужны именно для того, чтобы найти признаки, которые сложно найти не-брут-форс-математикой -- они перебирают варианты в сторону меньшей ошибки с эталоном (и всё-таки, этот перебор -- это тоже матан). Но признаки должны быть, если признаков нет -- нет и решения.
    3. По теории управления, -- мне кажется, что обратная связь -- это одно из самых важных понятий в предмете. Управляющее устройство -> система -> датчик -[back to]-> управляющее устройство. А там уже навешиваются всякие критерии устойчивости и прочая веселуха)
    4. Мы хотим, чтобы нейронка думала, как человек, но не всегда действовала, как он -- в цитатник)

    • @leoromanovich
      @leoromanovich 3 месяца назад +1

      Спасибо за развёрнутый коммент) Приятно)
      Про глаза у кошек и собак как дескриптор никогда не думал, хороший момент, запомню)
      Кошки vs собаки это такой классический примерчик того, что решить в общем случае задачку с одним признаком на уровне качества человека тяжело, а строить комбинации признаков - дорого и больно. А так 100% правда, что, если нет специфичных признаков, то и решение отсутствует)

  • @alekseyshabanov2905
    @alekseyshabanov2905 4 месяца назад

    Отлично! :)