Видео 76
Просмотров 164 666

Jetson Orin NX. Обучение модели для задачи классификации (ConvNeXt)

21:09

Jetson Orin NX. Классификация изображений, используя предобученные модели.

21:04

050. MMSegmentation фреймворк. Знакомство.

30:17

02 Тестовое задание CV. UNet модель на PyTorch для детекции Canny (Python, OpenCV, PyTorch)

18:56

01 Тестовое задание CV. Поиск таблицы на изображении и чтение данных из неё (Python, OpenCV, Pandas)

30:01

Jetson Orin NX. Что за зверь? Испытаем на Yolo v8 и сравним с десктопными видеокартами.

25:03

001. HSV. Сегментация изображения на основе HSV. С практическим уклоном.

Этим видео начинаю плейлист, посвящённый сегментации. Самое простое, по чём можно сегментировать объекты - это их цвет, а точнее оттенок. Именно модель HSV даёт нам канал оттенка (Hue). А это позволит сделать фильтр цвета и тем самым сегментировать изображение.
В видео мы разберёмся как конвертировать RGB в HSV, да и вообще попробуем понять, что лежит в основе HSV. И даже будет немного информации об авторе этой модели.
А дальше приступим к практической части, где будем на основе изображений кубиков и даже Армы, выполнять сегментацию. Сначала просто отделять объекты от фона, а затем переключимся непосредственно на детекцию на основе оттенка.
Много практических примеров.
Это же видео досту...

Видео

Jetson Orin NX. Обучение модели для задачи классификации (ConvNeXt)

21:09

Jetson Orin NX. Обучение модели для задачи классификации (ConvNeXt)

Просмотров 6716 часов назад

В предыдущем видео мы использовали предобученную модель на датасете ImageNet, однако это не совсем удобно. Поэтому в этом видео мы обучим модель на своём собственном датасете. И сможем решать нужные нам задачи. Здесь мы взглянем на код, с помощью которого выполняется обучение. Вместо предложенного в демо датасета и модели мы будем использовать свой собственный датасет и модель. В качестве датас...

Jetson Orin NX. Классификация изображений, используя предобученные модели.

21:04

Jetson Orin NX. Классификация изображений, используя предобученные модели.

Просмотров 84День назад

В этом видео мы посмотрим как запустить модель классификации изображений на Jetson с помощью Jetson-inference. Разберём демо пример. Получим результаты для модели Googlenet, Resnet-152, Inception-v4 и проанализируем полученные результаты. Далее напишем свой код для того, чтобы запустить на Jetson транформерную модель Swin. Успешно запустим и взглянем на результаты. А ещё посмотрим, как запустит...

050. MMSegmentation фреймворк. Знакомство.

30:17

050. MMSegmentation фреймворк. Знакомство.

Просмотров 121День назад

В этом видео я познакомлю вас с фреймворком mmsegmentation от наших китайских братьев. Установим необходимые библиотеки. Скачаем предобученные модели, и испытаем их для задачи классификации дорожной обстановки, условно для беспилотного транспорта. Таймкоды: 00:00 | Введение 03:06 | Что из себя представляет MMSegmentation в целом 04:10 | Настраиваем инфраструктуру с conda 08:00 | Запускаем демо ...

02 Тестовое задание CV. UNet модель на PyTorch для детекции Canny (Python, OpenCV, PyTorch)

18:56

02 Тестовое задание CV. UNet модель на PyTorch для детекции Canny (Python, OpenCV, PyTorch)

Просмотров 22214 дней назад

В этом видео идёт разбор тестового задания на позицию Computer Vision инженер. Само условие тестового задания было не совсем понятно даже после уточняющих вопросов. Поэтому в результате выполнялось следующее задание, но моими словами: «На PyTorch создать модель UNet, для того чтобы можно было с помощью этой модели получать такой же результат, как и Canny Edge detection из библиотеки OpenCV. Рас...

01 Тестовое задание CV. Поиск таблицы на изображении и чтение данных из неё (Python, OpenCV, Pandas)

30:01

01 Тестовое задание CV. Поиск таблицы на изображении и чтение данных из неё (Python, OpenCV, Pandas)

Просмотров 19621 день назад

В этом видео идёт разбор тестового задания на позицию Computer Vision инженер. Фактически нужно было найти таблицу на изображении и, на основе данных из этой таблицы, нужно было сформировать выходной json. Задача выполняется с помощью элементов классического компьютерного зрения (фактически просто две функции). Всё остальное выполняется на табличных данных, полученных в качестве исходных данных...

Jetson Orin NX. Что за зверь? Испытаем на Yolo v8 и сравним с десктопными видеокартами.

25:03

Jetson Orin NX. Что за зверь? Испытаем на Yolo v8 и сравним с десктопными видеокартами.

Просмотров 194Месяц назад

Ссылка на это же видео на платформе: plvideo.ru/watch?v=Thz7xBMIRELa В этом видео мы познакомимся с Jetson Orin NX. Начнём от комплекта покупки, далее рассмотрим какие они бывают и кратко чем отличаются. Взглянем на то, что есть в железе и на программное обеспечение. А на последок проведём большой эксперимент на понимания производительности Jetson Orin NX на выполнении задачи сегментации кубика...

CVAT. Путешествие по рассылке. Часть 2 (март 2024 - май 2024)

28:55

CVAT. Путешествие по рассылке. Часть 2 (март 2024 - май 2024)

Просмотров 65Месяц назад

Ссылка на это же видео на Платформе: plvideo.ru/watch?v=kN49hOc3WBo6 Это продолжение путешествия по рассылке от CVAT. Посмотрим какая там есть информация. Что нового добавили о чём я ещё не знаю. Заодно выскажу своё мнение. Ещё будет продолжение. В этом видео даже наеду на содержимое рассылки от CVAT. Таймкоды: 00:00 | Введение 00:30 | Как получить формат YOLOv8 04:45| Самые известные датасеты ...

100. Segment Anything Model 2. Обзор возможностей.

32:41

100. Segment Anything Model 2. Обзор возможностей.

Просмотров 184Месяц назад

это видео на Платформе: plvideo.ru/watch?v=-Xm-7kiyjgXG Вот только на днях вышла вторая версия модели Segment Anything Model. Когда впервые увидел первую модель, то я был ей восхищён. Поэтому, как только вышла модель, я сразу пошёл смотреть как она работает и главное, что может делать. В этом видео я пройдусь по тем примерам, которые представили авторы модели, а также пример, который сделали Ro...

CVAT. Путешествие по рассылке. Часть 1 (ноябрь 2023 - март 2024)

36:19

CVAT. Путешествие по рассылке. Часть 1 (ноябрь 2023 - март 2024)

Просмотров 1372 месяца назад

Вот есть такое развлечение, приезжаешь на вокзал и берёшь билет на первый поезд, самолёт. Так сказать, полагаешься на случай. Вот и я решил поиграть в такую игру. Рассматривать то, что присылает в рассылке CVAT. Изначально думал, что там только то, что касается самой программы разметки. Но оказалось, что есть ещё интересные статьи. В этом видео я проделаю путь по той информации, которую CVAT пр...

Искусственный интеллект для бизнеса. О сложностях внедрения. (Динамичное видео)

1:08:50

Искусственный интеллект для бизнеса. О сложностях внедрения. (Динамичное видео)

Просмотров 4433 месяца назад

Видео в первую очередь создано для тех, кто хочет внедрять искусственный интеллект (ИИ) в свой бизнес. Я, как ML инженер, собрал в это видео ту информацию, о чём бизнес должен понимать. Информация разделена на блоки, каждый из которых описывает определённый элемент, с которым бизнес будет сталкиваться в большей или меньшей степени. Также это видео будет полезно абсолютно всем, кто интересуется ...

025 Классификация изображений. Часть 18. ConvNeXt (2022)

34:10

025 Классификация изображений. Часть 18. ConvNeXt (2022)

Просмотров 3353 месяца назад

Мы рассмотрели уже много моделей на основе свёрточных сетей и только 2 модели на основе трансформера. И могло сложиться впечатление, что в компьютерном зрении эпоха свёрток заканчивается и начинается эра трансформеров. Но команда от Facebook AI Research провела большое исследование и смогла доказать, что современная архитектура ещё может строиться на свёртках. Авторы за основу взяли уже старень...

024 Классификация изображений. Часть 17. Swin Transformer (2021)

35:29

024 Классификация изображений. Часть 17. Swin Transformer (2021)

Просмотров 1,2 тыс.4 месяца назад

Второй представитель трансформерной архитектуры, который мы рассмотрим - модель Swin (Shifted Windows). Причём рассмотрим как первую, так и вторую версию. Даже случится так, что сначала в первой версии введём определённую идею, а уже во второй версии заменим её. Данное видео создавалось с предположением, что вы уже видели видео про Vision Transformer. И если вы ещё не смотрели про Vision Transf...

023 Классификация изображений. Часть 16. EfficientNet v2 (2021)

24:48

023 Классификация изображений. Часть 16. EfficientNet v2 (2021)

Просмотров 2634 месяца назад

Ранее рассматривали первую версию EfficientNet. А теперь пришла очередь второй версии. Если сравнивать эти две версии, то конечно вторая версия лучше. Хотя вторая версия построена на основе первой, но с некоторыми изменениями. Также в научной статье был упомянут прогрессивный метод обучения модели. В этом видео мы затронем принципы такого обучения, а заодно познакомимся с двумя аугментациями Ra...

022 Классификация изображений. Часть 15. ViT (Vision Transformer) (2020)

40:44

022 Классификация изображений. Часть 15. ViT (Vision Transformer) (2020)

Просмотров 7174 месяца назад

Вот мы и добрались до очередной революции в области искусственного интеллекта - появление трансформера. В том числе в компьютерном зрении начинаем с модели Vision Transformer. В этом видео будет много новой информации. Начнём с разбора особенностей ViT модели. А затем углубимся в принципы работы Внимания и Трансформеров. Причём с трансформером будем разбираться сразу на задаче компьютерного зре...

021 Классификация изображений. Часть 14. RegNet (2020)

34:24

021 Классификация изображений. Часть 14. RegNet (2020)

Просмотров 2845 месяцев назад

021 Классификация изображений. Часть 14. RegNet (2020)

020 Классификация изображений. Часть 13. EfficientNet v1 (2020)

21:04

020 Классификация изображений. Часть 13. EfficientNet v1 (2020)

Просмотров 2565 месяцев назад

020 Классификация изображений. Часть 13. EfficientNet v1 (2020)

019 Классификация изображений. Часть 12. MobileNet v3 (2019)

20:54

019 Классификация изображений. Часть 12. MobileNet v3 (2019)

Просмотров 1735 месяцев назад

019 Классификация изображений. Часть 12. MobileNet v3 (2019)

018 Классификация изображений. Часть 11. MnasNet (2019)

18:25

018 Классификация изображений. Часть 11. MnasNet (2019)

Просмотров 1205 месяцев назад

018 Классификация изображений. Часть 11. MnasNet (2019)

017 Классификация изображений. Часть 10. MobileNet v2 (2019)

27:51

017 Классификация изображений. Часть 10. MobileNet v2 (2019)

Просмотров 3625 месяцев назад

017 Классификация изображений. Часть 10. MobileNet v2 (2019)

016 Классификация изображений. Часть 9. ShuffleNet (2018)

30:02

016 Классификация изображений. Часть 9. ShuffleNet (2018)

Просмотров 2046 месяцев назад

016 Классификация изображений. Часть 9. ShuffleNet (2018)

015 Классификация изображений. Часть 8. DenseNet (2018)

26:54

015 Классификация изображений. Часть 8. DenseNet (2018)

Просмотров 4836 месяцев назад

015 Классификация изображений. Часть 8. DenseNet (2018)

014 Классификация изображений. Часть 7. Wide ResNet (2017)

15:42

014 Классификация изображений. Часть 7. Wide ResNet (2017)

Просмотров 1646 месяцев назад

014 Классификация изображений. Часть 7. Wide ResNet (2017)

013 Классификация изображений. Часть 6. ResNeXt (2017)

25:40

013 Классификация изображений. Часть 6. ResNeXt (2017)

Просмотров 2426 месяцев назад

013 Классификация изображений. Часть 6. ResNeXt (2017)

012 Классификация изображений. Часть 5. SqueezeNet (2016)

35:01

012 Классификация изображений. Часть 5. SqueezeNet (2016)

Просмотров 2446 месяцев назад

012 Классификация изображений. Часть 5. SqueezeNet (2016)

011 Рефакторинг кода классификации. Часть 1 (жизненный опыт и программирование)

42:43

011 Рефакторинг кода классификации. Часть 1 (жизненный опыт и программирование)

Просмотров 4166 месяцев назад

011 Рефакторинг кода классификации. Часть 1 (жизненный опыт и программирование)

010 Классификация изображений. Часть 4. ResNet (2015)

39:04

010 Классификация изображений. Часть 4. ResNet (2015)

Просмотров 4377 месяцев назад

010 Классификация изображений. Часть 4. ResNet (2015)

009 Классификация изображений. Часть 3.2. Inception_v3 (2015)

28:36

009 Классификация изображений. Часть 3.2. Inception_v3 (2015)

Просмотров 5127 месяцев назад

009 Классификация изображений. Часть 3.2. Inception_v3 (2015)

008 Классификация изображений. Часть 3.1. GoogLeNet (2014)

31:10

008 Классификация изображений. Часть 3.1. GoogLeNet (2014)

Просмотров 2837 месяцев назад

008 Классификация изображений. Часть 3.1. GoogLeNet (2014)

007 Классификация изображений. Часть 2. VGG (VGG-16, VGG-19, VGG-16_bn)

27:56

007 Классификация изображений. Часть 2. VGG (VGG-16, VGG-19, VGG-16_bn)

Просмотров 3917 месяцев назад

007 Классификация изображений. Часть 2. VGG (VGG-16, VGG-19, VGG-16_bn)

@Motskin_AI 38 минут назад
Альтернативный канал и ссылка на это же видео на Платформа plvideo.ru/watch?v=k6-trmvwOzFm
@ostrov11 7 дней назад
Спасибо, отличный контент.
@Motskin_AI 6 дней назад
Рад стараться :)
@dead-maxim 7 дней назад
Спасибо за разжевывание кода и комментарии в нем. Именно это делает видео не только интересным, но и полезным
@Motskin_AI 7 дней назад
И вам спасибо, что смотрите и комментируете. Приятно!
@Motskin_AI 10 дней назад
Ссылка на это же видео на Платформе: plvideo.ru/watch?v=EO3ZkN380X_0
@bbrother92 10 дней назад
Слушай а он может опознавать объекты? img ->text?
@Motskin_AI 10 дней назад
Не понял вопрос. Даже преобразование изображение в текст может быть для разных задач. Если у вас изображение документа, а вам нужен из него текст, то это задача OCR и у этих ребят есть MM_OCR. А может нужно, чтобы описывало изображение, т.е. что находится, что происходит. То это Image Description. И для этого есть решения,
@bbrother92 10 дней назад
@@Motskin_AI я просто думал что он к сегментам еще может Image Description добавить
@Motskin_AI 10 дней назад
@@bbrother92 Так для этого модель должна быть определённой архитектуры и обучена соответствующим образом. А в этом видео обучалась на датасете, который размечался вот точно также как сейчас распознаётся. Т.е. для каждой модели, своя задача, но эта не предназначена для описания изображения. Хотя она знает где человек, где машина, как они расположены...
@rizef2166 11 дней назад
25:06 - ну судя по переводу 70 миллионов меченных, и это тип 1/40 от общего кол-ва
@Motskin_AI 11 дней назад
Я полностью с вами согласен. В видео оговорился. 70 млн размечено, а ещё 39*70 млн не размечено. Спасибо за вашу внимательность!
@raphaild279 11 дней назад
Привет. можешь объяснить как в CVAT размечать ровные квадарты точнее, если в других инструметах я могу зажать shift и строится ровный прямогульник с равными сторонами, то CVAЕ я хз. и второе: зачем нужен элипс? если я хочу обучить yolo находить круги но yolo работает с огран. рамками прямоуг. то как быть?
@Motskin_AI 11 дней назад
Здравствуйте. Если кратко, то с этими двумя вопросами я не смогу помочь. Что касается разметки квадратами (т.е. где все стороны равны), то даже и не знал, что где-то существует такой способ разметки. И даже не представляю для чего может понадобиться такая разметка. Может вы поделитесь информацией о задаче, для которой понадобилась такая разметка? Лично я использую разметку полигонами, но иногда и прямоугольниками. Всё остальное уже делаю скриптами на файле аннотации. По эллипсам, у меня есть предположение, что сила эллипса - это математическая формула, И если вам нужно разметить круглые формы, то только эллипс позволит вам сделать это с математической точностью, в отличии от полигона. И, кстати, YOLO не только прямоугольники находит, т.е. задача детекции, но ещё и выполняет задачу сегментации, а это значит, что подсветит вам этот круг в прямоугольном изображении.
@raphaild279 8 дней назад
@@Motskin_AI Обучил самую большую модель yolo8 обнаруживать круги с помощью инста сегментации на 1600 размеченных данных но yolo не справилась. Хочу попробовать другую нейросеть которая находит очертания окружности и выводит координаты xy и радиус. пытался сделать что то с (преобразованием хафа но не понял как интегрировать это в обучение) в общем я полный 0. Могу скинуть картинку что именно мне нужно обнаружить. может поможете советом.
@Motskin_AI 8 дней назад
@@raphaild279Да, конечно, сбросьте на почту, которая в конце видео приведена. я хоть буду понимать про что речь
@Motskin_AI 13 дней назад
Ссылка на это же видео на Платформе: plvideo.ru/watch?v=MBeIu9u2HnCe
@eduardmart1237 15 дней назад
А что за софтина смотреть загрузку системы? Ну типа top или htop
@Motskin_AI 15 дней назад
Я использую nvitop на стационарном компьютере. Может кто знает ещё что-то лучшее?, то пишите. По факту я взял первый попавшийся инструмент.
@eduardmart1237 15 дней назад
А ты на какой операционной системы все записываешь?)
@Motskin_AI 15 дней назад
Windows 11. Для ML использую ubuntu через WSL
@eduardmart1237 14 дней назад
@@Motskin_AI а она норм прикидывает видеокарту? Без супер багов?
@Motskin_AI 14 дней назад
@@eduardmart1237 как родную. А некоторые задачи обработки изображений так вообще быстрее исполняется под WSL, чем на чистом Windows. Возможно в Ubuntu более оптимальная файловая система. Но я исследования не проводил, просто обратил на это внимание.
@АлександрВальвачев-я6ъ 18 дней назад
Редкий случай отличного изложения материала. Спасибо.
@Motskin_AI 18 дней назад
Спасибо за тёплые слова, буду стараться держать качество.
@dead-maxim 19 дней назад
Хорошо что не взяли. Странная компания, надо избегать таких
@Motskin_AI 18 дней назад
Я считаю, что компания нормальная. И лично я горжусь, что в моей стране есть такая компания. Видимо просто сработал человеческий фактор. Как говорится не произошёл Match.
@davidmishel4348 19 дней назад
Спасибо за интересное видео, как раз разбираюсь с архитектурой UNet. Подскажите, это все собеседования на позицию senior или middle?
@Motskin_AI 18 дней назад
Там не обговаривалась позиция. Ко мне обратились, я даже и не был в активном поиске, уточнили мой опыт. Спросили зарплатное ожидание. Я ответил. Дальше начались этапы собеседования - значит меня, с моими зарплатными ожиданиями, рассматривали как потенциального кандидата. Но на 4-м этапе собеседования я уже осознавал, что по предстоящим обязанностям предстояло выполнять множество задач самостоятельно . Т.е. я оцениваю эту позицию ближе к сеньёрской. А вот в первом видео, там уже больше позиция middle.
@davidmishel4348 18 дней назад
@@Motskin_AI Все что хотел узнать, узнал (уровень заданий), спасибо, хорошей ЗП и итнересных проектов.
@Motskin_AI 18 дней назад
@@davidmishel4348 И вам спасибо за интерес
@dudedudedudedude3333 19 дней назад
Здравствуйте, спасибо за материал. Есть ли у вас github где можно посмотреть код из разных видео?
@Motskin_AI 18 дней назад
Ой, я приношу извинения. Пока публично не выставляю код. Стараюсь полностью его показывать в видео и вы всегда можете его воспроизвести. Конечно, понимаю, что это не удобно. Но, к сожалению, есть юридические нюансы и я не уверен, что могу фрагменты кода публиковать с возможностью мгновенного копирования. Ещё раз прошу прощение.
@dudedudedudedude3333 18 дней назад
@@Motskin_AI Спасибо за вашу работу. Достаточно и того что вы даёте!
@Motskin_AI 18 дней назад
@@dudedudedudedude3333 Спасибо за понимание
@itsokt0cry 19 дней назад
спасибо
@Motskin_AI 18 дней назад
И вам спасибо за спасибо :)
@МаксимБутаков-е4х 19 дней назад
Видео топ. Очень оригинально и структурно получается (особенно понравилась серия видео с армой). Как вообще ситуация обстоит в Беларуси с DS-культурой?
@Motskin_AI 18 дней назад
Спасибо за тёплые слова. С Армой планирую продолжать. Сейчас жарко и не хочется эксплуатировать видеокарту. Что касается ситуации с DS в Беларуси, то честно сказать не знаю. Когда были крупные компании, типа ЕПАМ, то они организовывали различные мероприятия, в том числе и по DS. Сейчас западные компании стараются не привлекать к себе внимания и прижали все пиар мероприятия в стране. А без спонсоров, сложно что-то организовывать. Российские компании медленно заходят, но сколько ещё времени понадобится - неизвестно. В любом случае в Минске куда больше возможностей для DS. У меня в Гомеле вообще с этим сложно. Даже компании, у которых есть офисы в Гомеле, не открывают вакансии для DS, а только в Минске. Так что по сообществам пока тихо. Я вот решил развивать глобальное русскоязычное сообщество. Пока только с помощью видео. Пока есть возможность - буду выпускать видео. Но люди точно есть, правда нас по объективным причинам не так много как тех же Джавистов, .NET, Геймдевовов, мобильщиков. И когда в Гомеле появятся условия для развития DS, то я с удовольствием поддержу.
@МаксимБутаков-е4х 19 дней назад
Очень круто
@Motskin_AI 18 дней назад
Спасибо что смотрите и спасибо за поддержку
@Motskin_AI 19 дней назад
Ссылка на это же видео на Платформе: plvideo.ru/watch?v=25RHkWZJXmTX Пишите в комментариях чтобы и как бы вы улучшили в этом решении
@IMMORTALmen 20 дней назад
"Только давайте без политики" - вот ты и ответил на свой вопрос)
@Motskin_AI 20 дней назад
Понятное дело, что политика важный фактор, но совсем бы не хотелось на канале, посвящённому элементам ИИ, обсуждать политические вопросы. Поэтому и попросил чтобы не было политики. Пусть хотя бы здесь в мире будут присутствовать и Россияне и Беларусы и Украинцы и другие народы, кто понимает русский язык, на котором говорит автор канала. Спасибо за ваше понимание
@Motskin_AI 26 дней назад
Ссылка на видео на Платформа: plvideo.ru/watch?v=0DWzRyCeIaUL
@RC_Ira 26 дней назад
Очень интересно, огромное спасибо вам за труд!❤🎉😊
@Motskin_AI 26 дней назад
И вам спасибо что смотрите и выражаете своё мнение
@eduardmart1237 28 дней назад
А в чем преимущество onnx? Быстрее?
@Motskin_AI 28 дней назад
onnx я использовал только для того, чтобы открыть модель в netron. А ещё это формат на границе зоны разграничения ответственности разных команд. Например, для DataScience и Computer Vision специалиста целью является получить обученную модель onnx. А у разработчиков, например веб-разрабочиков на .NET, Java, Python или для Android разработчиков это простой файл, который они встраивают в свой код и им не нужно задумываться как он создавался. Они просто знают, что он самый оптимальный на данное время в их компании...
@eduardmart1237 28 дней назад
А почему каждый слой конволюции дает разные значения? Точнее не слой а канал в первом слое. Разные начальные значения? Ну условно почему не 10 одинаковых?
@Motskin_AI 28 дней назад
Да, разные значения. Это как если бы мы нарисовали картинку зайчика и показали её на 5 секунд 10-ти человекам (аналогия со слоями свёртки) и попросили их по памяти нарисовать то, что они видели. Вроде у всех получится заец, но у всех он явно будет разным. Другие 10 человек, это уже как бы следующий слой. Это просто условно. Понятное дело, что в примере с зайцем все люди будут переносить свой опыт и знания о зайцах. Но если показать им всем картинку чего-то совсем неизвестного (несуществующего), то и результат получится более интересным.
@eduardmart1237 28 дней назад
Интересно - узнал что тот самый илья из opeAI изобрел AlexNet.
@Motskin_AI 28 дней назад
Ну может он удачно поучаствовал. Сеть то называется АлексНет, а не ИльяНет :)
@eduardmart1237 28 дней назад
Очень нравится что ты прям все подробно и споконой рассказываешь!) очень приятно смотреть.
@Motskin_AI 28 дней назад
Спасибо
@eduardmart1237 28 дней назад
А ссылки на исходники будут?
@Motskin_AI 28 дней назад
А я решил исходники не выкладывать. Всё равно они решают какую-то специфическую задачу, а тем более что по видео можно восстановить весь код.
@eduardmart1237 29 дней назад
И сколько времени у тебя ушло написать такой скриптик?
@Motskin_AI 28 дней назад
Честно, не помню. Конечно, много заготовок у меня уже было и они кочуют от одного проекта к другому, но пришлось конечно повозиться с алгоритмами обрезки, хотелось разнообразить данные. Так как не всё гладко шло, и как это обычно бывает на 1000 изображений обязательно находилось хоть одно, которое не вписывалось в общую логику. Но так как случаи живые, то приходилось и их покрывать кодом.
@eduardmart1237 29 дней назад
И получатся сами файлы сохраняются синхронно?
@Motskin_AI 28 дней назад
О! как я указал чуть ранее в ответе на комментарий - Да, сохранение данных выполняется синхронно, в противном случае получу Exception - проблему с доступом к файловой системе.
@eduardmart1237 29 дней назад
А в данном случае GIL не мешает многопоточности?
@Motskin_AI 28 дней назад
Почти не мешает. Правда конечно есть проблема с записью файлов из самого потока. Но я в коде многопоточность использую для обработки данных и удерживаю в памяти. А когда Чанк обработан, то в последовательном режиме создаю файлы. И никаких конфликтов не возникает.
@eduardmart1237 29 дней назад
А для гта5 исходники были получается?? Ну кстати можно нечто подобное сделать на открытом движке - типа юнити или унреал. Там даже специальные плагины для этого есть.
@Motskin_AI 29 дней назад
Как раз в статье (которую указал в комментарии для другого видео) и описывали как они делали. И это сильно не понравилось издателю GTA. В результате пришлось приостановить работы других энтузиастов. Если интересно, то покопайтесь в этой теме. Если будете искать self-driven GTA то обязательно найдёте следы. Но уже увы, много чего недоступно
@eduardmart1237 Месяц назад
А можно это как то оптимизировать и автоматом делать? Может мод какой нибудь. Чтоб сразу с bounding boxes было. Я знаю для unity есть - Perception
@Motskin_AI 29 дней назад
Для этого нужно вмешиваться в код игры, а у меня такой возможности нет. Например, как это делали в GTA можно посмотреть в статье: "Playing for Data: Ground Truth from Computer Games". Но в этом случае есть проблемы с авторскими правами.
@dimasi6675 Месяц назад
Крутая задача, кайфово смотреть!
@Motskin_AI Месяц назад
Как бы вот ещё добраться до задачи сегментации на этих данных :)
@dimasi6675 Месяц назад
Кайф, очень интересно смотреть
@Motskin_AI Месяц назад
Приятного просмотра
@dimasi6675 Месяц назад
Вау, спасибо за труд, очень круто!
@Motskin_AI Месяц назад
Вам явно зашла серия видео :), Желаю получить удовольствие от просмотра!
@dimasi6675 Месяц назад
Очень круто и доступно объясняешь. Спасибо чувак! Лайк, подписка.
@Motskin_AI Месяц назад
спасибо, приятного просмотра
@shehamane3518 Месяц назад
Бро это то что мне нужно. Уплетаю твой плейлист с большим интересом, хочу освежить память перед собесом. Очень круто что ты также рассказываешь про авторов статей
@Motskin_AI Месяц назад
Большое спасибо. Приятного просмотра. Что касается авторов, то здесь двоякое мнение. В любом случае познакомились с большим числом авторов и кто чего достиг. Однако в будущем крайне мало вероятно, что буду рассказывать про авторов.
@georgevonfloydmann1797 Месяц назад
Здравствуйте, разрешите поинтересоваться, почему Вы используете wsl для обучения моделей? В линуксе обучение эффективней?
@Motskin_AI Месяц назад
Наверное по следующим причинам: 1. для унификации процесса обучения на локальном компьютере, сервере и облаке. В 2-х последних случаях это точно Linux. 2. Эксперименты показали, что на базовых настройках компьютера взаимодействие с изображениями через WSL осуществляется быстрее чем на нативном Виндовс. Сам был удивлён, но что есть то есть. Но думаю этот вопрос можно было решить поковырявшись с настройками 3. А ещё встречаются библиотеки, для которых нет версий под windows. 4. И были проблемы с поддержкой GPU на виндовс. Вроде для TensorFlow. Не хотелось рисковать, поэтому сразу и перешёл на Ubuntu через WSL.
@АнтонинаМ-х2п Месяц назад
Спасибо за классные видосы, учусь вместе с ними, жду продолжения
@Motskin_AI Месяц назад
Спасибо, учту ваше мнение
@glukis7970 Месяц назад
С удовольствием прошел бы туториал вместе с вами) И если можно, было бы здорово если где то на гит хаб был выложен этот код для бенчмарка видюшек, прогнал бы свою GTX 1070
@Motskin_AI Месяц назад
Так это не бенчмарк, а так просто одна из задач. Что касается кода, то там же 20 строк кода, имею ввиду то, где обучается модель. А если выкладывать код, то нужно ещё и размеченные изображения кубиков, а вот это я уже и не могу в общем доступ выложить.
@georgevonfloydmann1797 Месяц назад
Спасибо большое Посмотрел всю серию, выделил для себя пару полезных идей для сегментации и классификации Можете пожалуйста направить меня в нужное направление? Хочу также как вы мониторить ресурсы видеокарты во время обучения, но не понимаю какую команду надо прописать или какой скрипт
@Motskin_AI Месяц назад
В моих видео показана nvitop устанавливается как питоновская библиотека. А потом просто в терминале вызывается nvitop и всё
@georgevonfloydmann1797 Месяц назад
@@Motskin_AI спасибо!
@zavodkeros Месяц назад
Красная точка на видео с детьми видимо была предложена к добавлению, так как маска захватывает область между рукой и одеждой.
@Motskin_AI Месяц назад
Да, я тоже это предположил, но видно же, что щель есть, которая без маски. Т.е. я, честно, не увидел проблемы, которую описали авторы. Но так как это вполне может быть, про продолжил описание. Хотя можно было поискать другие кадры, на которых эта проблема явно проявлялась, как это заметил уже делая своё видео.
@1234mifa Месяц назад
Заинтересовал момент с нехваткой видеопамяти, когда в ролике стала использоваться ОЗУ. Хотелось бы подробнее про этот момент. Я знаю что так можно, но думаю что Ари соблюдении каких-то условий, например наличие pci-e не ниже 4.0. вы изучали вопрос ?
@Motskin_AI Месяц назад
В этот вопрос не углублялся. Просто обратил внимание, что при нехватке памяти GPU, компьютер начинает использовать оперативную память. Всё очень медленно, но главное, что программа не падает.
@georgevonfloydmann1797 2 месяца назад
Attention is all you need! Спасибо за видео. Действительно, трансформеры буквально "трансформировали" область компьютерного зрения)
@Motskin_AI 2 месяца назад
Да и не только компьютерное зрение. На NLP ещё больше воздействие оказали трансформеры
@georgevonfloydmann1797 2 месяца назад
Спасибо за видео! Я задумался об обновлении рабочей станции. Сейчас сижу на старушке RTX2070 8gb. Она не вывозит такие модели как densenet и ResNet с большим кол-вом слоев. Мой вопрос: насколько эффективен конфиг двух спаренных rtx 2070? Насколько это будет хуже чем одна видеокарта на 16gb? Этим вопросом я задаюсь лишь только потому, что ограничен в деньгах.
@Motskin_AI 2 месяца назад
там же не только количество важно. Большую роль играет архитектура. У вас 20-я серия и то не топовая. А для работы с нейронными сетями каждое следующее поколение почти в 2 раза быстрее чем предыдущее. А на самом деле и ещё больше. Вы же не забывайте, что там не только куда ядра увеличиваются и память, а ещё разные плюшки добавляются. Лично я бы покупал бы что-то нового поколения. Но если большие финансовые ограничения, то что-то поколения -1. Например сейчас это RTX3090. Но когда-та там должна выйти RTX5090, поэтому можно немного подождать, и когда она выйдет, то на RTX4090 цены будут ниже, тогда можно взять, но только у проверенного человека.
@georgevonfloydmann1797 2 месяца назад
@@Motskin_AI понятно. Значит буду присматриваться к топовым решениям 30ой серии. Дорогое однако удовольствие - нейронные сети обучать!))
@georgevonfloydmann1797 2 месяца назад
Класс! Спасибо!
@Motskin_AI 2 месяца назад
Пожалуйста :)
@georgevonfloydmann1797 2 месяца назад
Спасибо! Я для себя построил такое интуитивное понимание: чем шире модель, тем больше карт активации, а значит модель сможет распознать более сложные закономерности. В то же время чем глубже модель, тем более низкоуровневые признаки она сможет распознать. Правильна ли моя догадка?
@Motskin_AI 2 месяца назад
Если бы логика была такая простая, то при увеличении глубины сети, она только и улучшалась, но к сожалению наступает момент, когда поведение меняется. Ещё в будущих видео об этом должно быть упомянуто, вроде efficientnet.
@georgevonfloydmann1797 2 месяца назад
Большое спасибо. Коммент в поддержку!
@Motskin_AI 2 месяца назад
Спасибо
@androidbyserega 2 месяца назад
А ImageNet-1K на таком железе сколько обучаться будет?
@Motskin_AI 2 месяца назад
могу только навсидку сказать. Предположим, что ImageNet-1K имеет 1.2 млн изображений. А я в серии видео про классификацию обучал на датасете в 5 тыс изображений (Арма). Пусть одинаковая модель и количество эпох и размер изображений 224 на 224 пикселя. Предположим у меня это занимало 1 час. Тогда 1.2 млн делим на 5 тыс. получаем в 240 раз дольше. Тогда ту задачу, которую я обучал на датасете арма за 1 час, на датасете ImageNet-1K займёт 240 часов. При всех равных условиях.
@androidbyserega 2 месяца назад
@@Motskin_AI 240 часов это 10 суток работы получается. А Nvidia a100 насколько быстрее будет работать примерно?
@Motskin_AI 2 месяца назад
@@androidbyserega У меня был опыт запускать задачу обучения трансформера на А100. Так время обучения было в 3 раза меньше чем на RTX3090. Но сейчас мы сравниваем RTX4090 и A100, поэтому зависит от задачи.Есть варианты, когда RTX4090 будет чуточку быстрее чем A100. Но H100 точно уделает RTX4090 раза так в 3 точно.
@androidbyserega 2 месяца назад
@@Motskin_AI все это невыносимо долго. Видимо придется с четырьмя видеокартами корпус собирать
@Motskin_AI 2 месяца назад
@@androidbyserega это будет невыносимо дорого :)
@georgevonfloydmann1797 2 месяца назад
Просмотрел уже 5 роликов в плейлисте по арме! И меня честно говоря повергает в шок тот факт, что найти канал с таким качественным и скрупулёзно составленным контентом почти нереально самостоятельно! Лишь только волей случая! А сколько еще таких бесценных каналов лежат за границей интересов алгоритмов ютуба! Страшно представить. Спасибо большое, мне как новичку в этой сфере будет очень полезно посмотреть все ваши видео!
@Motskin_AI 2 месяца назад
Спасибо вам. Что касается рекомендаций Ютюба, то полностью с вами согласен. С другой стороны лучше поздно чем никогда :) Надеюсь не разочарую :)
@АлександрДергилёв-п8х 2 месяца назад
Игорь, спасибо за очень качественный контент. Однозначно подписка. Есть ли в планах снять ролик про организацию самого проекта (код+инфраструктура), что щас называют mlops? Спасибо, ты крут:)
@Motskin_AI 2 месяца назад
Спасибо за ваши тёплые слова. Что касается планов по какому-нибудь проекту, то мысли есть, но маловероятно, что буду делать упор на инфраструктуру. Но если будет чем поделиться, то сделаю видео по этой теме.

Мотькин ИИ

Видео

Комментарии