Поиск объектов на видео с Python и TensorFlow с нуля, cтроим и обучаем нейросеть UNet

Павел Васильев

Просмотров 54 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 28 янв 2025

Комментарии • 76

@goga-pro2024 Год назад ⁺¹⁸
самое лучшее обьяснение за всю мою жизнь, а я с нейронками с 2014 года, обьясни людям в следующем видео как продолжить обучение не начиная с нуля, этого матерьяла мало в нете
@НикитаФилиппов-л5г 2 года назад ⁺²⁰
Отличное Видео. С пояснением всего что сделано. Автору большое спасибо. Если такое же видео будет сделано и для других типов сетей или например PyTorch, было бы очень круто! Автору большое уважение.
@ernisesama1636 3 года назад ⁺¹⁸
Наверное самое понятное обяснение на RUclips. Продолжай пожалуста
@Alex_Smirnov Месяц назад
Я конечно не понимаю в нейронках вообще ничего, но думаю что на начальном этапе нейронке нужно определить свойства, все характеристики объекта. К примеру сначала определяется формат изображения, его разрешение, итд. Нужно просканировать весь файл на наличие свойств, исходя из этих свойств определять дальнейший алгоритм действий с файлом. То есть я хочу сказать что объект для анализа должен иметь максимально полную информацию о себе. Эпохи как я понял это своего рода определение координат для фокуса внимания. Чем меньше эпох тем умнее алгоритм сети. Исправлять дефекты так себе идея, это ведь не фотошоп, сеть должна это делать без ошибок автоматически. Материал демонстративно хорош, речь в ролике это самое лучшее.
@TheBestSurvival Год назад ⁺⁶
Качественно и доступно, а главное реально интересно и полезно! Автору желаю 100500 подписчиков))
@АлександрВальвачев-я6ъ 5 месяцев назад
Великолепный подход. Жаль, что мало тем. Вы очень многим помогли. Спасибо.
@cekkush 2 года назад ⁺²
Павел, очень доступно. Огромное спасибо. Ждём продолжения! Привет из Азербайджана.
@bekabad 2 года назад ⁺²
Теперь я знаю, про что будет моя дипломная работа! Спасибо!
@Dima日本 8 месяцев назад
ну что? получилось с дипломной?
@bekabad 8 месяцев назад ⁺¹
@@Dima日本 Нет, заставили писать что-то более прикладное. Пришлось CRM на Django бахнуть.
@АннаМельникова-к5я 3 года назад ⁺⁷
Отличное видео! Спасибо автору за работу!
@vvvanysha 4 месяца назад ⁺¹
Разжевал до атомов. Хотелось бы увидеть урок, как на базе 100 (условно) разных изображений научить нейросеть находить определенный предмет. Так же желательно через Google Cloud Platform.
@timur.shhhhh 7 месяцев назад
Классное видео, все понятно объяснил, ещё попробую на этой недели протестить, если получится, напишу в PS(если не забуду).👍
@727doto 3 года назад ⁺¹
Отличное видео, спасибо, очень интересно! С нетерпением жду продолжения !
@СветланаБурмутская-в2ш 2 года назад
Надо же как интересно . Класс! Здорово придумано.
@sakamotoras 2 года назад ⁺¹
Спасибо за ролик!
@НиколайНескажу-э7т 2 года назад
Спасибо! Отличное видео! Все настолько хорошо объяснили!
@dyachenkokonstantin67 2 года назад
Спасибо, очень чисто и понятно.
@НастяКолесник-б4н 3 года назад
Очень полезное видео ! Спасибо большое !
@АртурТарасов-о7г 2 года назад ⁺¹
когда пытаюсь вставить свои изображения вылезает такая ошибка:
TypeError: Input 'filename' of 'ReadFile' Op has type float32 that does not match expected type of string.
что мне делать?
@СашкаСемеркин 2 года назад
Очень круто, спасибо большое
@yood1e Год назад
Годнота
@MrKappasama 11 месяцев назад
Спасибо за видео! А можете подсказать, в какую сторону копать если нужно найти бинарную маску блоков текста на картинке? (в идеале так вырезать текст и восстановить фон)
@seoonlyRU 2 года назад
красота) лайк от СЕООНЛИ!
@СашаШевченко-д5р Год назад
Здравствуйте, у меня вопрос, чем кардинально будет отличаться данный метод от метода локализации? Суть же останется той же, только объект будет всего лишь один или есть различия?
@ксеня-г9я 3 года назад
Очень полезное дело 👍
@meowxd1337 2 года назад ⁺¹
А есть какой нибудь готовый датасет для лис, котов итд?
@nikolaynovikov5756 3 года назад ⁺¹
Жду следующие видео, когда будет ???
@PLenchak Год назад
Отличное видео! Подскажите, как можно распечатывать карты признаков по мере обучения?
@ДмитрийСафронов-р2ъ Год назад
А для чего применяется подряд tf.image.convert_image_dtype и следом нормализация image/255? Разве это не одно и тоже?
@ВладКлинский-ы1у Год назад ⁺¹
Отличное видео. Подскажите, а что за среда разработки используется на видео?
@user-of-world Год назад
Юзай Google collab, офигенная штука
@ЗаметкиПроверьвсесам 2 года назад
круть
@lecturer_abramenkova 3 года назад ⁺¹
Спасибо)
@КонстантинБабаян Год назад
Добрый день! Отличное видео, спасибо. Подскажите пожалуйста, в каком формате вы экспортировали данные из supervisely?
@lyftzeigen Год назад
Здравствуйте! Sypervisely обновился, наверное сейчас это называется "Export to masks".
@КонстантинБабаян Год назад
@@lyftzeigen большое спасибо!
@dmitrykhomyakov8451 Год назад
@@КонстантинБабаян Sypervisely. не предлагает экспорт в таком формате. На выбор дано 6 вариантов: Sypervisely, YOLO8, просто images (видимо без аннотаций), DOTA, COCO Keypoints, image links to CSV. Какой из этих форматов можно использовать в коде по Вашему видео?
@RRRR-u5n Год назад
Здравствуйте, а куда сохраняются уже обработанные кадры? По коду они должны сохранятся в репозиторий videos/processed, я повторил, но у меня ничего в этой папке не появляется. Помогите, пожалуйста!
@RRRR-u5n Год назад
ПОМОГИТЕ ПОЖАЛУЙСТА
@kirilllas7247 7 месяцев назад
Как сделать чтобы нейронка распознавала нужные изображения в браузере, например листаешь вкладку с фотографиями, и она как то распознает нужное, по стокам
@workvng 3 месяца назад
нашел решение?
@workvng 3 месяца назад
ало кирилчик
@grey111111111 Год назад
На Colab ошибка на ячейке с обучением модели:
InvalidArgumentError: Graph execution error:
@grey111111111 Год назад
поменял GPU на CPU и заработало, почему так может быть?
@SeregaZinin 5 месяцев назад
Даешь пример TensorFlow на С++ ? :)
@НиколайНескажу-э7т 2 года назад
Кстати. А вот если задача стоит так, чтобы модель к цвету не привязывалась, а к форме - перевод в градации серого решит задачу? Например, изменение освещенности это сможет решить?
@s1ngle77 3 года назад
Блин круто препод топ
@djosmer2 2 года назад
Подскажи. Допустим есть картинка, на ней один объект и снизу рядом текст, надо сделать рамку вокруг объекта с текстом. Сделать обводку не пойдет, т.к. повторяет форму объекта, надо чтоб линия плавно обводила объект с текстом, например как у стикеров. Сможет ли это сделать нейронка?
@lyftzeigen 2 года назад
На мой взгляд, применять нейросеть для решения такой задачи, не самое оптимальное решение. Думаю, что проще воспользоваться классическими методами, например, выделение контуров текста и применение морфологических операций с последующей обработкой.
@RockstarAlexander 2 года назад
👍👍👍👍👍👍👍👍
@Grenkitop Год назад
Добрый день , Павел .Как с вами связаться ? Я хочу попросить вас обучить Аи под мою модель , я заплачу.
И если интересно в дальнейшем мне нужна будет помощь для добавления разных объектов в мою библиотеку . В целом возможно долгосрочное сотрудничество в этом направлении
@GAVNO 2 года назад
спасибо
@ДенисСедищев Год назад
Здравствуйте.
Имею следующую ошибку во время первой эпохи обучения:
ValueError: Dimensions must be equal, but are 400 and 8 for '{{node dice_bce_mc_loss/mul}} = Mul[T=DT_FLOAT](dice_bce_mc_loss/unstack, dice_bce_mc_loss/unstack_1)' with input shapes: [?,400,500], [?,8,8].
В коде изменил лишь размер изображения (на 400x500), количество классов-цветов (с 8 на 2) и добавил указание количества каналов для png (mask = tf.io.decode_png(mask, channels=3)), а также небольшое изменение в Skip Connections - downsample_skips = reversed(downsample_skips[:0]).
На какую часть программы порекомендуете взглянуть?
Спасибо.
@lyftzeigen Год назад ⁺¹
Здравствуйте! Изменение разрешения изображения тянет за собой все остальное. Нужно разобраться в размере данных, которые проходят через нейросеть и через все функции.
А порекомендую взглянуть на связку YOLO + Roboflow:
blog.roboflow.com/train-yolov7-instance-segmentation-on-custom-data/
@Сынмаминойподруги-м9ъ Год назад
Добрый день, спасибо за видео) очень помогло
Но есть один вопрос, как подтянуть координаты пересмотра классов?
@RRRR-u5n Год назад
А куда сохраняются обработанные кадры? Подскажи пожалуйста
Или как сохранить их локально?
@zloslovie 18 дней назад
не лейбл ми не нашел в интернете где скачать не второе...
@ЕгорМорковкин-э4л 2 года назад
Уважаемый автор, не могли бы вы помочь и предоставить файл с моделью нейронной сети которую Вы реализуете в данном ролике
@lyftzeigen 2 года назад
В описании к видео есть ссылка на Google Collab, где вы можете самостоятельно опробовать работу нейронной сети.
@ЕгорМорковкин-э4л 2 года назад
@@lyftzeigen я имею ввиду схему нейронной сети, которая у вас демонстрируется на 2:30
@ДмитрийЯльчик 2 года назад
Как размечать, как выгружать - ни слова об этом :(
@sakamotoras 2 года назад
согласен - это достаточно полезная информация была бы!
@НикитаФилиппов-л5г 2 года назад
На счет этого можно посмотреть видео по разметке данных именно указанными инструментами. Хотя согласен, можно было бы добавить описание.
@MrSatanizd 2 года назад
г_спади видос на 11 из 10 по объяснению и демонстрации как вся это нейронная хня работает!!!!111.
Есть ли возможность связаться с автором видео для общения по разработке решения распознавания объектов на видео?
@somebody5186 Год назад
!!!
@iiiyx 2 года назад ⁺⁷
Слишком много "почему" после просмотра, поэтому это, увы, не обучающее видео.
@romastep6576 Год назад
Очень интересно, но почти ничего не понятно. Не в сторону автора выпад, а в сторону недостаточности моих знаний для полного понимания разжеваного до атомов материала 😂
@ilyatarasevich1008 5 месяцев назад
File "C:\1111\1111\1111\main.py", line 12, in load_images *
image = tf.io.image.convert_image_dtype(image, tf.float32)
AttributeError: module 'tensorflow._api.v2.io' has no attribute 'image'
@ilyatarasevich1008 5 месяцев назад
Помогите пожалуйста решить ошибку
@mattewcox7065 2 года назад
кто нибудь сталкивался с проблемой, что именно маски не читаются с ошибкой:
InvalidArgumentError: Matrix size-incompatible: In[0]: [189888,1], In[1]: [3,1]
[[{{node rgb_to_grayscale/Tensordot/MatMul}}]] [Op:IteratorGetNext]
@mattewcox7065 Год назад
@@aligatorpe а я ззафиксил кстати и забыл как уже
@MrIvansamara 17 дней назад
Видимо supervicely дает маски, которые уже в формате grayscale. Так что можно попробовать убрать строку mask = tf.image.rgb_to_grayscale(mask)
@mattewcox7065 12 дней назад
@@MrIvansamara наверное, вот бы на два года раньше, но все равно спасибо
@revoluxe Год назад
💪

Следующие

Автовоспроизведение

[DeepLearning | видео 1] Что же такое нейронная сеть?