Подскажите пожалуйста где лучше делать разметку данных для трафика в городе ? Нужно посчитать количество машин которые проезжают под камеры видеонаблюдения и отсортировать их по категориям - легковая, грузовик, автобус и тд
да действительно проще нанять людей и подписать неразглашение с ними, тем более 'родных' студентов лучше поддержать работой, чем удаленных, а депрессивные регионы поддержать задачами - сразу нимб над головой
Антон, спасибо за интересное видео!) А был ли у вас опыт использования предразметки, когда разметчики размечают данные не с нуля, а данные прогоняются через ML модель и разметчики только подправляют ответы ML модели? Если да, то можете более подробно рассказать, как вы организовали такой процесс, и как боролись с тем, что у вас чуть-чуть смещается баис из-за такого подхода?
Добрый день! Да, мы так регулярно делаем. Например базовая архитектура нашего сервера разметки именно так и устроена - cv-blog.ru/?p=368 У нас форматы входа и выхода одинаковы => на вход разметки можно подавать предразмеченые кадры алгоритма. В том же посте видео о том как мы это делаем. С биасом как-то не боремся. Обычно если это так критично - просто с нуля размечаем. Не помню даже когда такое было в последний раз.
Подскажите пожалуйста где лучше делать разметку данных для трафика в городе ? Нужно посчитать количество машин которые проезжают под камеры видеонаблюдения и отсортировать их по категориям - легковая, грузовик, автобус и тд
да действительно проще нанять людей и подписать неразглашение с ними, тем более 'родных' студентов лучше поддержать работой, чем удаленных, а депрессивные регионы поддержать задачами - сразу нимб над головой
Антон, спасибо за интересное видео!)
А был ли у вас опыт использования предразметки, когда разметчики размечают данные не с нуля, а данные прогоняются через ML модель и разметчики только подправляют ответы ML модели?
Если да, то можете более подробно рассказать, как вы организовали такой процесс, и как боролись с тем, что у вас чуть-чуть смещается баис из-за такого подхода?
Добрый день!
Да, мы так регулярно делаем. Например базовая архитектура нашего сервера разметки именно так и устроена - cv-blog.ru/?p=368
У нас форматы входа и выхода одинаковы => на вход разметки можно подавать предразмеченые кадры алгоритма. В том же посте видео о том как мы это делаем.
С биасом как-то не боремся. Обычно если это так критично - просто с нуля размечаем. Не помню даже когда такое было в последний раз.
А как с популярными сейчас semi-supervised подходами, при которых в принципе не нужно много размеченных данных? Они не подходят для ваших задач?
Я всё же про разметку писал. А semi-supervised это скорее про стратегии обучения.