Как организовать разметку датасета? Самые простые способы.

Поделиться
HTML-код
  • Опубликовано: 25 янв 2025

Комментарии • 6

  • @yanavin2964
    @yanavin2964 9 месяцев назад

    Подскажите пожалуйста где лучше делать разметку данных для трафика в городе ? Нужно посчитать количество машин которые проезжают под камеры видеонаблюдения и отсортировать их по категориям - легковая, грузовик, автобус и тд

  • @TrueDeex
    @TrueDeex 8 месяцев назад

    да действительно проще нанять людей и подписать неразглашение с ними, тем более 'родных' студентов лучше поддержать работой, чем удаленных, а депрессивные регионы поддержать задачами - сразу нимб над головой

  • @roman_kucev
    @roman_kucev 4 года назад

    Антон, спасибо за интересное видео!)
    А был ли у вас опыт использования предразметки, когда разметчики размечают данные не с нуля, а данные прогоняются через ML модель и разметчики только подправляют ответы ML модели?
    Если да, то можете более подробно рассказать, как вы организовали такой процесс, и как боролись с тем, что у вас чуть-чуть смещается баис из-за такого подхода?

    • @AntonMaltsev
      @AntonMaltsev  4 года назад

      Добрый день!
      Да, мы так регулярно делаем. Например базовая архитектура нашего сервера разметки именно так и устроена - cv-blog.ru/?p=368
      У нас форматы входа и выхода одинаковы => на вход разметки можно подавать предразмеченые кадры алгоритма. В том же посте видео о том как мы это делаем.
      С биасом как-то не боремся. Обычно если это так критично - просто с нуля размечаем. Не помню даже когда такое было в последний раз.

  • @Georgur
    @Georgur 4 года назад

    А как с популярными сейчас semi-supervised подходами, при которых в принципе не нужно много размеченных данных? Они не подходят для ваших задач?

    • @AntonMaltsev
      @AntonMaltsev  4 года назад

      Я всё же про разметку писал. А semi-supervised это скорее про стратегии обучения.