Самые основы машинного обучения, лекция 2

Поделиться
HTML-код
  • Опубликовано: 29 сен 2024

Комментарии • 18

  • @pavku
    @pavku 2 года назад +4

    Наконец-то хоть кто-то объяснил разницу между тестовой и валидационной выборкой. Спасибо!

    • @razinkov
      @razinkov  2 года назад

      Спасибо за отзыв!

  • @Лабораторияисследователя

    Если монета 99 раз падает решкой, то и в сотый раз будет решка, потому что такая монета не может не быть нефальшивой. Насим Талеб.

  • @olegsysoev8950
    @olegsysoev8950 Год назад

    Евгений, Вы иногда рвете нить математического повествования, но на лицо большой большой труд и огромное желание передать материал. За это огромное спасибо, а все Ваши небольшие недочеты с лихвой перекрываются общим высоким качеством материала и его подачи. Для меня как экономиста-математика по образованию (работал 15 не по специальности) и начинающего аналитика данных (прошел курс в Яндекс Практикум) Ваш курс просто находка. На сегодняшний день даже в анализе данных без базовых методов ML уже никуда... Еще раз огромное Вам спасибо!

    • @razinkov
      @razinkov  Год назад

      Спасибо за лестный отзыв!) Рад, что лекции оказались полезными)

  • @kotya7892
    @kotya7892 2 года назад +2

    Евгений, хотелось бы узнать Вашу историю становления специалистом. Какой путь Вы прошли, как изучали сферу и т.п. Если где-то есть уже такая информация \ ролик, дайте знать.
    P. S. Спасибо за ролики и труд!

    • @razinkov
      @razinkov  2 года назад +2

      Такого ролика нет, даже не думал, что кому-то это может быть интересно) Я подумаю, можно ли мою историю представить как что-то полезное для комьюнити, спасибо!

    • @kotya7892
      @kotya7892 2 года назад

      @@razinkov спасибо за ответ 🙏

  • @JohnLee-bo9ft
    @JohnLee-bo9ft Год назад

    Ещё не совсем понятно, что значит верхняя черта над функциями и элементами, речь же явно не про супремум

    • @razinkov
      @razinkov  Год назад +1

      Это векторы и вектор-функции :)

  • @JohnLee-bo9ft
    @JohnLee-bo9ft Год назад

    То есть w0 в данном случае просто константа b из классического определения линейной функции > f(x)= ax +/- b

    • @razinkov
      @razinkov  Год назад

      Все верно :)

  • @pavku
    @pavku 2 года назад

    Подскажите, как узнать много у меня данных или нет, чтобы определить размер обучающей выборки? Может на примерах.

    • @razinkov
      @razinkov  2 года назад

      Все зависит от следующих факторов:
      - насколько сложно отличить объекты разных классов друг от друга?
      - какое разнообразие данных внутри каждого класса? Какой баланс подклассов?
      - насколько сложна модель, сколько у нее параметров?
      Точных формул никто не даст, это скорее приходит с опытом. Для классического компьютерного зрения и неглубокого машинного обучения адекватные размеры выборок начинаются с нескольких сотен примеров, для глубокого обучения - скорее нескольких тысяч.

  • @LR-dr6zv
    @LR-dr6zv Год назад

    Здравствуйте, Евгений! Спасибо Вам большое за такую замечательную подачу материала. Начинаю постепенно прорабатывать формулы. Скажите, пожалуйста, на слайде с выводом целевой функции (1:28:26) может быть ошибка во второй строке? У меня получилось вывести только sum(ln(1/sqrt(2* pi * (sigma^2)))) = - (N/2) * ln(1/(sigma^2)) - (N/2) * ln (1/(2*pi)). Не понимаю, почему 2 пи в числителе.

    • @ilsur26
      @ilsur26 Год назад

      Там ошибки нет, всё хорошо) Сумму логарифма константной слагаемой можно заменить домножением на N. Тогда получается sum(ln(1/sqrt(2* pi * (sigma^2)))) = N*ln(1/sqrt(2* pi * (sigma^2)))). Дальше используем формулу логарифма частного ln(a/b) = lna - lnb. Тогда получаем N*ln(1/sqrt(2* pi * (sigma^2)))) = N*ln 1 - N*ln(sqrt(2п*sigma^2)) = -1/2N*ln(2пи) - N*ln(sqrt(sigma^2)) = -1/2N*ln(2пи) + N/2*ln(1/sqrt(sigma^2)). А вот в знаках есть, если я не ошибаюсь (вместо минуса плюс перед N/2*ln(1/sqrt(sigma^2))

    • @LR-dr6zv
      @LR-dr6zv Год назад

      @@ilsur26 Спасибо за развернутый ответ! Потерянный знак у меня нашелся :) Да, получается если сигма и пи стоят один в числителе, другой в знаменатале, знаки должны быть разные. (N/2) * ln(1/(sigma^2)) + (N/2) * ln (1/(2*pi)) = -(N/2) * ln(sigma^2) - (N/2) * ln(2*pi)

    • @ilsur26
      @ilsur26 Год назад

      @@LR-dr6zv 🔥