Самые основы машинного обучения, лекция 2

Евгений Разинков

Просмотров 2,7 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 29 сен 2024

Комментарии • 18

@pavku 2 года назад ⁺⁴
Наконец-то хоть кто-то объяснил разницу между тестовой и валидационной выборкой. Спасибо!
@razinkov 2 года назад
Спасибо за отзыв!
@Лабораторияисследователя Год назад
Если монета 99 раз падает решкой, то и в сотый раз будет решка, потому что такая монета не может не быть нефальшивой. Насим Талеб.
@olegsysoev8950 Год назад
Евгений, Вы иногда рвете нить математического повествования, но на лицо большой большой труд и огромное желание передать материал. За это огромное спасибо, а все Ваши небольшие недочеты с лихвой перекрываются общим высоким качеством материала и его подачи. Для меня как экономиста-математика по образованию (работал 15 не по специальности) и начинающего аналитика данных (прошел курс в Яндекс Практикум) Ваш курс просто находка. На сегодняшний день даже в анализе данных без базовых методов ML уже никуда... Еще раз огромное Вам спасибо!
@razinkov Год назад
Спасибо за лестный отзыв!) Рад, что лекции оказались полезными)
@kotya7892 2 года назад ⁺²
Евгений, хотелось бы узнать Вашу историю становления специалистом. Какой путь Вы прошли, как изучали сферу и т.п. Если где-то есть уже такая информация \ ролик, дайте знать.
P. S. Спасибо за ролики и труд!
@razinkov 2 года назад ⁺²
Такого ролика нет, даже не думал, что кому-то это может быть интересно) Я подумаю, можно ли мою историю представить как что-то полезное для комьюнити, спасибо!
@kotya7892 2 года назад
@@razinkov спасибо за ответ 🙏
@JohnLee-bo9ft Год назад
Ещё не совсем понятно, что значит верхняя черта над функциями и элементами, речь же явно не про супремум
@razinkov Год назад ⁺¹
Это векторы и вектор-функции :)
@JohnLee-bo9ft Год назад
То есть w0 в данном случае просто константа b из классического определения линейной функции > f(x)= ax +/- b
@razinkov Год назад
Все верно :)
@pavku 2 года назад
Подскажите, как узнать много у меня данных или нет, чтобы определить размер обучающей выборки? Может на примерах.
@razinkov 2 года назад
Все зависит от следующих факторов:
- насколько сложно отличить объекты разных классов друг от друга?
- какое разнообразие данных внутри каждого класса? Какой баланс подклассов?
- насколько сложна модель, сколько у нее параметров?
Точных формул никто не даст, это скорее приходит с опытом. Для классического компьютерного зрения и неглубокого машинного обучения адекватные размеры выборок начинаются с нескольких сотен примеров, для глубокого обучения - скорее нескольких тысяч.
@LR-dr6zv Год назад
Здравствуйте, Евгений! Спасибо Вам большое за такую замечательную подачу материала. Начинаю постепенно прорабатывать формулы. Скажите, пожалуйста, на слайде с выводом целевой функции (1:28:26) может быть ошибка во второй строке? У меня получилось вывести только sum(ln(1/sqrt(2* pi * (sigma^2)))) = - (N/2) * ln(1/(sigma^2)) - (N/2) * ln (1/(2*pi)). Не понимаю, почему 2 пи в числителе.
@ilsur26 Год назад
Там ошибки нет, всё хорошо) Сумму логарифма константной слагаемой можно заменить домножением на N. Тогда получается sum(ln(1/sqrt(2* pi * (sigma^2)))) = N*ln(1/sqrt(2* pi * (sigma^2)))). Дальше используем формулу логарифма частного ln(a/b) = lna - lnb. Тогда получаем N*ln(1/sqrt(2* pi * (sigma^2)))) = N*ln 1 - N*ln(sqrt(2п*sigma^2)) = -1/2N*ln(2пи) - N*ln(sqrt(sigma^2)) = -1/2N*ln(2пи) + N/2*ln(1/sqrt(sigma^2)). А вот в знаках есть, если я не ошибаюсь (вместо минуса плюс перед N/2*ln(1/sqrt(sigma^2))
@LR-dr6zv Год назад
@@ilsur26 Спасибо за развернутый ответ! Потерянный знак у меня нашелся :) Да, получается если сигма и пи стоят один в числителе, другой в знаменатале, знаки должны быть разные. (N/2) * ln(1/(sigma^2)) + (N/2) * ln (1/(2*pi)) = -(N/2) * ln(sigma^2) - (N/2) * ln(2*pi)
@ilsur26 Год назад
@@LR-dr6zv 🔥

Следующие

Автовоспроизведение

Что делать когда данных мало? Лекция 3 по машинному обучению