Евгений, Вы иногда рвете нить математического повествования, но на лицо большой большой труд и огромное желание передать материал. За это огромное спасибо, а все Ваши небольшие недочеты с лихвой перекрываются общим высоким качеством материала и его подачи. Для меня как экономиста-математика по образованию (работал 15 не по специальности) и начинающего аналитика данных (прошел курс в Яндекс Практикум) Ваш курс просто находка. На сегодняшний день даже в анализе данных без базовых методов ML уже никуда... Еще раз огромное Вам спасибо!
Евгений, хотелось бы узнать Вашу историю становления специалистом. Какой путь Вы прошли, как изучали сферу и т.п. Если где-то есть уже такая информация \ ролик, дайте знать. P. S. Спасибо за ролики и труд!
Такого ролика нет, даже не думал, что кому-то это может быть интересно) Я подумаю, можно ли мою историю представить как что-то полезное для комьюнити, спасибо!
Все зависит от следующих факторов: - насколько сложно отличить объекты разных классов друг от друга? - какое разнообразие данных внутри каждого класса? Какой баланс подклассов? - насколько сложна модель, сколько у нее параметров? Точных формул никто не даст, это скорее приходит с опытом. Для классического компьютерного зрения и неглубокого машинного обучения адекватные размеры выборок начинаются с нескольких сотен примеров, для глубокого обучения - скорее нескольких тысяч.
Здравствуйте, Евгений! Спасибо Вам большое за такую замечательную подачу материала. Начинаю постепенно прорабатывать формулы. Скажите, пожалуйста, на слайде с выводом целевой функции (1:28:26) может быть ошибка во второй строке? У меня получилось вывести только sum(ln(1/sqrt(2* pi * (sigma^2)))) = - (N/2) * ln(1/(sigma^2)) - (N/2) * ln (1/(2*pi)). Не понимаю, почему 2 пи в числителе.
Там ошибки нет, всё хорошо) Сумму логарифма константной слагаемой можно заменить домножением на N. Тогда получается sum(ln(1/sqrt(2* pi * (sigma^2)))) = N*ln(1/sqrt(2* pi * (sigma^2)))). Дальше используем формулу логарифма частного ln(a/b) = lna - lnb. Тогда получаем N*ln(1/sqrt(2* pi * (sigma^2)))) = N*ln 1 - N*ln(sqrt(2п*sigma^2)) = -1/2N*ln(2пи) - N*ln(sqrt(sigma^2)) = -1/2N*ln(2пи) + N/2*ln(1/sqrt(sigma^2)). А вот в знаках есть, если я не ошибаюсь (вместо минуса плюс перед N/2*ln(1/sqrt(sigma^2))
@@ilsur26 Спасибо за развернутый ответ! Потерянный знак у меня нашелся :) Да, получается если сигма и пи стоят один в числителе, другой в знаменатале, знаки должны быть разные. (N/2) * ln(1/(sigma^2)) + (N/2) * ln (1/(2*pi)) = -(N/2) * ln(sigma^2) - (N/2) * ln(2*pi)
Наконец-то хоть кто-то объяснил разницу между тестовой и валидационной выборкой. Спасибо!
Спасибо за отзыв!
Если монета 99 раз падает решкой, то и в сотый раз будет решка, потому что такая монета не может не быть нефальшивой. Насим Талеб.
Евгений, Вы иногда рвете нить математического повествования, но на лицо большой большой труд и огромное желание передать материал. За это огромное спасибо, а все Ваши небольшие недочеты с лихвой перекрываются общим высоким качеством материала и его подачи. Для меня как экономиста-математика по образованию (работал 15 не по специальности) и начинающего аналитика данных (прошел курс в Яндекс Практикум) Ваш курс просто находка. На сегодняшний день даже в анализе данных без базовых методов ML уже никуда... Еще раз огромное Вам спасибо!
Спасибо за лестный отзыв!) Рад, что лекции оказались полезными)
Евгений, хотелось бы узнать Вашу историю становления специалистом. Какой путь Вы прошли, как изучали сферу и т.п. Если где-то есть уже такая информация \ ролик, дайте знать.
P. S. Спасибо за ролики и труд!
Такого ролика нет, даже не думал, что кому-то это может быть интересно) Я подумаю, можно ли мою историю представить как что-то полезное для комьюнити, спасибо!
@@razinkov спасибо за ответ 🙏
Ещё не совсем понятно, что значит верхняя черта над функциями и элементами, речь же явно не про супремум
Это векторы и вектор-функции :)
То есть w0 в данном случае просто константа b из классического определения линейной функции > f(x)= ax +/- b
Все верно :)
Подскажите, как узнать много у меня данных или нет, чтобы определить размер обучающей выборки? Может на примерах.
Все зависит от следующих факторов:
- насколько сложно отличить объекты разных классов друг от друга?
- какое разнообразие данных внутри каждого класса? Какой баланс подклассов?
- насколько сложна модель, сколько у нее параметров?
Точных формул никто не даст, это скорее приходит с опытом. Для классического компьютерного зрения и неглубокого машинного обучения адекватные размеры выборок начинаются с нескольких сотен примеров, для глубокого обучения - скорее нескольких тысяч.
Здравствуйте, Евгений! Спасибо Вам большое за такую замечательную подачу материала. Начинаю постепенно прорабатывать формулы. Скажите, пожалуйста, на слайде с выводом целевой функции (1:28:26) может быть ошибка во второй строке? У меня получилось вывести только sum(ln(1/sqrt(2* pi * (sigma^2)))) = - (N/2) * ln(1/(sigma^2)) - (N/2) * ln (1/(2*pi)). Не понимаю, почему 2 пи в числителе.
Там ошибки нет, всё хорошо) Сумму логарифма константной слагаемой можно заменить домножением на N. Тогда получается sum(ln(1/sqrt(2* pi * (sigma^2)))) = N*ln(1/sqrt(2* pi * (sigma^2)))). Дальше используем формулу логарифма частного ln(a/b) = lna - lnb. Тогда получаем N*ln(1/sqrt(2* pi * (sigma^2)))) = N*ln 1 - N*ln(sqrt(2п*sigma^2)) = -1/2N*ln(2пи) - N*ln(sqrt(sigma^2)) = -1/2N*ln(2пи) + N/2*ln(1/sqrt(sigma^2)). А вот в знаках есть, если я не ошибаюсь (вместо минуса плюс перед N/2*ln(1/sqrt(sigma^2))
@@ilsur26 Спасибо за развернутый ответ! Потерянный знак у меня нашелся :) Да, получается если сигма и пи стоят один в числителе, другой в знаменатале, знаки должны быть разные. (N/2) * ln(1/(sigma^2)) + (N/2) * ln (1/(2*pi)) = -(N/2) * ln(sigma^2) - (N/2) * ln(2*pi)
@@LR-dr6zv 🔥