неверное определение p-value: это вероятность получить такие или более выраженные различия при условии, что нулевая гипотеза верна. Нулевая гипотеза -статистически значемых раззичий в выборках нет
Ваше определение верное, но в видео я старался объяснить более простым языком, что такое P value и я не называл четкого определения, так как бы его никто не понял, в видео я также совершил ошибку и сказал что p value меньше нуля целых пяти десятых, хотя на видео я показываю сотые. И в видео я сказал почти тоже самое что написали вы только другими словами
В экселе же есть функция нормального распределения, как и в numpy (и плотность и вероятность). Да и у нас выборка не особо большая, почему не использовать Стьюдента? Он тоже есть в экселе, но на питоне уже scipy нужен для плотности и вероятности. А нормальное распределение использовать, когда у нас большая выборка, ну на 50, 100, 1000 и тд значений?
@@andrey_shch извините, но это просто поток сознания оторванный от реальности. Сигма, она же среднеквадрати́ческое отклонение, это результат извлечения корня из дисперсии. А при расчёте дисперсии разность возводят к квадрат не для того, чтобы "избавиться от минуса", а для того, чтобы не получить 0 в числителе.
Можно считать медиану, но вообще все для того чтобы высчитать стандартное отклонение. Правильнее это будет мат. ожидание, по факту тоже среднее, но взвешенное по вероятностям возможных значений. Я у себя на проекте считаю конкретно по уникальным пользователям, также берем CR% по дням и дальше уже считаем стандартное отклонение
@@andrey_shch спасибо! А приходилось считать статистику у метрик отношения типа ARPU? Что-то слышал что с ними не все так просто, даже в инете нет калькуляторов для mde этих метрик, только одни конверсии )
@@BoQbL1k В интернете как раз считают через chi квадрат, который не может считать ARPU или что-то кроме CR%, а как раз в моем методе можно использовать любую метрику
Привет! Канал только начинает свой путь, поэтому твоя подписка очень важна для меня! Поддержи лайком и подпиской или никакой магии вне хогвартса! 😀
вроде что-то понял, это уже хорошо. Кстати спасибо за книгу, с котиками реально понятней.
отличный пример и объяснение
Какой ты красивый! Пришлось посмотреть два раза, тк залипла по началу 😂
неверное определение p-value: это вероятность получить такие или более выраженные различия при условии, что нулевая гипотеза верна.
Нулевая гипотеза -статистически значемых раззичий в выборках нет
Ваше определение верное, но в видео я старался объяснить более простым языком, что такое P value и я не называл четкого определения, так как бы его никто не понял, в видео я также совершил ошибку и сказал что p value меньше нуля целых пяти десятых, хотя на видео я показываю сотые. И в видео я сказал почти тоже самое что написали вы только другими словами
В экселе же есть функция нормального распределения, как и в numpy (и плотность и вероятность). Да и у нас выборка не особо большая, почему не использовать Стьюдента? Он тоже есть в экселе, но на питоне уже scipy нужен для плотности и вероятности. А нормальное распределение использовать, когда у нас большая выборка, ну на 50, 100, 1000 и тд значений?
спасибо
Благодарю тебя!
Спасибо за видео, а то все только воду льют, а у тебя прямо по шагам, по формулам.
Отлично объясняете, но ... Было бы еще понятнее если на игрушечных примерах все рассчитывать вручную, а не на калькуляторе.
А почему используется Z критерий для равенства средних, а не для равенства долей?
Лучший!!! Thx
8:20
Наоборот. Мы уверенны на 95% что мы получили такие данные случайно
мы проверяем верность нулевой гипотезы
@@dgrey. проверяйте
Спасибо, но больше расчётов было бы хорошо
по формуле расчета Z была сигма в квадрате, а в решении была взята просто сигма 0,03 и 0,04 - это ошибка или я не правильно понял?
Сигму возводят в квадрат чтобы убрать корень и да похоже я ошибся так как я использовал высчитанную сигму, спасибо за комментарий)
@@andrey_shch извините, но это просто поток сознания оторванный от реальности. Сигма, она же среднеквадрати́ческое отклонение, это результат извлечения корня из дисперсии. А при расчёте дисперсии разность возводят к квадрат не для того, чтобы "избавиться от минуса", а для того, чтобы не получить 0 в числителе.
Очень интересно 🤔
Прикольно, а если бы человек несколько раз покупал эту книжку, мы бы тоже просто общую среднюю считали ? А то есть же ещё средние от средних юзеров
Можно считать медиану, но вообще все для того чтобы высчитать стандартное отклонение. Правильнее это будет мат. ожидание, по факту тоже среднее, но взвешенное по вероятностям возможных значений. Я у себя на проекте считаю конкретно по уникальным пользователям, также берем CR% по дням и дальше уже считаем стандартное отклонение
У каждой покупки есть свой уникальный ID или артикул, так что ответ нет) Но даже так думаю вряд ли бы кто-то брал два раза одно и тоже
@@andrey_shch спасибо! А приходилось считать статистику у метрик отношения типа ARPU? Что-то слышал что с ними не все так просто, даже в инете нет калькуляторов для mde этих метрик, только одни конверсии )
@@BoQbL1k В интернете как раз считают через chi квадрат, который не может считать ARPU или что-то кроме CR%, а как раз в моем методе можно использовать любую метрику
👍🏽👍🏽👍🏽