Спасибо. Очень интересные курсы и примеры. В моей области (виброактивность ракетных двигателей) тоже много данных, которые требует похожей обработки для выявления причин различий между двигателями. К моей радости никто этим у нас не занимается. Я буду первый.
Очень прозрачное объяснение, спасибо большое преподавателю, сейчас подробно изучаю тему, сложно найти хороший и понятный материал, даже с знанием основ статистики
там где вы считаете самостоятельно(8.39 мин., In [ 3 ]) возникает, по-моему, помарка, у вас число ИСПЫТАНИЙ равно числу ВЫЖИВШИХ, а надо бы сложить, т.е. p1=s1/(n1+s1) и т.д. p2=.. , p=... , или я чего-то не понял?
Там ошибка. В ячейке 3 должно быть s1 = 135 # число успехов выборка А n1 = 1781 + s1 # число испытаний выборка А s2 = 47 # число успехов выборка Б n2 = 1443 + s2 # число испытаний выборка Б p1 = s1/n1 # оценка вероятности успеха выборка А p2 = s2/n2 # оценка вероятности успеха выборка Б p = (s1 + s2)/(n1+n2) # оценка вероятности успеха выборка А+Б z = (p2-p1)/ ((p*(1-p)*((1/n1)+(1/n2)))**0.5) # z-метка p_value = norm.cdf(-abs(z)) # z-метка и p-значение print(['{:.12f}'.format(a) for a in (abs(z), p_value * 2)]) Прошу прощения...
Худшего объяснения а/б тестирования не слышал.. неужели было сложно в этом примере сформировать гипотезу и сделать вывод? Ни что считаем, ни что проверяем, да кому это надо, получили p value и радуйтесь 😂
Спасибо. Очень интересные курсы и примеры. В моей области (виброактивность ракетных двигателей) тоже много данных, которые требует похожей обработки для выявления причин различий между двигателями. К моей радости никто этим у нас не занимается. Я буду первый.
Разумно. Удачи!
Очень прозрачное объяснение, спасибо большое преподавателю, сейчас подробно изучаю тему, сложно найти хороший и понятный материал, даже с знанием основ статистики
Спасибо огромное! превосходные лекции!
оч крутой лектор!
там где вы считаете самостоятельно(8.39 мин., In [ 3 ]) возникает, по-моему, помарка, у вас число ИСПЫТАНИЙ равно числу ВЫЖИВШИХ, а надо бы сложить, т.е. p1=s1/(n1+s1) и т.д. p2=.. , p=... , или я чего-то не понял?
Там ошибка. В ячейке 3 должно быть
s1 = 135 # число успехов выборка А
n1 = 1781 + s1 # число испытаний выборка А
s2 = 47 # число успехов выборка Б
n2 = 1443 + s2 # число испытаний выборка Б
p1 = s1/n1 # оценка вероятности успеха выборка А
p2 = s2/n2 # оценка вероятности успеха выборка Б
p = (s1 + s2)/(n1+n2) # оценка вероятности успеха выборка А+Б
z = (p2-p1)/ ((p*(1-p)*((1/n1)+(1/n2)))**0.5) # z-метка
p_value = norm.cdf(-abs(z))
# z-метка и p-значение
print(['{:.12f}'.format(a) for a in (abs(z), p_value * 2)])
Прошу прощения...
число успехов - количество умерших :D
Источник всех наших бед. LOL
а вся лекция про АБ тестирование где-то есть?
Частично упоминается в предыдущем видео.
Вы ругаете python, а у вас ошибка в вычислениях(n1 и n2)
Ошибка исправлена в комментариях ниже.
Худшего объяснения а/б тестирования не слышал.. неужели было сложно в этом примере сформировать гипотезу и сделать вывод? Ни что считаем, ни что проверяем, да кому это надо, получили p value и радуйтесь 😂
may you share code?
Here you can download zip-archive with materials
compscicenter.ru/courses/data-mining-python/2018-spring/classes/3900/#attachments
@@vladk4127 Спасибо!