Самая ПОЛНАЯ и ПОНЯТНАЯ лекция по A/B тестам (метрики, гипотезы, статистика и инструменты)

Поделиться
HTML-код
  • Опубликовано: 27 ноя 2024

Комментарии • 88

  • @alinasmyrnova9193
    @alinasmyrnova9193 3 месяца назад +87

    Пожалуйста запиши видео как ты проводишь АБ тест, чтобы было понятнее как применяется формула выборки и вообще весь процесс. Пожалуйста пожалуйста пожалуйста

  • @Anton-pk5et
    @Anton-pk5et 3 месяца назад +14

    С твоего канала начался мой путь в аналитике 1,5 года назад. Хоть я уже и работаю в аналитике но видосы все равно смотрю, они топ. Спасибо за контент)

    • @art_alf-b9b
      @art_alf-b9b 3 месяца назад

      как успешно?

  • @VadimKvachev
    @VadimKvachev 3 месяца назад +12

    Второй лайк за понятное объяснение формулы расчета размера выборки. Обычно то, что гуглится, в большинстве случаев похоже скорее на формулу вызова дьявола, чем на то, чем будешь пользоваться в работе

    • @Noukash
      @Noukash  3 месяца назад +1

      Да - при этом гуглятся РАЗНЫЕ формулы - это вообще подстава - если не знаешь что искать то найдешь несколько разных формул)). Я постарался простыми словами объяснить что внутри к чему. Рад, что полезно!

  • @CECTPAXAOC
    @CECTPAXAOC 3 месяца назад +8

    спасибо!!! реально не зря потратила 47 минут) прям более лаконичного и простого объяснения, как это происходит в реальной работе, не встречала)

    • @Noukash
      @Noukash  3 месяца назад

      Супер! Я очень рад, что видео полезно! Чем сложнее топик, тем сложнее объяснить его "просто" и я рад, что у меня получилось!

  • @Lucas_Gr666
    @Lucas_Gr666 3 месяца назад +3

    Поддержу других комментаторов - огромное спасибо!)
    Прочитал с десяток статей и посмотрел еще больше видео по аб-тестам, но только тут наконец-то есть простые и короткие формулы с пояснениями, а не выжимки из учебников по матану (а в разных источниках еще и разные формулы 😂), отдельная благодарность за пример про MDE, в последней статье которую читал, рекомендовали Монте-Карло всегда использовать 😅
    Лайк поставил, видео в закладки сохранил, чувствую еще не раз буду пересматривать (при очередном запуске аб-теста) ❤

    • @Noukash
      @Noukash  3 месяца назад

      Спасибо большое за комментарий! Я так рад, что видео полезно и все понятно. Супер!

  • @Lukas-r3o
    @Lukas-r3o 3 месяца назад +5

    Круто! Самое понятное и доходчивое объяснение всего процесса, от и до, не перегруженное теорией и формулами, грамотно разбавленное примерами и аналогиями! Спасибо большое

    • @Noukash
      @Noukash  3 месяца назад +1

      Спасибо большое за комментарий! Я старался сделать понятно, объяснить все простыми словами и одновременно достаточно глубоко чтобы было понимание, что откуда берется. Рад, что получилось!

  • @ЖанеттаМакарова-е5в
    @ЖанеттаМакарова-е5в 3 месяца назад +4

    Спасибо Андрей! Очень подробно и содержательно. Полиночке, особое спасибо за прекрасное оформление видео. Ребята видно, что у Вас жизнь налаживается во всех отношениях, особенно в рабочих моментах. Профи уровень растёт и это здорово. Так держать! Удачи!

    • @Noukash
      @Noukash  3 месяца назад +2

      Спасибо большое за комментарий! Полине передал! Жизнь кипит :)) Работаем! Очень приятная обратная связь - еще раз спасибо

  • @РустемМатиев
    @РустемМатиев 2 месяца назад +3

    Боже, первый человек, который нормально написал формулу размера выборки и объяснил ее, везде какая-то жесть написана или вообще тупо ссылка на калькулятор
    Да и в целом офигенный видос, который объясняет все адекватно по пунктам, спасибо огромное!

    • @Noukash
      @Noukash  2 месяца назад

      Спасибо! Рад что зашло!

  • @techbent
    @techbent 3 месяца назад +5

    Крутая тема, спасибо. Еще не прсмотрел, но начало нравится

  • @ТимаИзместьев
    @ТимаИзместьев 5 дней назад

    Спасибо большое за лекцию! С удовольствие смотрел и конспектировал. Но хочется увидеть применение этих подходов на практике. Так сказать hands on кейс

  • @ДмитрийЛебедев-д5ж
    @ДмитрийЛебедев-д5ж 3 месяца назад +6

    Про центральную предельную теорему хотелось бы подробнее. Видео супер

    • @AnatoliiGrytsiuk
      @AnatoliiGrytsiuk 3 месяца назад

      Согласен, пример сложен к восприятию

  • @VadimKvachev
    @VadimKvachev 3 месяца назад +5

    Лайк сразу за тему, посмотрю чуть позже

    • @to_love2005
      @to_love2005 3 месяца назад

      Поступлю так же

  • @caseygold1283
    @caseygold1283 3 месяца назад +2

    Андрей, спасибо большое за обучающие видосы ❤ такая информация в видео формате на вес золота))

  • @mikhailkaravaev5668
    @mikhailkaravaev5668 Месяц назад

    Классное видео, спасибо. От себя добавлю: было бы классно, если бы использовалась общепринятая терминология: доп.метрики -- прокси-метрики, контр-метрики -- заграждающие метрики (guardrail metrics)

  • @moriohgoose
    @moriohgoose Месяц назад

    Спасибо за такой качественный видос! Только начинаю вкатываться в аб-тестирование, ваш ролик очень помог 🤌

  • @АлександрСафонкин-е5ь
    @АлександрСафонкин-е5ь 3 месяца назад +1

    О! Спасибо, Андрей! Это супер полезный гайд!)

  • @иворбул
    @иворбул 2 месяца назад +1

    Спасибо за видео! Очень внятное и понятное объяснение! Красава!

  • @DandyMsk
    @DandyMsk 3 месяца назад +1

    Большое спасибо!!! Кратко и по делу 👍

  • @Markerus
    @Markerus 3 месяца назад +2

    Балдеж видос! Скину команде чтобы тоже в теме были))

    • @Noukash
      @Noukash  3 месяца назад

      Супер! Если будут вопросы - пишите!

  • @Tulsky_pryanik_sasha
    @Tulsky_pryanik_sasha 2 месяца назад +1

    Спасибо! Стало яснее

  • @Иринакайнова-э2г
    @Иринакайнова-э2г 3 месяца назад +1

    Актуальная тема, всегда актуальная

  • @ОлегТюляев-р3ф
    @ОлегТюляев-р3ф 3 месяца назад

    Андрей, спасибо за хорошее видео! Получился идеальный дайджест для погружения в тему 🤝

  • @ДамирМагжанов-ш5ы
    @ДамирМагжанов-ш5ы 3 месяца назад +7

    О, круто. А то я написал в резюме, что уже не только исполнял, но и дизайнил это.😂

    • @kris_the_analyst
      @kris_the_analyst 3 месяца назад +1

      невозможно "исполнять" АВ тест без дизайна)

  • @КаролинаКокашинская
    @КаролинаКокашинская 3 месяца назад

    Спасибо большое!

  • @PythonMonster7
    @PythonMonster7 3 месяца назад +1

    На 19:14 написано b - вероятность обнаружения эффекта если он существует. На самом деле вероятность обнаружения эффекта если он существует - это мощность и она 1-b. b - вероятность ошибки 2 рода, т.е. не увидеть разницы когда она есть.

    • @Noukash
      @Noukash  3 месяца назад

      Да - я говорил про статистическую мощность - бета величина обратная мощности. Очепятка

  • @Tot_samyi_ucishka
    @Tot_samyi_ucishka 3 месяца назад +3

    Жаль не было примеров с каким-то датасетом, чтобы на его примере рассчитать

  • @VadimKvachev
    @VadimKvachev 3 месяца назад +3

    Интересно ещё про историю с ratio-метриками, как их преобразовывать, может быть, тянет на отдельное видео

    • @HoyHame7
      @HoyHame7 3 месяца назад +2

      Могу ответить одним словом: линеаризация🙃На хабре лежит парочка интересных статей, как с такими метриками работать

  • @nikitaaksenov569
    @nikitaaksenov569 3 месяца назад +1

    Большое спасибо за видео! На русском ютубе на удивление огромная куча воды по Аналитике данных. Возможно, стоит сделать обновленный гайд по всем прикладным штукам и реальным кейсам в работе аналитика (разбора реальных задач почти нет)

  • @olyapopova
    @olyapopova 3 месяца назад

    Привет, спасибо за крутой разбор!
    Все понравилось, единственное для меня - сложно было осознать до конца все используемые в видео формулы, как будто стоило им уделить чуууть больше времени и объяснить чуть проще)
    Для меня как для практикующего продакта не совсем ясно, как и для чего их использовать. Самые проблемные - формулы расчет выборки и оценка p-value. Такое ощущение, что на практике можно отбросить формулы и пользоваться калькуляторами Evan Miller и Neil Patel, я верно тебя поняла?))
    А порядок и логика в голове сложились такие:
    1. Формируем гипотезу и готовим варианты. Убеждаемся, что нулевая гипотеза верна.
    2. Определяем размер выборки через калькулятор на основе гипотезы и уровня доверия к результату.
    3. Запускаем тест и даем ему пройти полностью.
    4. Убеждаемся, что p-value нас устраивает (до 3%). Больше всего вопросов тут и совсем не понятно, как его посчитать более автоматически.
    5. Рассчитываем доверительный интервал через калькулятор. Есть ли статистически значимая разница?
    6. Ищем дополнительные инсайты.
    7. Принимаем решения об изменениях в продукте.

    • @Noukash
      @Noukash  3 месяца назад

      Привет! Рад, что видео полезно! Да - я хотел уместить все самое важное в 40 минут поэтому конкретным формулам досталось меньше внимания) В общем и целом можно пользоваться калькуляторами - единственное пара моментов
      1. То что нулевая гипотеза верна это наше предположение которое мы можем опровергнуть или не опровергнуть в результате теста
      4. Evan miller calculator в помощь также
      А в остальном +- по шагам все правильно - обязательно уделить внимания достаточно метрикам - какие метрики будете мерить и какие важны

  • @marines8725
    @marines8725 Месяц назад

    спасибо!

  • @rurncndsidsi
    @rurncndsidsi 3 месяца назад

    Андрей, спасибо за очень крутой гайд! У меня возникли сомнения по поводу формулы расчета выборки. Я сейчас прохожу курс по А/В тестированию, и там дают такую же формулу оценки размера одной группы, но используют не std^2, a 2*std^2, так как мы должны брать в учёт стандартное отклонение обеих групп std_x^2 + std_y^2 = 2*std^2, так как на исторических данных стандартные отклонения контрольной и тестовой групп равны. На синтетических данных А/А и А/В тесты показывают, что с 2*std^2 ошибки первого и второго рода контролируются на заданном уровне.

    • @Noukash
      @Noukash  3 месяца назад

      Я бы сказал зависит от величины и известна ли или нужно аппроксимировать дисперсию. Есть способы вроде CUPED чтобы наоборот снижать размер выборки за счет исторических данных и в т.ч того чтобы убрать шум из результатов и снизить дисперсию результатов

  • @lodosmor
    @lodosmor 3 месяца назад +1

    По наполнению видео очень похоже на бесплатный курс по AB-тестам одной небезызвестной компании, но в то же время - это условная шпаргалка. Обязательно буду пересматривать перед собеседованиями. Спасибо большое за такой качественный контент❤
    Также у меня есть вопрос: Насколько вообще целесообразно учить формулы матстата, по типу дисперсии, p-value, доверительных интервалов и т.д для различных тестов? Часто ли это спрашивают на собеседованиях?
    В моем понимании это не самая полезная вещь, потому что, если ты знаешь, как это работает, тебе не составит труда это загуглить, и получится даже надежнее, чем когда ты держишь все это в голове

    • @Noukash
      @Noukash  3 месяца назад

      Главное понимать смысл формул, почему получается их применять и какие есть ограничения в тестировании. Знать все формулы 1 в 1 не обязательно и невозможно

  • @mystery-v8y
    @mystery-v8y 3 месяца назад +2

    теория - это конечно хорошо, но если бы эти 40 минут ты разбирал и комментировал практический пример - это было бы куда более полезно. в любом случае благодарю!

  • @АннаПупкина-ю1в
    @АннаПупкина-ю1в 3 месяца назад +1

    Спасибо, Андрей! А можно разобрать какое-нибудь тестовое задание, которое высылают в ответ на резюме при приёме на работу?

  • @condemime1
    @condemime1 3 месяца назад +2

    Спс братишка, завтра гляну. Будем внедрять, а то аж стыдно как-то.

    • @Noukash
      @Noukash  3 месяца назад

      Супер супер супер - пиши если будут вопросы. Тема сложная, но базу освоить нетрудно

  • @kobatrader7375
    @kobatrader7375 2 месяца назад

    Какие книги можете посоветовать по аналитике данных, бизнес-аналитике, продуктовой аналитике, статистике, АБ - тестированию, визуализации, метрикам для аналитиков, принимать решение на основе аналитики?

  • @BoQbL1k
    @BoQbL1k 3 месяца назад

    Спасибо, доверительный интервал ценности этого видео 100%!
    Скажи пожалуйста, чтобы юзать ремоут конфиг его же все равно надо загрузить в новую версию аппы и получается мы все равно выкатываем новую версию перед АВ? Или если не обновляем аппу, то там какие-то ограничения для конфига, типо можно поменять текст и картинку на пейволе, но дизайн пейвола и цены нельзя. Потому что я разрабам говорил что новая версия не нужна, но они говорят что без нее не обойтись)

  • @Георгий-ч2н9щ
    @Георгий-ч2н9щ 3 месяца назад

    Спасибо за видео. Я пытаюсь самообучиться аналитике немного и конечно больше половины видео для меня совершенно не понятно. Наверное, оно для тех кто уже в аналитике так или иначе.

  • @ivanrubnenkov919
    @ivanrubnenkov919 3 месяца назад

    Привет, про сэмпл сайз можно пример плз. Обычно бутстрепом на АА размер можно эффективно оценить

  • @kobatrader7375
    @kobatrader7375 3 месяца назад

    Какме курсы можешь посоветовать по AB тесты?

  • @ИЗИ-я
    @ИЗИ-я 3 месяца назад +2

    Как тебе идея для видео про pet-проекты для аналитика, на просторах интернета нет особо информации, а темка то интересная и полезная. Понятное дело для разработчиков, они пишут софт (фронт/бэк). А что в этой теме можно сделать аналитику?

    • @VadimKvachev
      @VadimKvachev 3 месяца назад

      @@ИЗИ-я прогноз погоды! (Не шутка). Но по-любому придется осваивать фронт и немного бэк, если хочешь упаковать это в виде сайтика

    • @Noukash
      @Noukash  3 месяца назад

      Идея хорошая, но мне лень самому делать примеры для видео - будет побольше времени сделаю!

    • @ИЗИ-я
      @ИЗИ-я 3 месяца назад

      @@Noukash блинб, лень ужасная штука, у самого такая болезнь (

  • @M0javeCourer
    @M0javeCourer 3 месяца назад +2

    Почему вы такой грамотный и мотивированный на результат с женой.Я бы первые 40 к долларов заработал и уволился бездельничать.

    • @Noukash
      @Noukash  3 месяца назад

      Очень люблю учится и применять знания :) Ну и сейчас я живу в дорогом месте - тут 40к долларов это не так много

    • @M0javeCourer
      @M0javeCourer 3 месяца назад +1

      @@Noukash это здорово. Я даже как сис админ, слабо понимаю терминологию в видео. Но пока подписался, мотивируюсь по чуть чуть.

  • @RedWolf_guitar
    @RedWolf_guitar 3 месяца назад

    Здравствуйте, Андрей! Спасибо за видео. Хочу устроиться в IT, чтобы получить знания и опыт и затем открыть свой бизнес (не обязательно именно в IT сфере). Для этого выбрал профессию аналитика, подумал, что владение данными это основа бизнеса. Но аналитиков много: бизнес-аналитик, системный аналитик, data scientist, продуктовый аналитик, маркетинговый и пр. Вы не подскажете, что актуальнее всего было бы для моей цели?

    • @shutka80
      @shutka80 3 месяца назад +2

      Выбирайте стезю продуктового аналитика. Это самые близкие к реальному бизнесу ребята. Научитесь считать рентабельность, разные полезные метрики, находить инсайты, точки для роста, слабые места, четко формулировать и ставить цели для своего будущего бизнеса. Если бизнес будет в высоконкурентной сфере, то будет не лишним освоить маркетинговую аналитику - это про эффективное взаимодействие с аудиторией, как на нее влиять (ARPU, ARPPU, CPC...). Бизнес аналитик должен знать BPNM - его основная роль как у компилятора в языке программирования: переводить запрос бизнес заказчика на язык понятный программистам. Бизнес аналитик должен уметь качественно вести диалог как с заказчиком так и с бэкендом. Тут меньше всего требуется непосредственное владение разными техническими инструментами, но необходимо хорошее понимание процессов разработки и владение терминологией. Системный аналитик, напротив, должен хорошо знать железо. Это человек, который оценивает текущую инфраструктуру компании и дает рекомендации с заделом на будущее по ее развитию. Тут надо шарить про инновации в железе и сервисах, разницу между колоночными и строчными БД ну и тд. Дата сайнтист - это про обучение моделей. В реальном бизнесе на себя вряд ли оправдает отношение потраченные ресурсы/выхлоп.
      По типам характера я делю аналитиков так (все очень условно):
      продуктовый - холерик с общительностью выше среднего
      маркетинговый - холерик с общительностью выше среднего
      бизнес - сангвиник с максимальной общительностью
      системный - флегматик с нормальной общительностью
      датасайнтист - флегматик/ меланхолик с УСИДЧИВОСТЬЮ, общитительность ниже среднего

    • @RedWolf_guitar
      @RedWolf_guitar 3 месяца назад

      @@shutka80 спасибо огромное! Супер-полезный комментарий

  • @sodcio
    @sodcio 3 месяца назад

    Меня часто спрашивают, знаю ли я AB тесты

  • @detr1st983
    @detr1st983 3 месяца назад

    Как ты провёл свой первый A/B тест?

  • @ОльгаШомина-ч9с
    @ОльгаШомина-ч9с 3 месяца назад +1

    глулый вопрос: у меня есть группа клиентов, у них конверсия в покупку 6%. как определить дисперсию этой величины?

    • @Noukash
      @Noukash  3 месяца назад

      Загугли про дисперсию распределения Бернулли - p(1-p) = 0.06*0.94

  • @ЕвгенийДенисенко-я2и
    @ЕвгенийДенисенко-я2и 3 месяца назад

    Удивительное рядом, но оно запрещено)))

  • @claudian6257
    @claudian6257 2 месяца назад +1

    сложнооооо:(( эти формулы меня пугают

  • @ansine1777
    @ansine1777 3 месяца назад

    Интересное видео, но возник тупой вопрос: А зачем нужны отдельные инструменты для a\b тестов, когда есть Python и R? Я не аналитик данных, но статистический анализ провожу. Все приведенные тесты я могу проводить в R. Единственная фича отдельных инструментов для a\b тестов, как я понял, в том, что бы результаты тестов сразу подгрузить в продукт.

    • @Noukash
      @Noukash  3 месяца назад +1

      Нужно технически как то сплитовать пользователей - показывать им разные варианты, удаленно менять параметры, запускать и останавливать тест. Я про это и говорю, что статистический анализ можно сделать ручками, но нужна платформа для управления самим тестом)

    • @Lucas_Gr666
      @Lucas_Gr666 3 месяца назад

      Добавлю еще, что это может быть нужно для
      1) продакт менеджеров и маркетологов - им тоже может быть нужно тестить несложные гипотезы (условный цвет кнопок) + инструментарий для принятия данных когда не нужно разбираться с формулами или кодом на питоне (это не всегда хорошо, и лучше проводить все с аналитиком, но бывает по разному)
      2) Если нужно запускать и проводить много однотипных аб-тестов - это банально быстрее и удобнее
      3) Так легче поддерживать консистентность тестов - всегда будет применен один подход к тесту
      4) Получение данных для рассвета метрик (на примере вариокуба из Яндекса) - не все данные можно получить в сыром виде, а такое решение может быстро обсчитать нужную метрику
      Ну и то, что сказал Андрей - инструмент как сплитовалка, которая будет всегда корректно делить трафик на группы.
      Но у них много ограничений, естественно, поэтому большие компании обычно имеют либо свой инструмент, либо самоличные системы.

  • @unicoxr5tj417
    @unicoxr5tj417 3 месяца назад +1

    автор, а это универсально для РФ СНГ и западного ИТ?

    • @Noukash
      @Noukash  3 месяца назад

      Это универсально для любого IT

  • @stnjl2216
    @stnjl2216 3 месяца назад +2

    как успехи с meta ?

    • @Noukash
      @Noukash  3 месяца назад +2

      Жду последнего этапа!

    • @VadimKvachev
      @VadimKvachev 3 месяца назад +4

      @@Noukash держим кулачки!

  • @ВикторБерезкин-ц4э
    @ВикторБерезкин-ц4э 3 месяца назад

    Непонятно про ЦПТ

  • @ШашлычникСаня
    @ШашлычникСаня 3 месяца назад

    ты это от себя говоришь? или продюсер))

  • @_AbUser
    @_AbUser 3 месяца назад

    я через 5 минут уже спать захотел.. Можно сразу по делу, а ползать в каких то частных случаях из ниоткуда в никуда.. ? 5й класс учебника по физике в помощь.. Дано, найти, решение... и не придется по 15 минут языком воду толочь.. А то получается фиг знает что делаем, фиг знает какими методами, и фиг знает что получаем на выходе... человек сидит с этими метриками как дурачок с фантиками играется и сам не знает чего вообще от них хочет...

    • @Noukash
      @Noukash  3 месяца назад

      Тяжело включать голову - бывает

  • @arinawin8964
    @arinawin8964 3 месяца назад

    что то на 17 мин. я уже приуныла. как то не очень понятно - чувствуется что на практике не распробовано, просто теория из сети озвученная голосом.
    понятно одно - что на нальном этапе все это не имеет смысла

    • @Noukash
      @Noukash  3 месяца назад +1

      Это все теория наложенная на практический опыт) Я АБ тестов за свою карьеру запускал и оценивал сотни. Если вам непонятно - можно пересмотреть несколько раз или попозже на свежую голову - ну или предметно задать вопрос)

  • @stnjl2216
    @stnjl2216 3 месяца назад

    как успехи с meta ?