[UA] Тестова співбесіда Junior Data Analyst: логіка, SQL, Google Sheet, метрики й ідеї для АВ-тестів

Поделиться
HTML-код
  • Опубликовано: 15 ноя 2024

Комментарии • 50

  • @vladislavzabrovsky773
    @vladislavzabrovsky773 7 месяцев назад +3

    Теорема Баєса імба, дякую за цікаве відео!

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад +1

      Ага, якраз знайшов цей приклад у статті, де її пояснювали.

  • @ВасильГерман-щ7з
    @ВасильГерман-щ7з Месяц назад +1

    Романе, дякую за відео, 5/6 співбесід переглянута.
    Сьогодні отримав велике задоволення, бо вирішував завдання паралельно з менті, ставив на паузу і вирішував логічні завднання, а також писав SQL скрипти. Тож перша половина співбесіди була практична.
    Щодо задачі про ТОП-3 хіти, коли співали дуетом, то помилки як в вас не зловив, бо ще перед перетворенням streams в int мав умову, що artist_count=2 і ця умова відрізала помилковий запис. Але пізніше зловив її на іншому завданні (коли шукав кореляцію популярності пісні і кількості виконавців).
    Також дивно, що в п'ятому завданні Володя знову не використав count(distinct artist_name) і таким чином позбувся дубльованих записів. Правда, головне, що виконав завдання.
    На завтра залишаю 6-у співбесіду, можливо, також зроблю її практичною, якщо буде достатьно часу.
    Успіху вам! :)

    • @romanpovzyk
      @romanpovzyk  Месяц назад +1

      Привіт, Василю.
      Захоплююся вашою системність і стабільністю. Але чомусь думав, що ви кожну співбесіду проходили разом з датасетом. Для того ж і додаю опис їх, щоб можна було відразу перевірити себе.
      Радий бачити такого глядача. Мотивує записувати нові співбесіди у майбутньому. До речі, маю ще одну співбесіду, свою єдину поза каналом.
      Ось тут: ruclips.net/user/livewnvgQOHqCM4?si=0R8TKGhIGO8729U0. Так що завтрашня може бути не останньою ☺️

    • @ВасильГерман-щ7з
      @ВасильГерман-щ7з Месяц назад

      @@romanpovzyk дякую за посилання, обов'язково подивлюсь і цю співбесіду.
      Я проробляв логічні завдання, а SQL планував в голові як робити, а потім вже звіряв в результатами роботи менті. Згідний, що це не те саме, що робити самому, та вже. Виправився :)
      Вчора прочитав вашу статтю про метрики на Доу, дуже цікаво і доступно написано. Сьогодні перегляну статтю про питання на співбесіді для аналітика.
      Ще раз дякую.

  • @ethanblackthorn3533
    @ethanblackthorn3533 6 месяцев назад +1

    Дивився це відео по фрагментам (задачі на логіку, SQL, метрики + A/B тести) протягом певного часу, і, як завжди, дякую за відео!

    • @romanpovzyk
      @romanpovzyk  6 месяцев назад +1

      Дякую вам, що дивитеся.
      Ну я і не розраховую, що хтось такі співбесіди за один раз гляне 😊

  • @Oleksii_Haivoronskyi1301
    @Oleksii_Haivoronskyi1301 6 месяцев назад +1

    Як завжди цікаво і корисно. Дякую!

    • @romanpovzyk
      @romanpovzyk  6 месяцев назад +1

      Дякую за перегляд) Радий, що вам сподобалося і допоможе у підготовці до подібних співбесід.

  • @АртемТерещенко-ц4э
    @АртемТерещенко-ц4э 7 месяцев назад +3

    Крутые задачи

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад

      Дякую, приємно чути.
      Стараюся приділяти їх пошуку принаймні дві години щоразу. Заодно і для себе дізнаюся цікаві речі (як у випадку з датасетом Spotify).

  • @RainbowCrewPeople
    @RainbowCrewPeople 7 месяцев назад +6

    подивився перше завдання, вийшло так:
    675 (час в хвилинах у них) - 2000 (хвилин у них)
    x (час в хвилинах у нас) - 1440 (хвилин у нас)
    x = 486
    486/60= 8.1 (0.1 від нашої години = 6 хв) = 8 година 6 хв

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад +1

      Так, цілком логічний хід думок та рішення.

  • @and1roman
    @and1roman 5 месяцев назад +3

    Задачку про години задавали на співбесіді в Ajax Systems зовсім недавно. Тому цілком практична задача)

    • @romanpovzyk
      @romanpovzyk  5 месяцев назад

      О, клас, приємно чути, що подібні задачі на розігрів дають на справжніх співбесідах.

  • @ВладГорбачов
    @ВладГорбачов 7 месяцев назад +1

    Романе, а курс статистики від Стенфордського університету можна буде переглядати ще раз після його терміну завершення?

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад

      А що мається на увазі під завершенням терміну? Завершення терміну фінансової допомоги для його проходження на півроку чи дедлайн курсу, який пишеться, щоб вас мотивувати?

    • @ВладГорбачов
      @ВладГорбачов 7 месяцев назад

      @@romanpovzyk Скрош за все саме просто термін проходження. Бо я цей курс вже майже завершив.
      Але ж рано чи пізно має завершитися дедлайн проходження. Тому хотів запитати, чи можна після цього терміну скористатися ним?
      А коли завершиться термін фінансової допомоги, то потрібно буде знову оплатити?

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад

      @@ВладГорбачов Не перевіряв, але думаю, що опісля можна просто попрохати її ще раз і отримати курс ще на півроку. Перевірте і відпишете, чи вийшло.

  • @vadimlp77
    @vadimlp77 7 месяцев назад +6

    Я б зразу перевів у хвилини. Тоді все просто. 675/1000*12=8.1=8 годин 6 хвилин

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад +3

      Так, на те вона і задачка для розігріву 🙂

  • @Ivan-tn8ss
    @Ivan-tn8ss 3 месяца назад +1

    Задача на хвилини, я зробив так, рахуєм загальну кількість хвилин в кожній країні, хвилини з норм країни ділим на новий формат і цей коефіцієнт множимо на 6:75 (675) = 8,1 = 8:06

    • @romanpovzyk
      @romanpovzyk  3 месяца назад

      Радий, що вам сподобалося.
      Так, до рішення тут можна прийти різними підходами. Головне, що відповідь вірна 😊

  • @DanCh3n
    @DanCh3n 7 месяцев назад +3

    6:75 ранку це хіба не 675 хвилин, адже ніде не вказано, що тут хвилини відрізняються від звичайних? Таким чином від початку дня пройшло 675. Для нашого часу 675/60 = 11.25

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад +1

      Ця країна знаходиться на Землі - у нашому з вами Всесвіті. Наші півдня тривають 12 годин, у цій країні 10 «інших» годин - але це все одно має бути однаковий проміжок за тривалістю. Тому наша хвилина і ця «інша» хвилина все ж відрізняються.

    • @ivanovserg8795
      @ivanovserg8795 4 месяца назад +1

      Ніт, тому що в них на добу: 20 годин * 100 хвилин = 2000 хвилин. А в нас 24*60 = 1440 хвилин

  • @yaroslavprysiazhnyi5979
    @yaroslavprysiazhnyi5979 4 месяца назад

    Чи коректно було б вирішити SQL-задача №4 знайшовши кореляцію (функція CORR)?

    • @ivanovserg8795
      @ivanovserg8795 4 месяца назад

      Гадаю що приблизно - так, можна.. Ну буде не 1,00 , а буде щось типу 0,90. Бо точність цього всього так собі..

  • @andrii_barannyk
    @andrii_barannyk 7 месяцев назад +1

    можливо дурне запитання, але не зрозумів трохи 2 задачку. Я собі сам поза відео так і розбив на 4 катеогрії студентів, відповідно отримав, що за 100 ч - 20 є хворі, і лише в 18 з них буде чорний язик. Відповідно виходить, що частка хворих з чорним язиком зі 100 ч буде 18, тобто ймовірність що наш клієнт, дійсно хворий і є 18%. Навіщо ще додаткове перемножання? Що я пропустив?

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад

      Питання не дурне.
      Ви пропустили, що те, що язик буде чорний - ще не означає, що людина хвора. Бо 80 * 0.3 = 24 людини будуть у такій ситуації, але здорові.
      Варто шукати відсоток хворих не серед всіх, а серед тих, хто з чорним язиком: 18 / 24.

    • @andrii_barannyk
      @andrii_barannyk 7 месяцев назад +1

      @@romanpovzyk Дякую. Зрозумів. Та далі та ж сама пропорція: х (частка хворих із загальної суми чорних язиків) = 18 * 100 / 42 = 43%

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад

      Так, якщо далі таким чином рахувати, то все правильно. Радий, що зрозуміло пояснив. Коли це візуально зобразити зі стрілками, то стає очевидно 😊

    • @maximgunther122
      @maximgunther122 7 месяцев назад

      @@romanpovzyk класична задача на формулу Баєса) а якщо я знаю як розв'язувати всі ці задачі є шанс потрапити на позицію Junior Data Analyst'а? Чи цього буде замало?

  • @aleksandra8579
    @aleksandra8579 7 месяцев назад +3

    Почему нет вопросов по презентации выводов анализа стейкхолдерам, мне кажется это крайне важный навык, важнее чем аб тесты, ведь не каждый дата аналитик это продуктовый аналитик

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад +1

      Врахую і спробую додати далі.
      Серед тих вакансій, на вимоги яких я орієнтуюся при підготовці питань, чи не у кожній є вимоги щодо AB-тестів. Тому і включаю це питання.

  • @serhiihulko9137
    @serhiihulko9137 7 месяцев назад +4

    дивують люди які налетіли в коменти і почали кучеряво "гнати дешеві понти". треба віддати належне Володимиру що не посоромився дати добро на опублікування відео. і до слова, фінанси не так вже й далеко від дата аналітики (особливо від продуктової).

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад +1

      Два негативних коментарі - це не «налетіли». Звісно, у комфортній атмосфері, маючи скільки завгодно часу та за відсутності відеозапису, набагато легше щось вирішувати.
      Так, Володимир - молодець. Аналітиків-початківців багато, але останніми місяцями лише одна людина на місяць наважується на подібну публічну спробу перевірити себе.

  • @Николай-л8ч8е
    @Николай-л8ч8е 7 месяцев назад +1

    Рiшення. Якщо iнша краiна перейшла на другий час, то скiльки там часу, то iх cобаче дiло, ще i Китайську стiну треба з ними збудувати)

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад +1

      Складно з таким підходом працювати з продуктом на міжнародних ринках 🙂 Треба таки адаптуватися.

  • @revini78
    @revini78 7 месяцев назад +1

    через силу додивився задачі sql. Автор каналу, роби краще - просто мовчи і не підсказуй, тоді побачиш всю ширину "глибин"

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад +2

      Я ж не професійний інтерв'юер.
      Мені все ж цікаво взаємодіяти з кандидатом, щоб розуміти хід думок. А не просто мовчки дивитися як вирішуються задачі.
      Ну і завдання тут - не завалити людину, а разом пройти задумані завдання.

    • @aleksandra8579
      @aleksandra8579 7 месяцев назад

      @@romanpovzykможна одразу попросити кандидата коментувати свої дії, а то він там щось мовчки робить незрозуміло що

  • @revini78
    @revini78 7 месяцев назад +2

    кров з очей. чи деградація освіти, чи гаджети, чи занадто багато різних "непотрібних" навичок, але аналітик який півгодини рішає просту ймовірнісну задачу про студентів то вже перебор. задачка рішаеться рівно одну хвилину з олівцем. далі дивитися просто вже не варто.

    • @romanpovzyk
      @romanpovzyk  7 месяцев назад +13

      Ви вирішили її у комфортному середовищі, без поспіху й стресу. Коли це вечір, пишеться відео і воно буде викладено на Ютуб, ви не бачите співбесідника, а тільки чуєте голос (під час шерингу екрану), то це все ж впливає на хід думок.
      За останні 5 місяців тільки п'ятеро аналітиків наважилося на таку перевірку себе. Всі вони молодці і я радий, що вдалося поспілкуватися з ними годину-другу.

    • @aleksandra8579
      @aleksandra8579 7 месяцев назад +3

      Ви ймовірно щовечора на літкоді тусуєтесь, пан весь в білому

  • @nikitashashenok5881
    @nikitashashenok5881 7 месяцев назад +2

    5 задачу можна зробити через селф джойн:
    SELECT
    sp.[track_name],
    sp_new.[track_name],
    sp.[artist(s)_name],
    sp_new.[artist(s)_name]
    FROM spotify2023 sp
    INNER JOIN spotify2023 sp_new ON sp_new.[track_name] = sp.[track_name]
    AND sp_new.[artist(s)_name] != sp.[artist(s)_name];

    • @financialanalyst4984
      @financialanalyst4984 7 месяцев назад +2

      думка правильна але реалізація ні. ось так коректно.
      select
      a.track_name,
      count(1) as cnt
      from spotify_2023 a
      join spotify_2023 b
      on a.track_name = b.track_name
      and a.artist_s_name b.artist_s_name
      group by a.track_name