[UA] Тестова співбесіда Junior Data Analyst: логіка, SQL, Google Sheet, метрики й ідеї для АВ-тестів
HTML-код
- Опубликовано: 19 июн 2024
- Таймкоди відео:
00:00:00 Знайомство з кандидатом.
00:01:00 Задача зі зміною системи часу.
00:08:46 Задача про студентів і їхнє тестування язиковим депресором.
00:25:24 Налаштування датасету для SQL-задач.
00:29:48 SQL-задача №1: топ-5 артистів з найбільшою кількістю хітів на Spotify.
00:36:01 SQL-задача №2: топ-3 хіти, які записані дуетом.
00:49:22 SQL-задача №3: три виконавці, які мають найбільшу кількість років з хітами.
00:51:17 SQL-задача №4: чи правда те, що чим більше артистів у пісні, тим більше буде прослуховувань?
01:01:09 SQL-задача №5: чи є у цьому датасеті пісні з однаковими назвами, але різними музикантами?
01:08:53 Налаштування датасету для роботи в Google Sheets.
01:13:50 Розбивка хітів Spotify по рокам та місяцям.
01:21:45 Розрахунок mde для гіпотетичного АВ-тесту.
01:30:24 Метрики та ідеї АВ-тестів для продукту анімації з фото улюбленця.
01:50:42 Питання від менті опісля тестової співбесіди.
02:03:19 Закінчення зустрічі.
________________________________________________
Датасет, який використовуємо у цій співбесіді: www.kaggle.com/datasets/nelgi...
_________________________________________________
Lenny's Podcast: www.youtube.com/@LennysPodcas...
Українські продуктові подкасти, які слухаю:
1. Product Market Fat (open.spotify.com/show/45K1oQT....
2. Startups are hard (open.spotify.com/show/2lnCQcC....
3. Іван Алцибєєв (www.youtube.com/@ivan-altsybi....
4. УкрПродКаст (www.youtube.com/@UkrProdCast/....
5. Продуктовий ринок (www.youtube.com/@product_ryno....
________________________________________________________________
Мене звати Роман Повзик. Я допомагаю початківцям в аналітиці даних збільшити свої шанси отримати офер.
Якщо хочеш почати кар'єру в аналітиці даних, то напиши мені в LinkedIn і поговоримо: / romanpovzyk .
________________________________________________________________
Посилання, які даю до ознайомлення до зустрічі:
1. • Как свитчеру сформиров... - тут для GoIT розповідаю, як я переходив у роботу з даними з проєктного менеджменту і підходи, які використовував і досі юзаю для самонавчання.
2. • е7: СТАРТ В АНАЛІТИЦІ ... - тут стрім про старт в аналітиці даних.
3. gamedev.dou.ua/articles/produ... - тут загалом описав суть професії, якою займаюся.
4. dou.ua/forums/topic/40265/ - база знань для початківців в аналітиці. Ресурси, які раджу для навчання.
5. dou.ua/forums/topic/40959/ - як проходить робочий тиждень аналітика даних в ІТ.
6. dou.ua/forums/topic/43889/ - тут про пет-проєкти, навіщо потрібні та якими можуть бути.
7. ruclips.net/user/playlist?list... тут приклади технічних співбесід в аналітиці даних.
8. dou.ua/forums/topic/44769/ - 250+ питань на співбесіді для початківця-аналітика.
подивився перше завдання, вийшло так:
675 (час в хвилинах у них) - 2000 (хвилин у них)
x (час в хвилинах у нас) - 1440 (хвилин у нас)
x = 486
486/60= 8.1 (0.1 від нашої години = 6 хв) = 8 година 6 хв
Так, цілком логічний хід думок та рішення.
Задачку про години задавали на співбесіді в Ajax Systems зовсім недавно. Тому цілком практична задача)
О, клас, приємно чути, що подібні задачі на розігрів дають на справжніх співбесідах.
Дивився це відео по фрагментам (задачі на логіку, SQL, метрики + A/B тести) протягом певного часу, і, як завжди, дякую за відео!
Дякую вам, що дивитеся.
Ну я і не розраховую, що хтось такі співбесіди за один раз гляне 😊
Теорема Баєса імба, дякую за цікаве відео!
Ага, якраз знайшов цей приклад у статті, де її пояснювали.
Як завжди цікаво і корисно. Дякую!
Дякую за перегляд) Радий, що вам сподобалося і допоможе у підготовці до подібних співбесід.
Крутые задачи
Дякую, приємно чути.
Стараюся приділяти їх пошуку принаймні дві години щоразу. Заодно і для себе дізнаюся цікаві речі (як у випадку з датасетом Spotify).
Я б зразу перевів у хвилини. Тоді все просто. 675/1000*12=8.1=8 годин 6 хвилин
Так, на те вона і задачка для розігріву 🙂
Романе, а курс статистики від Стенфордського університету можна буде переглядати ще раз після його терміну завершення?
А що мається на увазі під завершенням терміну? Завершення терміну фінансової допомоги для його проходження на півроку чи дедлайн курсу, який пишеться, щоб вас мотивувати?
@@romanpovzyk Скрош за все саме просто термін проходження. Бо я цей курс вже майже завершив.
Але ж рано чи пізно має завершитися дедлайн проходження. Тому хотів запитати, чи можна після цього терміну скористатися ним?
А коли завершиться термін фінансової допомоги, то потрібно буде знову оплатити?
@@user-nl7hm9co3i Не перевіряв, але думаю, що опісля можна просто попрохати її ще раз і отримати курс ще на півроку. Перевірте і відпишете, чи вийшло.
6:75 ранку це хіба не 675 хвилин, адже ніде не вказано, що тут хвилини відрізняються від звичайних? Таким чином від початку дня пройшло 675. Для нашого часу 675/60 = 11.25
Ця країна знаходиться на Землі - у нашому з вами Всесвіті. Наші півдня тривають 12 годин, у цій країні 10 «інших» годин - але це все одно має бути однаковий проміжок за тривалістю. Тому наша хвилина і ця «інша» хвилина все ж відрізняються.
Почему нет вопросов по презентации выводов анализа стейкхолдерам, мне кажется это крайне важный навык, важнее чем аб тесты, ведь не каждый дата аналитик это продуктовый аналитик
Врахую і спробую додати далі.
Серед тих вакансій, на вимоги яких я орієнтуюся при підготовці питань, чи не у кожній є вимоги щодо AB-тестів. Тому і включаю це питання.
можливо дурне запитання, але не зрозумів трохи 2 задачку. Я собі сам поза відео так і розбив на 4 катеогрії студентів, відповідно отримав, що за 100 ч - 20 є хворі, і лише в 18 з них буде чорний язик. Відповідно виходить, що частка хворих з чорним язиком зі 100 ч буде 18, тобто ймовірність що наш клієнт, дійсно хворий і є 18%. Навіщо ще додаткове перемножання? Що я пропустив?
Питання не дурне.
Ви пропустили, що те, що язик буде чорний - ще не означає, що людина хвора. Бо 80 * 0.3 = 24 людини будуть у такій ситуації, але здорові.
Варто шукати відсоток хворих не серед всіх, а серед тих, хто з чорним язиком: 18 / 24.
@@romanpovzyk Дякую. Зрозумів. Та далі та ж сама пропорція: х (частка хворих із загальної суми чорних язиків) = 18 * 100 / 42 = 43%
Так, якщо далі таким чином рахувати, то все правильно. Радий, що зрозуміло пояснив. Коли це візуально зобразити зі стрілками, то стає очевидно 😊
@@romanpovzyk класична задача на формулу Баєса) а якщо я знаю як розв'язувати всі ці задачі є шанс потрапити на позицію Junior Data Analyst'а? Чи цього буде замало?
Рiшення. Якщо iнша краiна перейшла на другий час, то скiльки там часу, то iх cобаче дiло, ще i Китайську стiну треба з ними збудувати)
Складно з таким підходом працювати з продуктом на міжнародних ринках 🙂 Треба таки адаптуватися.
дивують люди які налетіли в коменти і почали кучеряво "гнати дешеві понти". треба віддати належне Володимиру що не посоромився дати добро на опублікування відео. і до слова, фінанси не так вже й далеко від дата аналітики (особливо від продуктової).
Два негативних коментарі - це не «налетіли». Звісно, у комфортній атмосфері, маючи скільки завгодно часу та за відсутності відеозапису, набагато легше щось вирішувати.
Так, Володимир - молодець. Аналітиків-початківців багато, але останніми місяцями лише одна людина на місяць наважується на подібну публічну спробу перевірити себе.
через силу додивився задачі sql. Автор каналу, роби краще - просто мовчи і не підсказуй, тоді побачиш всю ширину "глибин"
Я ж не професійний інтерв'юер.
Мені все ж цікаво взаємодіяти з кандидатом, щоб розуміти хід думок. А не просто мовчки дивитися як вирішуються задачі.
Ну і завдання тут - не завалити людину, а разом пройти задумані завдання.
@@romanpovzykможна одразу попросити кандидата коментувати свої дії, а то він там щось мовчки робить незрозуміло що
кров з очей. чи деградація освіти, чи гаджети, чи занадто багато різних "непотрібних" навичок, але аналітик який півгодини рішає просту ймовірнісну задачу про студентів то вже перебор. задачка рішаеться рівно одну хвилину з олівцем. далі дивитися просто вже не варто.
Ви вирішили її у комфортному середовищі, без поспіху й стресу. Коли це вечір, пишеться відео і воно буде викладено на Ютуб, ви не бачите співбесідника, а тільки чуєте голос (під час шерингу екрану), то це все ж впливає на хід думок.
За останні 5 місяців тільки п'ятеро аналітиків наважилося на таку перевірку себе. Всі вони молодці і я радий, що вдалося поспілкуватися з ними годину-другу.
Ви ймовірно щовечора на літкоді тусуєтесь, пан весь в білому
5 задачу можна зробити через селф джойн:
SELECT
sp.[track_name],
sp_new.[track_name],
sp.[artist(s)_name],
sp_new.[artist(s)_name]
FROM spotify2023 sp
INNER JOIN spotify2023 sp_new ON sp_new.[track_name] = sp.[track_name]
AND sp_new.[artist(s)_name] != sp.[artist(s)_name];
думка правильна але реалізація ні. ось так коректно.
select
a.track_name,
count(1) as cnt
from spotify_2023 a
join spotify_2023 b
on a.track_name = b.track_name
and a.artist_s_name b.artist_s_name
group by a.track_name