[UA] Тестова співбесіда Junior Data Analyst: логіка, SQL, Google Sheet, метрики й ідеї для АВ-тестів
HTML-код
- Опубликовано: 26 июн 2024
- Таймкоди відео:
00:00:00 Знайомство з менті.
00:01:48 Показ тестової вакансії в аналітиці (Appflame).
00:02:36 Задача про пошук четвертого числа з 7 чисел.
00:06:58 Задача про 40% знижки на футболки.
00:09:53 Знайомство з датасетом нобелівських лауреатів.
00:13:02 SQL-задача №1: Скільки людей у нашому датасеті?
00:16:47 SQL-задача №2: Скільки людей отримувало Нобелівську премію більше одного разу?
00:34:09 SQL-задача №3: Скільки лауреатів народилося і померло в одному й тому ж місті?
00:37:01 SQL-задача №4: Назви три лауреати, які прожили найдовше з усіх?
00:44:33 SQL-задача №5: Список нобелівських лауреатів, які народилися у Парижі, починаючи з найперших і до останніх.
00:48:56 Генерація гіпотез для проведення дослідження з датасетом.
00:54:15 Google Sheet завдання: Знайти найіндивідуалістичнішу категорію Нобелівської премії.
01:03:53 Опис процесу роботи аналітика з АВ-тестом.
01:16:28 Ключові метрики для роботи з виданням The Guardian.
01:23:58 Генерація ідеї для АВ-тестів з меню підписки The Guardian.
01:29:35 Зворотний зв'язок по співбесіді.
01:34:01 Алгоритм роботи з пет-проєктом.
01:37:43 Сторітелінг для аналітика даних (кейс з Нобелівською премією миру).
01:43:10 Як проходить день аналітика даних?
01:45:30 Що потрібно підтягнути менті?
01:49:50 Закінчення зустрічі, домовленість про подальшу співпрацю.
___________________________________________________________
Тестова вакансія: jobs.dou.ua/companies/appflam...
Датасет, з яким працювали під час цієї співбесіди:
www.kaggle.com/datasets/nobel...
Меню підписки, яке обговорювали у цій співбесіді: www.paywallscreens.com/apps/t...
___________________________________________________________
Питання співбесіди:
1. Маємо сім цифр у порядку зростання, середнє арифметичне яких - 27. Знайди четверте число, якщо відомо, що середнє перших трьох - 16, а останніх трьох - 40.
2. У магазині розпродаж. Якщо ти купляєш дві однакові футболки, то на одну з них матимеш знижку у 40%. Ти заплатив 400 гривень за дві пари однакових футболок. Скільки коштує одна футболка?
3. Скільки людей у нашому датасеті?
4. Скільки людей отримувало Нобелівську премію більше одного разу?
5. Скільки людей народилися і померли в одному й тому ж місті?
6. Знайди трьох лауреатів, які прожили найдовше з усіх.
7. Зроби номерований список із лауреатів, що народилися у Парижі, починаючи з того, хто отримав найперше і далі.
8. Запропонуй власні ідеї для дослідження цього датасету (стаття The Guardian про нобелівських лауреатів).
9. Ти проводиш АВ-тест. Опиши весь процес від початку до кінця.
10. Ти - продуктовий аналітик The Guardian. На які метрики будеш орієнтуватися у своїй роботі?
11. Які AB-тести ми зможемо запустити, щоб підняти ключові метрики?
_______________________________________________________________
Мене звати Роман Повзик. Я допомагаю початківцям в аналітиці даних збільшити свої шанси отримати офер.
Якщо хочеш почати кар'єру в аналітиці даних, то напиши мені в LinkedIn і поговоримо: / romanpovzyk .
________________________________________________________________
Посилання, які даю до ознайомлення до зустрічі:
1. • Как свитчеру сформиров... - тут для GoIT розповідаю, як я переходив у роботу з даними з проєктного менеджменту і підходи, які використовував і досі юзаю для самонавчання.
2. • е7: СТАРТ В АНАЛІТИЦІ ... - тут стрім про старт в аналітиці даних.
3. gamedev.dou.ua/articles/produ... - тут загалом описав суть професії, якою займаюся.
4. dou.ua/forums/topic/40265/ - база знань для початківців в аналітиці. Ресурси, які раджу для навчання.
5. dou.ua/forums/topic/40959/ - як проходить робочий тиждень аналітика даних в ІТ.
6. dou.ua/forums/topic/43889/ - тут про пет-проєкти, навіщо потрібні та якими можуть бути.
7. ruclips.net/user/playlist?list... тут приклади технічних співбесід в аналітиці даних.
8. dou.ua/forums/topic/44769/ - 250+ питань на співбесіді для початківця-аналітика.
Класна співбесіда вийшла. Багато цікавих порад від вас, Романе. Дякую за ваш ентузіазм.
Дякую) Радий, що вам сподобалося.
Цього разу вийшов мікс з тестової співбесіди та трішки менторської сесії.
дуже гарний ролик про співбесіду. це той випадок, коли сама сидиш і відповідаєш на питання, а не просто включила на фоні
Дякую, дуже приємно.
Я ж для того їх і роблю так, щоб глядач міг знайти в описі до відео цей датасет і перевірити себе за всіма питаннями. Щоб користь була не тільки для людини, яка проходить співбесіду на відео, але й кожному глядачу, що хоче підготувати себе до оферу в аналітиці даних 😊
Дякую за відео!
Дякую вам за перегляд та коментар.
Якщо все йтиме за планом, то наступного тижня буде нова співбесіда. Сьогодні тільки пройшла)
@@romanpovzyk о, чудово) До наступного тижня якраз думаю, що подивлюся ваші два останні відео які зберіг в списку "Подивитися Пізніше")
Радий, що маю таких лояльних глядачів 😊
Дякую. Дуже корисне відео, важко переоцінити.
Єдине, Інді́ра Га́нді - жінка. Це одна з найвідоміших жінок-політиків ХХ століття, прем'єр-міністр Індії.))
Дякую, дуже приємно чути, що сподобалося.
Я мав на увазі Махатму Ганді. Він помер у 1948-ому році. І цього року Нобелівську премію миру не вручали за браком достойних кандидатів.
Індіра Ганді померла у 1984 році.
лайк за новый фон)
Дякую) 😊 Заодно й показав свою любов до наукової фантастики)
У тестових завдання на продакт аналітика досить часто зустрічаю когортні аналізи. Тому вирішив написати, можливо буде хороша ідея як для завдання в Google Sheets на наступну тренувальну співбесіду
Так, думав про це. Але не впевнений, що це завдання прямо на технічну співбесіду. Бо може вийти так, що цілу співбесіду тоді тільки цим і займатимемося - і так і не закінчимо. Але думатиму на майбутнє)
Дуже цікава задача #2 на розуміння Distinct.
Хотів би також додати, що схожі задачі можна вирішувати завдяки self-join.
В деяких int компаніях дуже полюбляють такі питання і просять вирішити саме через join.
Швиденько накидав рішення другої задачі, можливо комусь буде корисно:
select
np1.Full_Name,
count(*) as cnt
from nobel_prizes as np1
join nobel_prizes as np2
on p1.Laureate_ID = np2.Laureate_ID
where np1.Laureate_Type = 'Individual'
and np1.Year != np2.Year
group by np1.Laureate_ID, np1.Full_Name
having count(np1.Laureate_ID) > 1
Дякую, що поділилися.
Чесно кажучи, не пригадую, коли використовував SELF JOIN для подібних задач. Все ж більш звиклий до DISTINCT 😊
Романе, а якщо я пропустив дату здачі тесту зі статистики на Coursera, то це недобре?
Там у завданні є посилання на гістограми, а я їх не можу відкрити.
Як на мене, дата здачі тесту нічого не значить. Це більше, щоб утримувати якийсь контроль над користувачем і ставити йому дедлайн.
Я проходив цей курс майже два роки тому, тому не пам'ятаю щодо цих моментів. Раджу написати у підтримку.
можливо взагалі знайти роботу на аналітика без відповідного диплому, а лише з курсом пройденим наприклад?
бо з досвіду таке враження, шо нереально
Цілком можливо.
Ось я приклад з дипломом інженера-будівельника. І ще кілька десятків прикладів серед моїх менті зможу навести.
Я вибачаюсь, тобто якщо я знаю SQL та можу пройти ці завдання (але не знаю гугл формули) - я можу шукати роботу дата аналітика???
Я знаю приклади, коли люди шукали роботу аналітика, не знаючи й SQL (успіхом це не закінчилося). Шукати можна, просто кожен додатковий аналітичний інструмент в арсеналі - вищий шанс таки пройти до оферу.
Тому можете спробувати. А як вийде - то напишіть мені, буду радий почути про позитивний досвід.
53:29 соотношение мужчин и женщин по всем направлениям, в каких направлениях больше какого пола, средний возраст или медиану когда получили награду, в какой стране родились, а от какой страны получили премию, какие университеты выпускали наибольшее количество нобелевских лауреатов
Так, хороші ідеї для проведення ресьорчу. І, можливо, з цікавими інсайтами.
@@romanpovzykдякую
Будь ласка)
Якщо захочете спробувати себе на подібній співбесіді - маякуйте)
Як я можу завантажити дані на Google Cloud і практикувати там SQL? Чи потрібна для цього платна підписка на Google Cloud?
Привіт, Ярославе.
Ні, підписка не потрібна. Варто створити безкоштовний акаунт на Google BigQuery.
Ось раджу відео Олени Руденко про це: ruclips.net/video/RMOTFbi01q8/видео.html
Дякую)@@romanpovzyk
Будь ласка) Якщо не вийде, то відпишіть. Спробуємо розібратися.
Во второй задаче SQl в фильтрах стоит r >=2, почему там знак равно, если в условии стоит больше одного раза?
Там же ROW_NUMBER був тільки по ID лауреата.
Якщо > 2, то беремо тих, хто отримував більше двох разів.
Ви не публікуєте лінк ваших співбесідників?
Якщо питаєте з метою можливого найму, то можу поділитися в особистих у Лінкедіні. Але публічно не пишу.
А звідки взялось 1.6 у другій задачі ??)
Так знижка на другу футболку у 40%. Щоб знайти ціну однієї, потрібно поділити суму оплати за цю пару на 1,6.
@@romanpovzyk Дякую) Ніколи в житті не вчив математику, навіть у школі. Мені 35 років. Але першу задачу в зошиті розбив і в принципи через 10-20 помилок вирішив сам) Бо формул ніяких не знаю взагалі. Можливо треба якийсь базовий курс математики пройти щоб розвивати логіку.
Думаю, знання математики ніколи не буде зайвим. Радий, що вдалося подолати цю задачу 😊
в умові першого завдання помилка - цифрами є 0,1,...9. сума трьох різних цифр не може бути більша за 24.
Так, маєте рацію. Треба було говорити про числа.
Ну я вже все одно цю задачу не використаю у майбутньому, але буду обачнішим) Дякую за уважність)
+++++++++
Дякую за коментар.
Сподіваюся, вам сподобається ця співбесіда)