Романе, дякую за відео, 5/6 співбесід переглянута. Сьогодні отримав велике задоволення, бо вирішував завдання паралельно з менті, ставив на паузу і вирішував логічні завднання, а також писав SQL скрипти. Тож перша половина співбесіди була практична. Щодо задачі про ТОП-3 хіти, коли співали дуетом, то помилки як в вас не зловив, бо ще перед перетворенням streams в int мав умову, що artist_count=2 і ця умова відрізала помилковий запис. Але пізніше зловив її на іншому завданні (коли шукав кореляцію популярності пісні і кількості виконавців). Також дивно, що в п'ятому завданні Володя знову не використав count(distinct artist_name) і таким чином позбувся дубльованих записів. Правда, головне, що виконав завдання. На завтра залишаю 6-у співбесіду, можливо, також зроблю її практичною, якщо буде достатьно часу. Успіху вам! :)
Привіт, Василю. Захоплююся вашою системність і стабільністю. Але чомусь думав, що ви кожну співбесіду проходили разом з датасетом. Для того ж і додаю опис їх, щоб можна було відразу перевірити себе. Радий бачити такого глядача. Мотивує записувати нові співбесіди у майбутньому. До речі, маю ще одну співбесіду, свою єдину поза каналом. Ось тут: ruclips.net/user/livewnvgQOHqCM4?si=0R8TKGhIGO8729U0. Так що завтрашня може бути не останньою ☺️
@@romanpovzyk дякую за посилання, обов'язково подивлюсь і цю співбесіду. Я проробляв логічні завдання, а SQL планував в голові як робити, а потім вже звіряв в результатами роботи менті. Згідний, що це не те саме, що робити самому, та вже. Виправився :) Вчора прочитав вашу статтю про метрики на Доу, дуже цікаво і доступно написано. Сьогодні перегляну статтю про питання на співбесіді для аналітика. Ще раз дякую.
Дякую, приємно чути. Стараюся приділяти їх пошуку принаймні дві години щоразу. Заодно і для себе дізнаюся цікаві речі (як у випадку з датасетом Spotify).
подивився перше завдання, вийшло так: 675 (час в хвилинах у них) - 2000 (хвилин у них) x (час в хвилинах у нас) - 1440 (хвилин у нас) x = 486 486/60= 8.1 (0.1 від нашої години = 6 хв) = 8 година 6 хв
А що мається на увазі під завершенням терміну? Завершення терміну фінансової допомоги для його проходження на півроку чи дедлайн курсу, який пишеться, щоб вас мотивувати?
@@romanpovzyk Скрош за все саме просто термін проходження. Бо я цей курс вже майже завершив. Але ж рано чи пізно має завершитися дедлайн проходження. Тому хотів запитати, чи можна після цього терміну скористатися ним? А коли завершиться термін фінансової допомоги, то потрібно буде знову оплатити?
Задача на хвилини, я зробив так, рахуєм загальну кількість хвилин в кожній країні, хвилини з норм країни ділим на новий формат і цей коефіцієнт множимо на 6:75 (675) = 8,1 = 8:06
6:75 ранку це хіба не 675 хвилин, адже ніде не вказано, що тут хвилини відрізняються від звичайних? Таким чином від початку дня пройшло 675. Для нашого часу 675/60 = 11.25
Ця країна знаходиться на Землі - у нашому з вами Всесвіті. Наші півдня тривають 12 годин, у цій країні 10 «інших» годин - але це все одно має бути однаковий проміжок за тривалістю. Тому наша хвилина і ця «інша» хвилина все ж відрізняються.
можливо дурне запитання, але не зрозумів трохи 2 задачку. Я собі сам поза відео так і розбив на 4 катеогрії студентів, відповідно отримав, що за 100 ч - 20 є хворі, і лише в 18 з них буде чорний язик. Відповідно виходить, що частка хворих з чорним язиком зі 100 ч буде 18, тобто ймовірність що наш клієнт, дійсно хворий і є 18%. Навіщо ще додаткове перемножання? Що я пропустив?
Питання не дурне. Ви пропустили, що те, що язик буде чорний - ще не означає, що людина хвора. Бо 80 * 0.3 = 24 людини будуть у такій ситуації, але здорові. Варто шукати відсоток хворих не серед всіх, а серед тих, хто з чорним язиком: 18 / 24.
@@romanpovzyk класична задача на формулу Баєса) а якщо я знаю як розв'язувати всі ці задачі є шанс потрапити на позицію Junior Data Analyst'а? Чи цього буде замало?
Почему нет вопросов по презентации выводов анализа стейкхолдерам, мне кажется это крайне важный навык, важнее чем аб тесты, ведь не каждый дата аналитик это продуктовый аналитик
Врахую і спробую додати далі. Серед тих вакансій, на вимоги яких я орієнтуюся при підготовці питань, чи не у кожній є вимоги щодо AB-тестів. Тому і включаю це питання.
дивують люди які налетіли в коменти і почали кучеряво "гнати дешеві понти". треба віддати належне Володимиру що не посоромився дати добро на опублікування відео. і до слова, фінанси не так вже й далеко від дата аналітики (особливо від продуктової).
Два негативних коментарі - це не «налетіли». Звісно, у комфортній атмосфері, маючи скільки завгодно часу та за відсутності відеозапису, набагато легше щось вирішувати. Так, Володимир - молодець. Аналітиків-початківців багато, але останніми місяцями лише одна людина на місяць наважується на подібну публічну спробу перевірити себе.
Я ж не професійний інтерв'юер. Мені все ж цікаво взаємодіяти з кандидатом, щоб розуміти хід думок. А не просто мовчки дивитися як вирішуються задачі. Ну і завдання тут - не завалити людину, а разом пройти задумані завдання.
кров з очей. чи деградація освіти, чи гаджети, чи занадто багато різних "непотрібних" навичок, але аналітик який півгодини рішає просту ймовірнісну задачу про студентів то вже перебор. задачка рішаеться рівно одну хвилину з олівцем. далі дивитися просто вже не варто.
Ви вирішили її у комфортному середовищі, без поспіху й стресу. Коли це вечір, пишеться відео і воно буде викладено на Ютуб, ви не бачите співбесідника, а тільки чуєте голос (під час шерингу екрану), то це все ж впливає на хід думок. За останні 5 місяців тільки п'ятеро аналітиків наважилося на таку перевірку себе. Всі вони молодці і я радий, що вдалося поспілкуватися з ними годину-другу.
5 задачу можна зробити через селф джойн: SELECT sp.[track_name], sp_new.[track_name], sp.[artist(s)_name], sp_new.[artist(s)_name] FROM spotify2023 sp INNER JOIN spotify2023 sp_new ON sp_new.[track_name] = sp.[track_name] AND sp_new.[artist(s)_name] != sp.[artist(s)_name];
думка правильна але реалізація ні. ось так коректно. select a.track_name, count(1) as cnt from spotify_2023 a join spotify_2023 b on a.track_name = b.track_name and a.artist_s_name b.artist_s_name group by a.track_name
Теорема Баєса імба, дякую за цікаве відео!
Ага, якраз знайшов цей приклад у статті, де її пояснювали.
Романе, дякую за відео, 5/6 співбесід переглянута.
Сьогодні отримав велике задоволення, бо вирішував завдання паралельно з менті, ставив на паузу і вирішував логічні завднання, а також писав SQL скрипти. Тож перша половина співбесіди була практична.
Щодо задачі про ТОП-3 хіти, коли співали дуетом, то помилки як в вас не зловив, бо ще перед перетворенням streams в int мав умову, що artist_count=2 і ця умова відрізала помилковий запис. Але пізніше зловив її на іншому завданні (коли шукав кореляцію популярності пісні і кількості виконавців).
Також дивно, що в п'ятому завданні Володя знову не використав count(distinct artist_name) і таким чином позбувся дубльованих записів. Правда, головне, що виконав завдання.
На завтра залишаю 6-у співбесіду, можливо, також зроблю її практичною, якщо буде достатьно часу.
Успіху вам! :)
Привіт, Василю.
Захоплююся вашою системність і стабільністю. Але чомусь думав, що ви кожну співбесіду проходили разом з датасетом. Для того ж і додаю опис їх, щоб можна було відразу перевірити себе.
Радий бачити такого глядача. Мотивує записувати нові співбесіди у майбутньому. До речі, маю ще одну співбесіду, свою єдину поза каналом.
Ось тут: ruclips.net/user/livewnvgQOHqCM4?si=0R8TKGhIGO8729U0. Так що завтрашня може бути не останньою ☺️
@@romanpovzyk дякую за посилання, обов'язково подивлюсь і цю співбесіду.
Я проробляв логічні завдання, а SQL планував в голові як робити, а потім вже звіряв в результатами роботи менті. Згідний, що це не те саме, що робити самому, та вже. Виправився :)
Вчора прочитав вашу статтю про метрики на Доу, дуже цікаво і доступно написано. Сьогодні перегляну статтю про питання на співбесіді для аналітика.
Ще раз дякую.
Дивився це відео по фрагментам (задачі на логіку, SQL, метрики + A/B тести) протягом певного часу, і, як завжди, дякую за відео!
Дякую вам, що дивитеся.
Ну я і не розраховую, що хтось такі співбесіди за один раз гляне 😊
Як завжди цікаво і корисно. Дякую!
Дякую за перегляд) Радий, що вам сподобалося і допоможе у підготовці до подібних співбесід.
Крутые задачи
Дякую, приємно чути.
Стараюся приділяти їх пошуку принаймні дві години щоразу. Заодно і для себе дізнаюся цікаві речі (як у випадку з датасетом Spotify).
подивився перше завдання, вийшло так:
675 (час в хвилинах у них) - 2000 (хвилин у них)
x (час в хвилинах у нас) - 1440 (хвилин у нас)
x = 486
486/60= 8.1 (0.1 від нашої години = 6 хв) = 8 година 6 хв
Так, цілком логічний хід думок та рішення.
Задачку про години задавали на співбесіді в Ajax Systems зовсім недавно. Тому цілком практична задача)
О, клас, приємно чути, що подібні задачі на розігрів дають на справжніх співбесідах.
Романе, а курс статистики від Стенфордського університету можна буде переглядати ще раз після його терміну завершення?
А що мається на увазі під завершенням терміну? Завершення терміну фінансової допомоги для його проходження на півроку чи дедлайн курсу, який пишеться, щоб вас мотивувати?
@@romanpovzyk Скрош за все саме просто термін проходження. Бо я цей курс вже майже завершив.
Але ж рано чи пізно має завершитися дедлайн проходження. Тому хотів запитати, чи можна після цього терміну скористатися ним?
А коли завершиться термін фінансової допомоги, то потрібно буде знову оплатити?
@@ВладГорбачов Не перевіряв, але думаю, що опісля можна просто попрохати її ще раз і отримати курс ще на півроку. Перевірте і відпишете, чи вийшло.
Я б зразу перевів у хвилини. Тоді все просто. 675/1000*12=8.1=8 годин 6 хвилин
Так, на те вона і задачка для розігріву 🙂
Задача на хвилини, я зробив так, рахуєм загальну кількість хвилин в кожній країні, хвилини з норм країни ділим на новий формат і цей коефіцієнт множимо на 6:75 (675) = 8,1 = 8:06
Радий, що вам сподобалося.
Так, до рішення тут можна прийти різними підходами. Головне, що відповідь вірна 😊
6:75 ранку це хіба не 675 хвилин, адже ніде не вказано, що тут хвилини відрізняються від звичайних? Таким чином від початку дня пройшло 675. Для нашого часу 675/60 = 11.25
Ця країна знаходиться на Землі - у нашому з вами Всесвіті. Наші півдня тривають 12 годин, у цій країні 10 «інших» годин - але це все одно має бути однаковий проміжок за тривалістю. Тому наша хвилина і ця «інша» хвилина все ж відрізняються.
Ніт, тому що в них на добу: 20 годин * 100 хвилин = 2000 хвилин. А в нас 24*60 = 1440 хвилин
Чи коректно було б вирішити SQL-задача №4 знайшовши кореляцію (функція CORR)?
Гадаю що приблизно - так, можна.. Ну буде не 1,00 , а буде щось типу 0,90. Бо точність цього всього так собі..
можливо дурне запитання, але не зрозумів трохи 2 задачку. Я собі сам поза відео так і розбив на 4 катеогрії студентів, відповідно отримав, що за 100 ч - 20 є хворі, і лише в 18 з них буде чорний язик. Відповідно виходить, що частка хворих з чорним язиком зі 100 ч буде 18, тобто ймовірність що наш клієнт, дійсно хворий і є 18%. Навіщо ще додаткове перемножання? Що я пропустив?
Питання не дурне.
Ви пропустили, що те, що язик буде чорний - ще не означає, що людина хвора. Бо 80 * 0.3 = 24 людини будуть у такій ситуації, але здорові.
Варто шукати відсоток хворих не серед всіх, а серед тих, хто з чорним язиком: 18 / 24.
@@romanpovzyk Дякую. Зрозумів. Та далі та ж сама пропорція: х (частка хворих із загальної суми чорних язиків) = 18 * 100 / 42 = 43%
Так, якщо далі таким чином рахувати, то все правильно. Радий, що зрозуміло пояснив. Коли це візуально зобразити зі стрілками, то стає очевидно 😊
@@romanpovzyk класична задача на формулу Баєса) а якщо я знаю як розв'язувати всі ці задачі є шанс потрапити на позицію Junior Data Analyst'а? Чи цього буде замало?
Почему нет вопросов по презентации выводов анализа стейкхолдерам, мне кажется это крайне важный навык, важнее чем аб тесты, ведь не каждый дата аналитик это продуктовый аналитик
Врахую і спробую додати далі.
Серед тих вакансій, на вимоги яких я орієнтуюся при підготовці питань, чи не у кожній є вимоги щодо AB-тестів. Тому і включаю це питання.
дивують люди які налетіли в коменти і почали кучеряво "гнати дешеві понти". треба віддати належне Володимиру що не посоромився дати добро на опублікування відео. і до слова, фінанси не так вже й далеко від дата аналітики (особливо від продуктової).
Два негативних коментарі - це не «налетіли». Звісно, у комфортній атмосфері, маючи скільки завгодно часу та за відсутності відеозапису, набагато легше щось вирішувати.
Так, Володимир - молодець. Аналітиків-початківців багато, але останніми місяцями лише одна людина на місяць наважується на подібну публічну спробу перевірити себе.
Рiшення. Якщо iнша краiна перейшла на другий час, то скiльки там часу, то iх cобаче дiло, ще i Китайську стiну треба з ними збудувати)
Складно з таким підходом працювати з продуктом на міжнародних ринках 🙂 Треба таки адаптуватися.
через силу додивився задачі sql. Автор каналу, роби краще - просто мовчи і не підсказуй, тоді побачиш всю ширину "глибин"
Я ж не професійний інтерв'юер.
Мені все ж цікаво взаємодіяти з кандидатом, щоб розуміти хід думок. А не просто мовчки дивитися як вирішуються задачі.
Ну і завдання тут - не завалити людину, а разом пройти задумані завдання.
@@romanpovzykможна одразу попросити кандидата коментувати свої дії, а то він там щось мовчки робить незрозуміло що
кров з очей. чи деградація освіти, чи гаджети, чи занадто багато різних "непотрібних" навичок, але аналітик який півгодини рішає просту ймовірнісну задачу про студентів то вже перебор. задачка рішаеться рівно одну хвилину з олівцем. далі дивитися просто вже не варто.
Ви вирішили її у комфортному середовищі, без поспіху й стресу. Коли це вечір, пишеться відео і воно буде викладено на Ютуб, ви не бачите співбесідника, а тільки чуєте голос (під час шерингу екрану), то це все ж впливає на хід думок.
За останні 5 місяців тільки п'ятеро аналітиків наважилося на таку перевірку себе. Всі вони молодці і я радий, що вдалося поспілкуватися з ними годину-другу.
Ви ймовірно щовечора на літкоді тусуєтесь, пан весь в білому
5 задачу можна зробити через селф джойн:
SELECT
sp.[track_name],
sp_new.[track_name],
sp.[artist(s)_name],
sp_new.[artist(s)_name]
FROM spotify2023 sp
INNER JOIN spotify2023 sp_new ON sp_new.[track_name] = sp.[track_name]
AND sp_new.[artist(s)_name] != sp.[artist(s)_name];
думка правильна але реалізація ні. ось так коректно.
select
a.track_name,
count(1) as cnt
from spotify_2023 a
join spotify_2023 b
on a.track_name = b.track_name
and a.artist_s_name b.artist_s_name
group by a.track_name