Реальное Собеседование Data Scientist | Сбер

Поделиться
HTML-код
  • Опубликовано: 5 июн 2024
  • Успешное собеседование в Сбер на позицию Data Scientist в подразделение рекомендательных систем (я ничего не знаю про рекомендательные системы)
    🐳 Следи за новостями: t.me/gernar228/ - новости, анонсы, бесплатный контент
    🍑 Приватный телеграм: t.me/gernar228_bot/ - весь движ тут: сообщество, собесы, мои личные консультации и другой эксклюзивный контент!
    ⬆️ Boosty больше недоступен, всё переехало в телеграм ⬆️
    Таймкоды:
    00:00 Вступление
    00:23 Начало
    00:50 Задача с кубиком
    01:48 Декоратор и Итератор
    02:22 Алгоритмы классификации
    02:45 Отличия Бустинга и Случайного леса
    02:55 Отбор признаков
    03:30 Борьба с переобучением
    04:05 Первая задача
    04:25 Вторая задача
    04:35 Работа с таблицами
    06:50 Оценка рекомендательных систем
    07:28 TF-IDF
    07:55 Конец

Комментарии • 106

  • @zynthara
    @zynthara 10 месяцев назад +88

    Левое ухо кайфануло, спасбо)

    • @HOW_HOW_
      @HOW_HOW_ 4 месяца назад

      сильно)))

  • @bysedova
    @bysedova 8 месяцев назад +105

    Я не хочу, я устал - после этой фразы интервьювер понял, что нужно брать 😅

    • @AgentSmithLP
      @AgentSmithLP Месяц назад +4

      А что, так МОЖНО было что ли?

  • @SergeySkripko
    @SergeySkripko 4 месяца назад +5

    спасибо, коротко, по существу. Честно! Какие-то фейлы спокойно описываешь. Вот так сидя с дивана оно виднее, что вон тут проблема, тут ошибка, а в стрессе собеса конечно сложнее

  • @UnitXXVII
    @UnitXXVII 7 месяцев назад +14

    Из-за тебя гнездо наушника сломал, думал одно ухо не работает - раскавырял все. спс

  • @Tunec_s_hlebom
    @Tunec_s_hlebom 10 месяцев назад +28

    Я фронтенд разработчик, но я восхищаюсь людьми, которые занимаются темой Data science. Сам в свободное время играюсь с ИИ на питоне, стараюсь придумывать для себя задачки (единственное - никогда не любил статистику, хотя в целом математика мне нравилась и до сих пор нравится). Автор молодец, так держать!)

    • @user-gd8ee3li5n
      @user-gd8ee3li5n 5 месяцев назад +1

      держи в курсе

    • @chuvackok
      @chuvackok 11 дней назад

      @@user-gd8ee3li5n токсик, арбузер

  • @miremax0
    @miremax0 10 месяцев назад

    Лаконично и информативно) Было интересно подумать, как бы ответил)
    Последних задач условия не до конца понял только))

  • @user-bl4mm5pr9g
    @user-bl4mm5pr9g 10 месяцев назад +1

    вообще спасибо за короткий видос. это хороший формат. правда звук когда комментируешь плохой.

  • @kvetcka
    @kvetcka 10 месяцев назад

    Божественно

  • @VGCor
    @VGCor 10 месяцев назад +8

    В задаче на функцию next_smaller в конце написано '7079' should equal 790, что неверно. По идее должно быть 977. А задачка действительно интересная.

  • @user-yu2mi5ev4r
    @user-yu2mi5ev4r 10 месяцев назад +3

    В задаче unique_in_order за начальное значение prev нельзя принимать пустую строку, так как первым элементом параметра sequence может быть именно пустая строка.

  • @ulus7797
    @ulus7797 10 месяцев назад

    Было интересно.

  • @postmodern1876
    @postmodern1876 10 месяцев назад +13

    Шок! Действительно очень полезное видео! Посмотрел его и стал проходить собесы в 1.3 раза лучше!!! ЭТО ЖЕЕСТЬ!!!😶‍🌫💣💣 КРУТО!!! 😎

  • @alexzav860
    @alexzav860 10 месяцев назад

    Слушай Вадим. Все по делу. Четко!

  • @user-ph2lj5jl2v
    @user-ph2lj5jl2v 17 дней назад

    Вадим спасибо за полезный контент=)

  • @vz2503
    @vz2503 10 месяцев назад +14

    Молодец!
    Лучше конечно говорить правду. Работодателю интересно нанять адекватного соискателя пусть даже если он знает меньше того, кто врёт. Это моё мнение.

  • @user-dj2yl6bq4m
    @user-dj2yl6bq4m 2 месяца назад

    Приветствую, расскажи пожалуйста, с чего начинал изучение? Мб какие то курсы/школы есть? Спасибо

  • @user-dx9gu8fl1w
    @user-dx9gu8fl1w 6 месяцев назад +2

    Автор молодец, спасибо за ролик!
    Жаль что конечно не признаёт, что чего-то не знает, на самом деле честность и открытость подкупают больше, чем хард скиллы. Желаю успехов!

    • @gernar228
      @gernar228  6 месяцев назад +5

      Честно, ни разу не видел, когда ответ на вопрос «я не знаю» засчитался как «+». Гораздо лучше рассуждать начать

    • @SergeySkripko
      @SergeySkripko 4 месяца назад

      все индивидуально. Люди разные, интервьюеры разные. Одни интервьюеры точно засчитают это красным флагом, другим нужно рассуждение

  • @denisplaj6498
    @denisplaj6498 6 месяцев назад +9

    С кубиком суть не в том, что вероятность > 1/2, а в мат ожидании. Если на текущем броске выпало число, которое меньше, чем будущее мат ожидание (3.5), то перебрасываем, иначе оставляем.
    Это достаточно известная задача, она даже есть в "Green Book", но там мы можем кидать кубик 3 раза, а не 2.

    • @uazik-kamazik
      @uazik-kamazik 6 месяцев назад +3

      Вы абсолютно правы! Я тоже хотел об этом написать.

  • @Strij911
    @Strij911 9 месяцев назад +6

    Недавно проходил собес в сбер на NLP/Audio. Прошёл алгоритмическую секцию, общий ML, Audio/NLP/Deep Learn, а так же два финала с лидами команд. И не взяли в итоге. Только зря на 5 собесов время тратил :(

    • @gernar228
      @gernar228  9 месяцев назад

      5 секций это жесть

    • @Ibra4topchick8045
      @Ibra4topchick8045 9 месяцев назад +7

      мдаа уж, не совсем понятно что они вообще хотели, или передумали вообще брать кого-либо

    • @piskunov77
      @piskunov77 7 месяцев назад +1

      Увидели конкурента😊

  • @dmitriyneledva4693
    @dmitriyneledva4693 7 месяцев назад +1

    "я устал":D вот это прикол

  • @user-nv6fu7ns3r
    @user-nv6fu7ns3r День назад

    Я вот ещё подумал, что при 4ке можно перебрасывает также. Вероятность выпадения нормальной грани (4,5,6), те 3/6. Конечно в данном случае я считаю что повторный выпад 4 это тоже хороший результат.

  • @Abingusus
    @Abingusus 2 месяца назад +1

    Задача с кубиком требует пояснений. Если цель - максимизировать выигрыш, то: 1. говорим, что броски независимы 2. считаем матожидание 3. если выпало больше матожидания, сохраняем, если меньше, то перебрасываем
    Если цель - с наибольшей вероятностью получить больше чем в первый бросок (причем не важно насколько больше), то тогда да все верно решено в видео.
    Просто если был бы не кубик, а что-то другое, например, на кубике вместо 6 стояло бы 1 миллион, интуитивно понятно, что нам выгоднее перебрасывать даже когда выпало 5, потому что 1 млн это много и он сильно оттягивает матожидание. А если бы цель не проиграть, т.е. не получить меньше, тогда логика как в видео. Так что решение тут правильное, но рассуждение не совсем, я думаю стоит через матожидания делать. Т.е. для каждого случая переброса считать матожидание выигрыша, и если оно больше того, что выпало, то перебрасывать. Особенно если события зависимы и матожидание зависит от того, что выпало на предыдущем броске. Но тут повезло, неправильное рассуждение привело к правильному ответу) Так что смотрите что надо, либо МАТОЖИДАНИЕ выигрыша максимизировать, либо ВЕРОЯТНОСТЬ выгоды на втором броске.

    • @user-nv6fu7ns3r
      @user-nv6fu7ns3r День назад

      Я вот ещё подумал, что при 4ке можно перебрасывает также. Вероятность выпадения нормальной грани (4,5,6), те 3/6. Конечно в данном случае я считаю что повторный выпад 4 это тоже хороший результат
      .

  • @user-lz9mg1kb8x
    @user-lz9mg1kb8x 7 месяцев назад +1

    Привет! Какое у тебя образование? Вышка?

  • @VGCor
    @VGCor 10 месяцев назад

    Откуда взяты задачки? Есть ссылки на литкод или подобную платформу с именно этой задачей? Спасибо.

    • @gernar228
      @gernar228  10 месяцев назад

      Думаю, в основном с литкода. Саму задачу не нашел(

    • @topstylelifestyle3020
      @topstylelifestyle3020 Месяц назад

      @@gernar228кстати а как ты учился ,на дату ?на курсы или сам нашел материал ?

  • @user-eh5qj4mh3l
    @user-eh5qj4mh3l 9 месяцев назад +1

    Здравствуйте. Было ли финальное собеседование?

    • @gernar228
      @gernar228  9 месяцев назад

      Было, но попросили не выкладывать. Выйдет в приватном доступе.

  • @user-qz1ic6yb5v
    @user-qz1ic6yb5v 9 месяцев назад +1

    Здравствуйте. Подскажите как осваивали профессию?

    • @gernar228
      @gernar228  9 месяцев назад +2

      Учился. Выйдет отдельное видео про это

  • @user-nh9oc1lj7f
    @user-nh9oc1lj7f 9 месяцев назад +3

    Хотелось бы посмотреть реальные ответы с собеса, на не врезки

    • @gernar228
      @gernar228  9 месяцев назад

      В других роликах уже выкладываю полные версии

  • @ElElion
    @ElElion 9 месяцев назад +3

    чет мне кажется странным что после слов "не хочу, я устал" тебя куда-то взяли, работать придётся фулл день, а ты устал за час или два собеседования

    • @gernar228
      @gernar228  9 месяцев назад +3

      день и ночь

  • @MinisterDorado
    @MinisterDorado 7 месяцев назад

    а где финальный этап?

  • @bekhzodortikov421
    @bekhzodortikov421 9 месяцев назад

    Можешь объяснить откуда в задаче терверу, вероятность получить 1 5/6, 2 4/6

    • @gernar228
      @gernar228  9 месяцев назад +1

      вероятность того, что мы выбросим число >1 = 5/6, потому что у нас 5 граней кубика из 6, которые удовлетворяют этому условию

    • @user-wn7cs5bs1h
      @user-wn7cs5bs1h 7 месяцев назад

      @@gernar228 а почему выбор делается на основе вероятности получить во время второго броска больше очков? Условие задачи странное, но я бы его воспринял, как найти стратегию, при которой математическое ожидание выигрыша наибольшее ( или любая другая статистика)
      Скажем, если бы во время второго броска с большой вероятностью (90%) мы бы теряли очко, а маленькой (10%) увеличивали выигрыш на миллиард, разве не выгоднее было бы рискнуть, несмотря на меньшую вероятность?

  • @dashamoss2515
    @dashamoss2515 10 дней назад

    Голос у вьюера просто треш, респект, что выдержал его

  • @surrrogatehuman7653
    @surrrogatehuman7653 10 месяцев назад

    Рекомендации были потому что вакансия на рекомендательные системы?

    • @gernar228
      @gernar228  10 месяцев назад

      Да, но в Яндексе в целом их почти всегда спрашивают, тк они везде есть

  • @somefear8018
    @somefear8018 10 месяцев назад +3

    А такое можно публиковать вообще?)
    Стоит ли ожидать блокировки канала?

    • @gernar228
      @gernar228  9 месяцев назад

      можно публиковать

  • @user-zd7nn4me7i
    @user-zd7nn4me7i 9 месяцев назад +1

    Здача 2
    На чиле решил за 10 минут (что вообще не быстро уже), но на собесе бы просто насрал в штаны от стресса
    def decompose(n):
    s = str(n)
    digits = [i for i in s]
    return digits
    def next_smaller(n):
    digits_init = decompose(n)
    i = n
    while i > 0:
    i -= 1
    digits_next = decompose(i)
    check = [s for s in digits_init if s not in digits_next]
    if len(check) == 0:
    break
    return i

    • @user-zd7nn4me7i
      @user-zd7nn4me7i 9 месяцев назад

      А лол, потестил, не катит, ну вот я и тут уже обосрался

    • @gernar228
      @gernar228  9 месяцев назад +2

      ты пытался

    • @valerierfolg1112
      @valerierfolg1112 9 месяцев назад

      Прочитала ваш комментарий и кажется я передумала начинать учиться в Айти сфере

    • @user-zd7nn4me7i
      @user-zd7nn4me7i 9 месяцев назад

      @@valerierfolg1112
      А меня наоборот этот фэйл вдохновил отвлечься от вылизывания картинок в ноутбуках и почитать про алгоритмы, потусить на литкоде.
      Кстати, в этой задаче, кажется, нужно найти все варианты перестановок цифр в числе и среди получившихся найти ближайшее слева к данному.

    • @user-wn7cs5bs1h
      @user-wn7cs5bs1h 7 месяцев назад

      ​@@user-zd7nn4me7iзадача решается довольно просто за линию - в плюсах уже готовая есть prev_permutation
      идея такая - мы хотим сделать изменения в минимальном суфииксе. Если суффикс нестрого возрастает, то его уменьшить нельзя никак - найдем первую позицию с конца, где монотонность нарушается
      1237079 - максим возрастающий суффикс это 079, значит будем менять только 7079, а 123 останется
      7 в начале 7079 мы должны заменить на что-то меньшее, причем, чем больше, чем лучше - заменим на наибольшее число, строго меньшее данного
      7079 -> 0779 заметим, что при этом 779 будет нестрого убывать (если монотонность нарушена, выбрали неправильное число на замену 7), значит, чтоб получить максимальное число из него, надо реверснуть
      итого
      1237079 -> 123 (7) 079 -> 123 (0) 779 -> 123 (0) 977 -> 1230977
      еще пример
      15236 -> 1 (5) 236 -> 1 (3) 256 -> 1 (3) 652 -> 13652

  • @GaleMr
    @GaleMr 10 месяцев назад

    а это на позицию Джуна собес?

  • @liudmilamikhaylichenko4617
    @liudmilamikhaylichenko4617 10 месяцев назад

    Привет) это мидл?!)

    • @gernar228
      @gernar228  9 месяцев назад +1

      привет, да

    • @AleXXL1986
      @AleXXL1986 9 месяцев назад

      Интересно в какое подразделение собесился.

    • @user-kr6zg9lu4i
      @user-kr6zg9lu4i 9 месяцев назад

      Что-то многовато 300к для мидла. Сам работаю ds в Сбере на 10 грейде

  • @user-bl4mm5pr9g
    @user-bl4mm5pr9g 10 месяцев назад +1

    не стремно выкладывать? Разве это не приватная инфа?

    • @gernar228
      @gernar228  10 месяцев назад

      Не приватная, не боюсь

    • @user-jo8qk1vs4t
      @user-jo8qk1vs4t 10 месяцев назад

      @@gernar228 думаю жопа в сбере у кого-то подгорит и прибегут к тебе с этим (работал в сбере 3+ года)

  • @alexgrov7096
    @alexgrov7096 10 месяцев назад +1

    Звук плохой(

    • @gernar228
      @gernar228  10 месяцев назад

      в последних роликах исправил

  • @d14400
    @d14400 10 месяцев назад +1

    Это жесть 😂 Требования джуна. Что они там напрограммирубт 😂

    • @bogdanns2
      @bogdanns2 10 месяцев назад +1

      Типо очень легко?
      Ты бы лайвкоде все это сделал без проблем?

    • @mwave3388
      @mwave3388 9 месяцев назад +14

      @@bogdanns2 я на ютубе штук 20 разных мок интервью ДС смотрел. И под каждым видео находится васян, которому легко и изи. Такому васяну изи только мелочь в пятерочке на кассе считать, чтобы пачку примы взять.

  • @user-bl6fr5ke5s
    @user-bl6fr5ke5s 9 месяцев назад +1

    Странное интервью, если честно. Мало в какой конторе будут слушать того, кто с таким "энтузиазмом" отвечает на вопросы интервьюера.

    • @gernar228
      @gernar228  9 месяцев назад +5

      Это ты видос с ВТБ не видел ещё

    • @valerierfolg1112
      @valerierfolg1112 9 месяцев назад

      Я думаю это манера разговора многих в через айти. Т.е. норм

  • @alexker9324
    @alexker9324 7 месяцев назад +2

    Сразу видно что человек рос во времена Ельцина "Я устал, я ухожу"))

  • @juiwas_morori
    @juiwas_morori 4 месяца назад

    Слушать тяжело. Ибо ты говоришь тихо, а твой собеседник громко. И ты либо глохнешь при перескакивание на него, либо ничего не слышишь, когда говоришь ты. Надо как-то уравновесить громкость :(

  • @user-fh3wg8oj6q
    @user-fh3wg8oj6q 3 месяца назад +1

    Лол, что
    Самые важные вопросы, привязанные к работе завалил, но прошел?

  • @ProtosNo1
    @ProtosNo1 9 месяцев назад

    Если такие собеседования на Джуна, то дайте мне миддла, простейшие задания:(

    • @gernar228
      @gernar228  9 месяцев назад

      это не на джуна) мне оффер 250к сделали после этого собеса

    • @valerierfolg1112
      @valerierfolg1112 9 месяцев назад

      ​@@gernar228это много или мало для вашего уровня знаний? Это рубли? (Для меня я так поняла вы очень хорошо разбираетесь в айти)

  • @dmitrii5735
    @dmitrii5735 4 месяца назад

    не захочу 😁😁😁😁

  • @hybi666
    @hybi666 8 месяцев назад

    Вторая задача решается просто реверсом цифр в числе?

    • @MrSkinification
      @MrSkinification 12 часов назад

      Простой реверс не подходит, для примера 1009. По моему лучший вариант, разбиение на цифры -> построение всех комбинаций -> поиск нужного.

  • @user-wz5uw6vm2k
    @user-wz5uw6vm2k 8 месяцев назад +6

    Ребята 300 это сейчас всего лишь 3000 баксов. Это три нормальных телевизора. Это зарплата солдата с сво. Не снижайте планку,

    • @user-cm8ey4qg5d
      @user-cm8ey4qg5d 2 месяца назад +1

      Вот именно! Очень хорошо если нас будет много, а то недавно проходил собеседование, спрашивали как на 300+, а в итоге сказали у нас на этой позиции максимум 110🤣
      Плюс ребята с региона!!!! Не соглашайтесь на зп меньше! Сейчас стоимость всех товаров и услуг (в т.ч квартиры, машины) иксанули. И когда говорят, сколько бы вы хотели получать в регионе? Да какая разница регион или не регион! Сейчас все и везде одинаково дорого!

  • @user-jo8qk1vs4t
    @user-jo8qk1vs4t 10 месяцев назад +1

    звук галимый

  • @xenm85
    @xenm85 7 месяцев назад

    live coddng - сразу мимо, это как правило говорит о тупости и не готовности к диалогу интервьюэра. Таких сразу надо в игнор

  • @user-xl2wd1le8x
    @user-xl2wd1le8x 10 месяцев назад

    Самое ужасное что после таких видео когда люди массово на тренировались проходить собесы они приходят на работу и ничего не могут делать. Спасибо что помогаеие людям войти в айти)))

    • @cardmaster6915
      @cardmaster6915 9 месяцев назад +4

      Таких элементарно отсеять на собесе, а если собеседующий не способен это сделать, то это проблема компании, а тот кто прошел - молодец

    • @user-xl2wd1le8x
      @user-xl2wd1le8x 9 месяцев назад

      @@cardmaster6915 на это требуется дополнительное время, а это ценный ресурс. Да многое дополнительными вопросами отсеятся, но есть индивиды которые уже сотый раз проходят на собесы и уже более менее подготовлены отвечать на разные вопросы, а на практике не знаю ничего. Жаль потерянного времени.

    • @gernar228
      @gernar228  9 месяцев назад +15

      Так пусть проверяют на собесах сможет человек выполнять рабочие задачи или нет)

    • @cardmaster6915
      @cardmaster6915 9 месяцев назад

      Это невозможно понять плюс это дело компании. Плюс я лучше найму джуна из универа, который знает математику и питон слабо знает дата сайенс, чем чела после курсов, который знает про модели из курсов и может делать базовые вещи, но не знает математики. Тк первый через пару месяцев догонит второго(скорее всего), а второй при всем желании не сможет исключить логические фейлы ввиду слабой мат базы @@gernar228

    • @GlockPoker
      @GlockPoker 9 месяцев назад

      @@gernar228 лучше бы это сразу и проверяли, а не задачи про кубики или еще какую-нибудь фигню

  • @niktqt
    @niktqt 10 месяцев назад +3

    Такие же вопросы на джуна JS разработчика с зп 15т.р

    • @gernar228
      @gernar228  10 месяцев назад +2

      JS джунам стоит задуматься

  • @gernar228
    @gernar228  9 месяцев назад

    🐳 Следи за новостями: t.me/gernar228/ - новости, анонсы, бесплатный контент
    🍑 Приватный телеграм: t.me/gernar228_bot/ - весь движ тут: сообщество, собесы, мои личные консультации и другой эксклюзивный контент!
    ⬆ Boosty больше недоступен, всё переехало в телеграм ⬆

  • @yaranaiyopparai7379
    @yaranaiyopparai7379 9 месяцев назад +1

    Такое решение не проканает?
    def next_smaller(num):
    import itertools
    digits = list(str(num))
    permutations = list(itertools.permutations(digits))
    permutations = sorted([int(''.join(permutation)) for permutation in permutations])
    i_to_select = permutations.index(num) - 1
    return permutations[i_to_select] if i_to_select >= 0 else -1

    • @gernar228
      @gernar228  9 месяцев назад

      перестановки это ⚰️

  • @mwave3388
    @mwave3388 9 месяцев назад +2

    4:27 Последний тест неправильный. Там в конце 890, а должно быть 809.

  • @Vilayat_Khan
    @Vilayat_Khan 2 месяца назад

    хмм я думал сказать "нет не хочу" - это как то грубо.

  • @rad3
    @rad3 5 дней назад

    4:25 решение задачи:
    def next_smaller(n):
    n = str(n)
    j = i = len(n) - 1
    while i > 0:
    i -= 1
    if n[i+1] < n[i]:
    if i == 0 and n[-1] == '0':
    return -1 # исключили случай с n = 30, 500, и т.д
    while True:
    if n[j] < n[i]:
    if j != len(n) - 1:
    return int(n[:i] + n[j] + n[i+1:j] + n[i] + n[j+1:])
    return int(n[:i] + n[j] + n[i + 1:j] + n[i])
    j -= 1
    return -1