Тайм-теги 00:00:00 Интро 00:01:02 Как Артур попал в data science 00:03:50 Как Сергей попал в data science 00:13:20 Артур: вопросы по метрикам 00:21:00 Сергей: вопросы по метрикам 00:29:55 AUC за один твит 00:31:45 Артур: деревья 00:34:25 Сергей: "задача на рисование" 00:36:35 Сергей: вопрос про нейронки за 140 символов (полином третьей степени и перцептрон) 00:38:55 Артур: параметры свёртки 00:42:00 Артур: как работает batch norm 00:46:00 Сергей: можно ли тьюнить только batch norm? 00:46:50 Сергей: что такое регуляризация. Какие регуляризации ты знаешь 00:49:50 Артур: какие есть attentions в нейросетях 00:53:30 Артур: обучение на кропнутых изображениях 00:57:10 Сергей: бинарная кросс-энтропия 01:00:55 Сергей: новые альтернативы IoU метрики 01:02:35 Артур: детекция - архитектуры и детекторы 01:08:50 Артур: anchor-free детекторы 01:10:30 Сергей: как мониторить качество сетки 01:17:30 Артур: методы ускорения нейросетей 01:25:15 Артур: задача про бинарную маску 01:33:05 Сергей: бот-ассистент и sensitive cases 01:43:00 Артур: софт скилы, "странные вопросы" по мотивации 01:50:40 Сергей: что мотивирует тебя
Почему ребята из Тинькова и Сбера общаются о каких-то стажерских вещах, а меня на собеседовании в неоплачиваемый проект спрашивали обо всем, будто я сеньор....
Когда собеседую -- задаю вопросы по базовым концепциям, в моем случе языка, паттернам и многопоточности, и по ответам понимаю, какой уровень у кандидата
я замечал такой парадокс, часто чем меньше компания, тем более претензионное собеседование. Видимо страх ошибиться в найме (для них 1 твоя месячная ЗП это серьезная сумма) и проекция каких-то комплексов руководства (есть даже известный совет "Вы не Гугл" с месседжем не пытайтесь строить у себя процессы будто вы Гугл)
Суммируя мой опыт работы и собеседований, и это видео: нужно избавиться от терминов precision и recall потому что абсолютно ВСЕ дс-ники в них путаются)))
Ага, только я обычно спрашиваю на собеседованиях "Какое априорное распределение надо задать в Баясовской регресии, что бы получить еквивалент MHK регрессии с L1 L2 регуляризацией?" Ответ "Очевидно что L2 - нормальное распределение, L1 - распределение Лапласа". Знаешь как народ валится? На отличнинько ))))
Интересно, но что-то от людей на топ позициях ожидаешь больше вопросов про бизнес-кейсы, архитектуру (system design) и менеджмент в целом - тема совсем не раскрыта:(
Вот главное, чтобы интервьюер на собеседовании понимал, что какие-то вещи можно забыть.. ) вот, напрример, с 4 года опыта чисто в DL/CV, я вот сейчас хрен вспомню сходу какой-нибудь тер вер, или что-то такое. А формулы метрик зачем деражать в голове? Главное понимать их смысл. Но формулу можно посмотреть либо в блокнотике, либо загуглить. Главное знать, что такая метрика существует, и знать, что она оценивает)) на собесаз я встречал случаи, когда кандидат знал формулу (прото зазубрил), но вообще не понимал, почему она именно такая и что она делает)
Internal covariate shift не про то, что сказали( там проблема, что слой обновляется в ожидании того, что распределение выхода предыдущих не изменится. Фризить батчнорм - это активации загонять в распределении со среднтм 0 и дисперсией 1.
26:00 В ситуации серьезного дисбаланса классов ситуация будет в точности обратная: micro-усреднение покажет, что всё хорошо, т.к. классификатор уверенно предсказывает бОльший класс и, следовательно, угадывает больше отдельных сэмплов. А macro считается сначала для классов, а потом усредняется. И это как раз подсветит, что есть проседающий (или проседающие) классы, которые плохо предсказываются классификатором и снижают общую оценку после усреднения
Если взять четыре класса три из них по 1 ТР и 1 FP, а четвёртый 10 ТР и 90 FP, то макро средняя точность будет 0.4, а микро средняя точность ≈0.12 что куда лучше отражает действительную картину
@@daniilzoque1193 При приёме на работу учитываются не только сухие знания. Да и сам факт что человек с гуманитарным бэкграундом может настолько кардинально сменить сферу деятельности может вдохновить многих
@@ra1618 ну нет, не согласен. Это не те вещи, которые забываются от недостатка практики. Если человек знает, что такое f1 мера вывести формулу - вопрос 2 секунд.
Тайм-теги
00:00:00 Интро
00:01:02 Как Артур попал в data science
00:03:50 Как Сергей попал в data science
00:13:20 Артур: вопросы по метрикам
00:21:00 Сергей: вопросы по метрикам
00:29:55 AUC за один твит
00:31:45 Артур: деревья
00:34:25 Сергей: "задача на рисование"
00:36:35 Сергей: вопрос про нейронки за 140 символов (полином третьей степени и перцептрон)
00:38:55 Артур: параметры свёртки
00:42:00 Артур: как работает batch norm
00:46:00 Сергей: можно ли тьюнить только batch norm?
00:46:50 Сергей: что такое регуляризация. Какие регуляризации ты знаешь
00:49:50 Артур: какие есть attentions в нейросетях
00:53:30 Артур: обучение на кропнутых изображениях
00:57:10 Сергей: бинарная кросс-энтропия
01:00:55 Сергей: новые альтернативы IoU метрики
01:02:35 Артур: детекция - архитектуры и детекторы
01:08:50 Артур: anchor-free детекторы
01:10:30 Сергей: как мониторить качество сетки
01:17:30 Артур: методы ускорения нейросетей
01:25:15 Артур: задача про бинарную маску
01:33:05 Сергей: бот-ассистент и sensitive cases
01:43:00 Артур: софт скилы, "странные вопросы" по мотивации
01:50:40 Сергей: что мотивирует тебя
Офигенная прививка от синдрома самозванца, спасибо )
Это точно! Оказывается, не все знать - это нормально, и не так страшно) и допустимо для ребят даже такого уровня!
Определенно нужна 2-ая часть по алго, system design, управлению командой ...
Было очень интересно!
Почему ребята из Тинькова и Сбера общаются о каких-то стажерских вещах, а меня на собеседовании в неоплачиваемый проект спрашивали обо всем, будто я сеньор....
Когда собеседую -- задаю вопросы по базовым концепциям, в моем случе языка, паттернам и многопоточности, и по ответам понимаю, какой уровень у кандидата
я замечал такой парадокс, часто чем меньше компания, тем более претензионное собеседование. Видимо страх ошибиться в найме (для них 1 твоя месячная ЗП это серьезная сумма) и проекция каких-то комплексов руководства (есть даже известный совет "Вы не Гугл" с месседжем не пытайтесь строить у себя процессы будто вы Гугл)
@@vladislavgusak2309 дата саентистам?
@@NoName-iy5ih C++
Когда то запоминал пресиж, что он начинается на п. Поэтому у всего в формулах должна быть буква п. ТП на ТП+ФП
воу у тебя уже почти 17к сабов . !!!! Респект и роста !
Почему не через смысл precision?
Они даже внешне отождествляют Сбер и Тинькофф)
Ребят, ну это пушка )) спасибо, было весело и интересно
Суммируя мой опыт работы и собеседований, и это видео: нужно избавиться от терминов precision и recall потому что абсолютно ВСЕ дс-ники в них путаются)))
Еее, когда даже ты шаришь за регуляризацию L1 и L2 )))
Ага, только я обычно спрашиваю на собеседованиях "Какое априорное распределение надо задать в Баясовской регресии, что бы получить еквивалент MHK регрессии с L1 L2 регуляризацией?" Ответ "Очевидно что L2 - нормальное распределение, L1 - распределение Лапласа".
Знаешь как народ валится? На отличнинько ))))
@@oleksitkachenko4747 я на самом деле удивляюсь, как. Ибо Бишоп это пишет на первых 12 страницах. Обычно до них дочитывают)
Блин, таких крутых людей пригласили, круто!
Многие эти вопросы мне задавали на собеседовании... Спасибо большое за видео) Жалко, что увидел его уже после собеса)
Вот кумиры молодёжи;)
Топовый контент!!!
Смотрел на одном дыхании.
39:28 так, а единичка же не там прибавлена, мы bias накидываем на выход каждого фильтра, то есть (3 * 3 * 3 + 1) * 64, разве нет?
Нейронки круто, конечно, а про обычные алгоритмы машинного обучения мало раскрыто.
там далеко не разгонишься, в то время как тема DL куда более обширная, используемая и c большим кол-вом подводных камней
@@ac130kz да я бы не сказал)) просто парни всё забыли, в работе только нейронки используют
Интересно, но что-то от людей на топ позициях ожидаешь больше вопросов про бизнес-кейсы, архитектуру (system design) и менеджмент в целом - тема совсем не раскрыта:(
Ааааа какие красивые парни! Особенно тот что помоложе с хвостиком! Не привыкли мы видеть таких в айтишке)
Когда опытные решают теоритические задачи с практической стороны.
😏👍
Очень крутой формат. Жду новые выпуски
Вот главное, чтобы интервьюер на собеседовании понимал, что какие-то вещи можно забыть.. ) вот, напрример, с 4 года опыта чисто в DL/CV, я вот сейчас хрен вспомню сходу какой-нибудь тер вер, или что-то такое. А формулы метрик зачем деражать в голове? Главное понимать их смысл. Но формулу можно посмотреть либо в блокнотике, либо загуглить. Главное знать, что такая метрика существует, и знать, что она оценивает)) на собесаз я встречал случаи, когда кандидат знал формулу (прото зазубрил), но вообще не понимал, почему она именно такая и что она делает)
Странно конечно, метрик всего там несколько, можно было за это время выучить ...
Internal covariate shift не про то, что сказали( там проблема, что слой обновляется в ожидании того, что распределение выхода предыдущих не изменится.
Фризить батчнорм - это активации загонять в распределении со среднтм 0 и дисперсией 1.
метрики при несбалансированных выборках и сразу сложности. Это же база.
26:00 В ситуации серьезного дисбаланса классов ситуация будет в точности обратная: micro-усреднение покажет, что всё хорошо, т.к. классификатор уверенно предсказывает бОльший класс и, следовательно, угадывает больше отдельных сэмплов. А macro считается сначала для классов, а потом усредняется. И это как раз подсветит, что есть проседающий (или проседающие) классы, которые плохо предсказываются классификатором и снижают общую оценку после усреднения
Если взять четыре класса три из них по 1 ТР и 1 FP, а четвёртый 10 ТР и 90 FP, то макро средняя точность будет 0.4, а микро средняя точность ≈0.12 что куда лучше отражает действительную картину
Обычно при дисбалансем наоборот бывает - в четвёртом классе к примеру 90 TP и 10 FP
ох уж эти вопросы про roc auc
Нет желания сделать у себя на канале видео про то, что должен знать дата саентист?
@@maxoun7126 Думаю можно будет что то про вопросы на собеседованиях сделать
повысить бы немного качество звука. иногда плохо слышно собеседников
подскажите пожалуйста тайм код если не затруднит
Спасибо, очень интересно)
Сидят два взрослых мужика и понтуются перед другом
Тупо битва титанов
На каком языке говорят эти почтенные мужи?😁
@@SuperEuro узкий специализированный
Коллега, мы ошиблись дверью.
На канале будут собеседования только про ДС? Или другие направления ИТ тоже будут?
Разные будут
Просто топ!
контент супер но со звуком пипец какой-то
то одного не слышно то другого, то качество звука резко падает, то мыло какое-то
:(
Нихйя не понял, но очень интересно)
Спасибо большое
почему scitator и почему n01z3?
ники github или kaggle или и то и другое
о, Декстер в DS пошел.
Ждал новый сезон осенью, а он вышел летом
Идея для видео: провести собеседование на джуна в дс (желательно, чтобы он был с гуманитарным бэкграундом)
какая разница с каким бэкграундом? знания то на позицию джуна одни и те же нужны
@@daniilzoque1193 При приёме на работу учитываются не только сухие знания. Да и сам факт что человек с гуманитарным бэкграундом может настолько кардинально сменить сферу деятельности может вдохновить многих
Скорость точнее, ну, ты понял
Мальчики симпотяжки😊
Рекламы мало, надо чаще вставлять
Неужели вот так просто можно попасть к вам на этот формат, просто написав на почту? Блин, круто если так, но неужели там не поток желающих?
Оба утверждения верны
А почему все это должен знать джун/интерн, если даже такие люди не все помнят?!
оба ребята известные, крутые и толковые специалисты...но ошибок в данном общении/блиц-собесе просто море.
формат топ
31:22 мне кажется, или вместо multilabel они имеют в виду multiclass?
Кайфы 👌
Угар и садамия :)) 58:30 :)))
а мне нравится пороги нелдером мидом подбирать
Слишком сильно ускоряешь время видеозаписи во время интро
В этом не было ускорений
Было
Data Scientist в Тинькофф не знает, откуда 2 в F1-мере? Мощно
Начиная с какого-то уровня, это норм ))
@@ra1618 ну нет, не согласен. Это не те вещи, которые забываются от недостатка практики. Если человек знает, что такое f1 мера вывести формулу - вопрос 2 секунд.
Не разобрать, что говорит Артур 🙈
И тут приплели игру в кальмара на 1:25:50
Лень смотреть. До армрестлинга-то скатились или нет?
Заставка прикольная, идея красивая, но слишком много слова "типа"
Парень с челкой видно, что волнуется и тупит
вот
два джуна яйками меряются, сидя на ресепшне, перед собесом.