Data Science пример задачи кредитного скоринга / Урок построения модели ML на python

Поделиться
HTML-код
  • Опубликовано: 19 июн 2024
  • Авторский курс по Data Science для начинающих pymagic.ru
    Код на Boosty boosty.to/miracl6/posts/96b1f...
    Разбираем задачу по Data Science кредитный скоринг с использованием модели логистической регрессии. Учимся грамотно подходить к разведочному анализу данных EDA, а также обучать модель ML и интерпретировать результаты для бизнеса.
    Новая группа ВКонтакте pymagic
    Датасет www.kaggle.com/c/sf-dst-scoring
    Таймкоды:
    00:00 Задача кредитного скоринга
    00:25 Что необходимо сделать перед построением модели
    00:44 Загрузка данных и предварительный анализ
    04:07 Главная фишка EDA анализа!!!!! Как делать EDA?
    05:29 Рассматриваем гипотезы
    06:13 Анализируем целевую переменную (таргет) / Дисбаланс классов
    07:11 Первая гипотеза. Распределение возраста в разрезе таргета (seaborn), нормализуем данные
    08:11 Вторая гипотеза. Распределение возраста в разрезе образования / boxplot
    10:10 Корреляция признаков
    10:30 Третья гипотеза. Анализ зарплат в разрезе таргета / образования
    12:33 Feature engineering (генерация фичей), как его делать, какие могут быть новые признаки, что делать с признаком типа дата-время, логарифмирование
    15:07 Построение модели машинного обучения. 1 этап - бейзлайн (Logistic Regression)
    16:46 Как интерпретировать и использовать метрики precision, recall, roc-auc
    17:41 Строим roc-auc curve
    18:03 Подбор параметров модели с использованием GridSearch
    18:40 Сравниваем результаты на графике roc-auc / анализируем метрики
    19:32 Анализ важных признаков после обучения модели
    20:02 Используем для анализа важных признаков библиотеку shap / Интерпретирует результаты
    22:30 Коэффициенты логистической регрессии
    23:27 Сравнение важных признаков в разных классов (визуализация различий)
    Instagram* / miracl6_
    Группы в ВКонтакте pymagic
    Telegram t.me/pymagic
    *Компания Meta - организация, деятельность которой запрещена на территории Российской Федерации
    #DataScience #python

Комментарии • 151

  • @maksimperapialitsa2603
    @maksimperapialitsa2603 2 года назад +5

    Спасибо за видео! Круто, что так подробно рассказано про важность EDA, да и вообще за ясность изложения материала. За ноутбук отдельное спасибо!

  • @Mai-fl4cy
    @Mai-fl4cy 2 года назад +4

    большое спасибо за детальный разбор, один из лучших что я видела

  • @nastiadubrovskaya1637
    @nastiadubrovskaya1637 2 года назад +6

    Класс, побольше таких видео👍

  • @user-hyuser_1
    @user-hyuser_1 2 года назад

    просто супер разбор и супер канал! давай еще)))) нужно больше разобранных прикладных задач)

  • @rrahll
    @rrahll 2 года назад +54

    Спасибо, Анастасия!
    Побольше бы таких вот прикладных "реальных" кейсов годных.

    • @linkernick5379
      @linkernick5379 2 года назад

      "кейсов"

    • @user-xx6wh5nm4s
      @user-xx6wh5nm4s 2 года назад +4

      Было бы круто ещё кейс про ценообразование какой-нибудь посмотреть (например, прайсинг фин инструментов или предсказание цены в зависимости от постов в Твиттере и т.д.)!

    • @user-xx6wh5nm4s
      @user-xx6wh5nm4s 2 года назад

      @@Babylon010 како пример был бы топ?

    • @rrahll
      @rrahll 2 года назад

      @@Babylon010 Не жалейте, спасибо ) Обойдусь уж как-нибудь без жалости.
      Вместо того, чтобы жалеть, лучше бы дали "пригодный" кейс. Помогли бы начинающим.

  • @user-ez9uf9zm3v
    @user-ez9uf9zm3v 2 года назад +1

    Спасибо большое, после паузы в обучении, быстро актуализировался )

  • @t561355
    @t561355 2 года назад

    Крутое полезное видео! Хотим еще видосов о построении моделей с подготовкой данных! Спасибо!

  • @msaoc22
    @msaoc22 2 года назад

    спасибо за разбор и код, было очень познавательно и интересно послушать

  • @user-mh3jn4qh9u
    @user-mh3jn4qh9u Год назад

    Спасибо, очень интересно!

  • @user-uw3vb6co1g
    @user-uw3vb6co1g 2 года назад

    Очень полезное видео, спасибо

  • @igor0242
    @igor0242 2 года назад

    Ах! Какая красота! )

  • @user-mg9ko4wo4g
    @user-mg9ko4wo4g 2 года назад +2

    Супер прикладное видео, спасибо😌

  • @miguelchavezgordillo1624
    @miguelchavezgordillo1624 2 года назад +1

    спасибо большое, принцесса. I learn thanks to your classes, take care of yourself💕

  • @raiszakirdzhanov2148
    @raiszakirdzhanov2148 2 года назад

    Супер) сегодня посмотрел и полностью проделал данную работу! получил новые хорошие инструменты
    большое спасибо, Анастасия!

  • @MrBolat777
    @MrBolat777 2 года назад +16

    Интересно, можно ли так поставить гипотезы, чтобы выявить перспективные направления бизнеса конкретно в нашем случае. Скорее всего нужно огромное количество данных перелопатить.🧐 Вообще, честно говоря, это всё так интересно, находить закономерности в тонких делах.🤗

  • @Niki-py6ei
    @Niki-py6ei 2 года назад

    Богиня да еще и умная! Женюсь!

  • @nikita__222
    @nikita__222 2 года назад +2

    В разделе про описательные статистики говорится про проверку гипотез. На деле она осуществляется на глазок, без использования строгих процедур, вроде, например, критерия Вилкоксона и ему подобным. Вопрос - в таких задачах строгие критерии просто не нужны или так сделано исключительно в рамках этого ролика?

  • @KonstantinMedvedev-dw8dt
    @KonstantinMedvedev-dw8dt Год назад

    Огромное спасибо Анастасии за ее работу. Сразу же извиняюсь на берегу и прошу не счесть за грубость. Единственный момент, - хотел бы указать на небольшую фонетическую ошибку [время 12:35]. Не "фьюче" engineering , а "фиче" engineering. Признаться сам грешу подобным - долгое время называл одну из моих любимых серий видео игр не "сайлент" hill (silent hill), а "сайленс" hill.

  • @dmitry6297
    @dmitry6297 2 года назад +1

    такие вещи решаются программно так как параметров там от силы 200 например На таких данных врятли получится построить анализ
    алгоритм принятия решения рисует бизнес
    в скоринге популярны bpmn фреймворки

  • @vasilvasilev8763
    @vasilvasilev8763 Год назад +1

    Все linear models включительно logistic regression нуждаются в нормализации данныx (например MinMaxScaler или стандартизации StandardScaler), чтобы избежать проблемы исчезающего градиента на этапе обучения.

  • @user-qb5gw8xg9m
    @user-qb5gw8xg9m 2 года назад

    @miracl6, спасибо за видео! но у меня вопрос: а не нужно ли проверить модель на overfitting, например? а то ми посчитали скоры, но может сама по себе модель не очень хорошая?

    • @user-qb5gw8xg9m
      @user-qb5gw8xg9m 2 года назад

      @@miracl6 , спасибо за быстрий ответ! но я счас стараюсь с етим разобраться и не до конца понимаю. Мы сделали GridSearchCV, где cv=3 с метрикой roc_auc. Ето значит, что для всех комбинаций гиперпараметров мы train model на 2/3 данных и validate на 1/3 данных и наша метрика для оценивания была roc_auc, усредненная по 3-ем фолдам, я правильно понимаю?? лучшая модель - ето модель с самим високим усредненным roc_auc score, да? но где мы проверяли, что на на validation set модель справляется не особо хуже, чем на train set, что и есть overfitting? сорри за длинный вопрос :)

  • @dmitriyrayder8763
    @dmitriyrayder8763 2 года назад +2

    Спасибо, за интересное видео. ) Не бросайте плиз канал))
    Только начинаю входить в эту тему.
    Ваш канал очень интересен и вы доходчиво излагаете материал простым языком.
    Вижу, аж "Диванные Эксперты" в комментариях на галёрках приоживились и подтянулись ).. аля не концептуально сказали или разъяснили, пытаясь повысить свою диванную значимость без конкретной аргументации.
    Ждемс.. новых видео :)
    Еще раз спасибо за ваш канал )

    • @amalrik1
      @amalrik1 7 месяцев назад

      Диванный эксперт, это вы.

    • @dmitriyrayder8763
      @dmitriyrayder8763 6 месяцев назад

      ​Раскладушки, вижу уже подтянулись))😉

  • @panmichal12
    @panmichal12 Год назад

    Анастасия, вы очень красивая девушка, которая умеет просто и понятно донести материал)
    Пожелание - я бы с радостью посмотрел более подробное видео с бОльшим количеством метрик, даже если бы оно растянулось на час-полтора.

  • @RuslanKorchagin
    @RuslanKorchagin 2 года назад

    Хочу увидеть реализацию простого примера на питон/нумпай по распознаванию fashion mnist 60k
    Реализация на керас посредством простой модели с одним промежуточным слоем даёт прекрасный показатель
    А вот ручками онли нумпай не могу реализовать градиентный спуск. Сигмоиду пробовал, гипертангенс не хотить обучаться. Думаю это может многим быть интересно.

  • @osvab000
    @osvab000 2 года назад +6

    Лайк, единственное: не смог скачать датасет с Каггла - ругается, что могут только приглашенные участники это сделать :(

  • @asdfsavs6846
    @asdfsavs6846 2 года назад

    Настя ты такая классная!1!!

  • @user-xr3hf2ps6p
    @user-xr3hf2ps6p 2 года назад +2

    Ничево сибе эта 😀 а💪

  • @MegaHacker342
    @MegaHacker342 2 года назад +1

    Я так понимаю математика у вас на хорошем уровне.
    Спасибо за видео, отличное видео, хоть я не датасайнтист.

  • @sirgay8906
    @sirgay8906 Год назад

    SCH - школа, GRD - магистратура || аспирантура, UGR - бакалавриат, PGR - выпускни(к/ца) аспирантуры(аля начинающий препод), ACD - солидный препод-академик

  • @somethig_great
    @somethig_great 2 года назад

    Оффтоп:
    Безумно приятно, что у канала с достаточно нишевой темой (хотя сейчас хайп вокруг DS космический) такая большая аудитория. Отсюда вопрос: где твой канал в телеге? :)
    И раз уж на то пошло, то вот тебе идея: проанализируй аудиторию своего канала и расскажи (читай "покажи") зрителям, что данные - всюду, и если уметь ими оперировать, то можно найти интересные закономерности и логику :)

  • @poryadniy
    @poryadniy 2 года назад

    Добрый вечер, Анастасия, как Вам идея сделать серию разборов задач по основным задачам МО ?

  • @DilbirimAbdu
    @DilbirimAbdu 2 года назад

    👏🏼👏🏼👏🏼 спасибо

  • @user-ep2jp5qd1h
    @user-ep2jp5qd1h 9 месяцев назад

    Спасибо, Анастасия! Как получить приглашение на участие в этом кагл-соревновании?

  • @user-he7kw7vn2e
    @user-he7kw7vn2e 2 года назад

    На df.corr(method='pearson') имеет смысл смотреть после удаления выбросов иначе можем получить завышенную/заниженную корреляцию.
    Я вообще для себя понял, так как корреляции не свойственно отображать причин но-следственные связи (эффект множественных сравнений - - > повышение ошибки 1 рода), то использовать её в качестве некоторой меры взаимосвязи и тд нерационально. Это я ещё про ложную корреляцию не сказал. Так что пользоваться можно для выявления мультиколлинеарности, я строю лишь для этого.

    • @user-he7kw7vn2e
      @user-he7kw7vn2e 2 года назад

      @@miracl6 Тоже верно. Но, вообще говоря, если строго, то для этого существует стат. значимость, отдельную попарную корреляцию нужно проверять так, и не факт что она имеет практическую значимость при удовлетворении статистической :)

  • @elizavetaleonova9494
    @elizavetaleonova9494 9 месяцев назад

    Здравствуйте! А как можно получить доступ к датасету на кегле?

  • @tonupif
    @tonupif 2 года назад +1

    Сначала воспринял честно говоря не очень серьёзно, потом пересмотрел ролик пару раз :)

  • @user-jg3qe4tp1p
    @user-jg3qe4tp1p 2 года назад

    Анастасия, на видео вы говорите, что в данном случае мы ориентируемся на метрику реколл, но например решение, выдавать клиенту кредит или нет, ситуация невозврата более неприятна, чем невыдача, как я понял вы гоорили именно об этом, то и согласно формуле надо пользоваться метрикой Пресижн

    • @user-jg3qe4tp1p
      @user-jg3qe4tp1p 2 года назад

      @@miracl6 немного не так написал и вы меня тоже не верно поняли, давайте тогда рассмотрим 1ый случай который вы объявили в видео "Если наша ошибка при выдаче кредита будет чень дорого стоить, например выдали кредит плахому заемщику который не возвратит" ( я так понимаю это False ), А вы говорите в данном случае лучше использовать метрику Recall. Вот, вопрос заключался в этом =)

  • @user-uz4mc2uy1p
    @user-uz4mc2uy1p 2 года назад +4

    Вы забыли про биннинг переменных, psi, woe. Если не смотреть эти штуки, модель может развалится на продакте через 3 месяца.
    А так прикольно, спасибо!
    Где было это видео, когда я писал диплом?))

    • @timz2918
      @timz2918 2 года назад +1

      @@miracl6 готовы смотреть длинные видео ) или несколько частей)

    • @user-lq4vo1sv2h
      @user-lq4vo1sv2h 2 года назад

      @@miracl6 откуда уверенность что длинные видео смотреть не будет? Порог клипового мышления минут 10, если кто-то смог смотреть пол часа, значит тема ему интересна и 1.5 часа он тоже высидит

    • @denzz80
      @denzz80 2 года назад

      @@user-lq4vo1sv2h вы как маленький. вот что лучше - сто тысяч просмотров за полуторачасовое видео, или по сто тысяч просмотров за пять двадцатиминутных видосов? чем больше контента, тем лучше автору канала - и в материальном плане тоже

    • @pandyvpa
      @pandyvpa 2 года назад +3

      @@miracl6 Предлагаю в качестве темы для следующего видео собрать статистику из Ютьюба и построить регрессионную модель для расчета оптимальной длины видео для показа на вашем канале ) (шутка:)

    • @amalrik1
      @amalrik1 7 месяцев назад

      Бинниг переменных и woe - с этого нужно было начинать в кредитном скоринге. Но автор на эти замечания только огрызается. Пойдете ли вы учиться в такую онлайн-школу. Риторический вопрос.

  • @Cotucini
    @Cotucini 2 года назад +1

    Отличное видео, спасибо. А можно по юрлицам все то же самое? )

  • @datotsanava6126
    @datotsanava6126 2 года назад

    Здраствуйте, можете подсказать где можна праектый для анализа данных найдти чтоб практикаватса анализу. И ищо можете подсказать где можнаа набратса опытом с работой с данными?

  • @fedorlaputin9119
    @fedorlaputin9119 2 года назад +3

    А можете скинуть гитхаб, пожалуйста

  • @user-tz7ts7rk7r
    @user-tz7ts7rk7r 7 месяцев назад

    Настя, какой рейтинг имеешь на kaggle?

  • @MrBrentD
    @MrBrentD Год назад

    А где можно найти ссылку на ноутбук?

  • @user-ow1zi8zm7i
    @user-ow1zi8zm7i 2 года назад

    Начал курс от Яндекса и первый проект это про кредит скоринг.

  • @anatoliyv5607
    @anatoliyv5607 6 месяцев назад

    чем умнее человек тем выше вероятность что не отдаст

  • @icouldau
    @icouldau 2 года назад

    ACD - Associate College Degree

  • @python4173
    @python4173 Год назад +4

    Спасибо за урок. Но не покидало ощущение, что с метриками precision и recall есть некоторое недопонимание у ведущей. Если мы даём кредит под низкий процент, то для нас важнее метрика precision, т. е. когда мы можем доверять модели, что выдай ему кредит и он нам его вернёт. Если же мы микрофинансовая организация и выдаем кредиты под высокий процент, то для нас важнее recall, т. е. обнаружить максимальное кол-во клиентов, кому мы в принципе можем выдать кредит, пусть и не с такой высокой точностью, невозврат кредитов в таком случае мы компенсируем высокими процентными ставками.

    • @amalrik1
      @amalrik1 7 месяцев назад

      Классический кредитный скоринг не оперирует метриками Precision и Recall. Там индекс Джини, KS и различные кривые.

  • @hack_swan8305
    @hack_swan8305 2 года назад

    У вас классный контент, вот я уже учусь на программирование на пайтоне, но одно меня очень волнует так как я очень сильно заикаюсь и смотрю что на дата сайинтиста нужно разговаривать с клиентами по телефону, а в каком направлении в пайтоне меньше надо разговаривать с клиентами?

    • @arturd6988
      @arturd6988 2 года назад

      Почти все кто занимается данными не контактируют с клиентами. Только некоторые члены команды будут показывать результаты и обсуждать что то с другими департаментами / отделами в вашей фирме.

    • @hack_swan8305
      @hack_swan8305 2 года назад

      @@arturd6988 Это дата сайнтист или машинное обучение? Я просто особо так ещё не различаю их😂

  • @almazvildanov9990
    @almazvildanov9990 Год назад

    Дайте пожалуйста приглашение на конкурс Кагла.... Проверить силы

  • @lolplsdiethxbye3445
    @lolplsdiethxbye3445 2 года назад

    ❤kz

  • @user-eh2gv9cw5b
    @user-eh2gv9cw5b 2 года назад

    Тяжело ли было вникать в банкиг имея технический бэкграунд?

  • @user-jb2xj2jq6g
    @user-jb2xj2jq6g 2 года назад +1

    а такие проекты можно использовать в резюме?)

    • @user-jb2xj2jq6g
      @user-jb2xj2jq6g 2 года назад

      @@miracl6 поняла, просто пока тренируюсь подобных проектиков уже накопилось немало) спасибо)

    • @s.a.m8481
      @s.a.m8481 2 года назад

      @@miracl6 здравствуйте 🙋🏼‍♀️
      А какие решении задач стоит включать в резюме ?

  • @SlavaPonezha
    @SlavaPonezha 2 года назад +2

    Посмотрел и понял что я не дата саинтист :)

  • @nurtayevich
    @nurtayevich Год назад

    хотел скачать test.csv но там его нет. прошу помочь

    • @nurtayevich
      @nurtayevich Год назад

      @@miracl6 на гитхабском архиве как написан файл test.csv? я новичок

  • @lextor99
    @lextor99 2 года назад

    'This is a limited-participation competition. Only invited users may participate.'

  • @infatum9
    @infatum9 2 года назад

    Во время беглого просмотра сделал мысленный перенос в Google sheets или MS Excel. Не вижу смысла ставить дополнительные надстройки Jupyter, благо, что бесплатный. Хотя у Jupyter есть плюсы, можно менять картинку в зависимости от положения ползунков.
    Но вот вопрос. Сможет ли обычный пользователь добавить свои параметры, о которых не было сказано в видео (истрия прошлых кредитов, криминальное прошлое, кол-во членов семьи, район проживания, сфера образования (не просто школьное, высшее, а в какой сфере - аэрокосмичечкий инженер и экономист стоят на разных ступенях). Или опять придётся импортировать библиотеки и код? Вы сами это напишите или придётся обращаться в отдел IT к разрабам? Просто по мне проще ковырять таблицы в том же Гугл, т.к. можно добавлять и добавлять ряды и столбцы. Плюс, Google Apps Script в помощь. По нему помощи будет гораздо больше, чем по тому же Jupyter.

    • @TheAlexDoberman
      @TheAlexDoberman Год назад

      @@miracl6 Поражаюсь с каким терпением вы отвечаете на подобные вопросы))

  • @user-tm8od3rm9v
    @user-tm8od3rm9v 2 года назад

    В сша дата сайнс программисты получают 125000 в год

  • @dionatandiego11
    @dionatandiego11 2 года назад

    Entendi tudo mó kkkkkkkkkkk

  • @user-pu9nf4cg8h
    @user-pu9nf4cg8h 2 года назад +1

    Несите кольцо!!1 Я знал что девушки могут быть умными, но это какой-то космический уровень.

    • @user-yb6lg7if6q
      @user-yb6lg7if6q 2 года назад

      Боже, серьезно? Это просто скоринг

    • @user-pu9nf4cg8h
      @user-pu9nf4cg8h 2 года назад

      @@user-yb6lg7if6q несите ещё одно кольцо)

    • @bananu4
      @bananu4 2 года назад

      @@user-pu9nf4cg8h 😄😀

  • @acumen4488
    @acumen4488 2 года назад

    Миракл сменил пол и деятельность?

  • @farkhatd77
    @farkhatd77 Год назад

    Можете разместить ноутбук

  • @iuliaiakovleva1964
    @iuliaiakovleva1964 2 года назад

    я правильно понимаю, что раньше это называлось социологией?

    • @AHToHK
      @AHToHK 7 месяцев назад

      А под "это" вы что имеете в виду? :) "Технологии" data science или кредитный скоринг?
      Если верить Википедии, социоло́гия ― наука о совместной жизни групп и сообществ людей. По-моему, и сейчас она жива ещё. Статистические модели в ней наверняка использовались и ранее, как и прочие количественные методы исследований.

  • @niktotube2477
    @niktotube2477 2 года назад

    А можно видео где вы используете биннинг переменных, и как строить этот биннинг используя дерево решений
    Допустим для чего нужен биннинг?
    Берём возраст, и делаем биннинг, и может обнаружить что люди в возрасте от 23-26 самые опасные заёмщики, и тд, с каждой переменной

    • @amalrik1
      @amalrik1 7 месяцев назад

      Биннинг как основа кредитного скоринга, как и построение балльной скоркарты, здесь не раскрыто совсем.

  • @user-fz3lw9yk1r
    @user-fz3lw9yk1r 2 года назад

    А есть возможность скачать ноутбук?

    • @user-fz3lw9yk1r
      @user-fz3lw9yk1r 2 года назад

      @@miracl6 спасибо)

    • @ioann300
      @ioann300 2 года назад

      Чтобы скачать ноутбук нужно гитхабу ссылку сказать с кодом?

  • @Mega13121974
    @Mega13121974 Год назад

    А можно этот ноутбук скучать где-то?

  • @raiszakirdzhanov2148
    @raiszakirdzhanov2148 2 года назад

    Кто может дать ссылку на датасет из kaggle? не получается скачать так как выдает "Это соревнование с ограниченным участием. Участвовать могут только приглашенные пользователи.

    • @raiszakirdzhanov2148
      @raiszakirdzhanov2148 2 года назад

      @@miracl6 спасибо большое, Анастасия

    • @olegmakarov7877
      @olegmakarov7877 2 года назад

      @@miracl6 а можно ссылку на репозиторий ? Спасибо!

  • @artist1
    @artist1 2 года назад

    Есть статистика, что с высшим образованием меньше процент процент невозврата?

  • @matveysaprykin
    @matveysaprykin 2 года назад

    Мне кажется, что с метриками объяснения перепутаны

    • @matveysaprykin
      @matveysaprykin 2 года назад +1

      @@miracl6 precision же отвевает за долю истинных положительных классов в общем количестве от TP + FP. Соответственно в кейсе из видео она соответствует принципу «редко, но метко».
      Recall, или как Вы знаете полнота, показывает долю найденных истинных объектов положительного класса (в знаменателе учитывается ошибка модели неотнесения объектов положительного класса к таковому), а в формуле false positives не присутствует (ненадежных заемщиков, определяемых моделью как надёжных). Соответственно, стоит рассуждать как у Вас в видео про precision на 17:30

  • @rem.kudusov
    @rem.kudusov 2 года назад

    А вы этому в универе научились или сами?

  • @buzurgmehrnegmatov7873
    @buzurgmehrnegmatov7873 2 года назад +1

    Как на питон выявить оценку кредитоспособности клиента.
    Например вводим данные клиента:
    Возраст
    Пол
    Местожительство
    Семейное обстоятельства
    И т.д
    Затем в предикте должен выводить что клиент с точностью 78% вернет кредит, 22% не вернет.
    Как выявить вот это? 👆

  • @user-ys4bb4pz3b
    @user-ys4bb4pz3b 2 года назад

    ㅗㅜㅑ

  • @dmitrymikhaylov3578
    @dmitrymikhaylov3578 2 года назад

    Good luck discriminating clients based on age

  • @linkernick5379
    @linkernick5379 2 года назад +8

    Я так понимаю, модель это Настя, но почему кредитного скоринга? ;-)

    • @Servodroid1995
      @Servodroid1995 2 года назад

      Ваш уровень развития не соответствует этому видео =(

    • @424dsfdsfdsfs
      @424dsfdsfdsfs 2 года назад +1

      @@Servodroid1995 ожидал тут увидеть задротов без чувства юмора, но не думал что увижу во втором комменте

    • @Servodroid1995
      @Servodroid1995 2 года назад

      @@424dsfdsfdsfs уровень юмора, конечно, на высоте... Прошу, продолжай в том же духе!

    • @Servodroid1995
      @Servodroid1995 2 года назад

      @@Babylon010 научись писать по-русски, пожалуйста.

  • @user-dg1ex8rq3t
    @user-dg1ex8rq3t 2 года назад

    Неужели интересно такой мутью заниматься?

  • @user-lv5cu1zv5d
    @user-lv5cu1zv5d 2 года назад

    Как мужчина не смог спокойно смотреть и, к сожалению, ничего не понял.

  • @davidapk323
    @davidapk323 2 года назад

    тебе б канал переименовать. а то негоже тематическому контенту о математике тусоваться в каком-то "чуде" без логического объяснения, что чудесного в математике

    • @davidapk323
      @davidapk323 2 года назад

      @@miracl6 да, безусловно)
      просто , когда смотрю ваше видео среди остальных - ярко выделяется отсутствие главного названия. чего-то типа "DSschool" , "DaSi", "DataGirl".. ну вы поняли
      извиняюсь за грубый тон в предыдущем комментарии)

  • @labracap
    @labracap 2 года назад

    поберегите наши уши. нельзя разве сказать по-русски - модель оценивания кредитных баллов. "скоринг" язык спотыкается произносить...

    • @labracap
      @labracap 2 года назад

      @@miracl6 так и не смотрю. заголовок попался в ленте. поймите, я не в претензии к вам, а судя по отзывам, вы хорошо излагаете... просто нередко не стоит плодить пустые сущности, согласно бритве оккама. А так, с наступающим вас))

    • @MrTSkV
      @MrTSkV 2 года назад

      Слова "модель", "балл", "кредит" имеют не славянские корни. И если бы все слушали таких "лингвистов" как вы, их бы так и не было в русском языке.

    • @labracap
      @labracap 2 года назад

      @@MrTSkV Повторяю, новый термин вводят, когда его нет в языке. Здесь же он излишен. Пустая сущеость ваш ск.инг))

    • @artemchege
      @artemchege 2 года назад

      @@labracap вам самим не смешно на серьёзных щщах говорить что громоздкое и понятное только вам модель оценивания кредитных баллов лучше чем простое но ёмкое и всем понятное скоринг? Язык это инструмент по передаче информации и если для передачи информации надо громоздить кучи труднопроизносимых слов чтоб выразить представление о какой-то сущности то этот язык можно выкидывать на помойку, что с русским и происходит, английский его скоро сожрет и туда ему дорога.

    • @MrTSkV
      @MrTSkV 2 года назад +1

      @@labracap новый термин вводится так, как людям будет удобно, это нормальный процесс развития языка; так было и будет всегда, нравится вам это или нет. Слово 'компьютер' тоже было когда-то новым и непривычным, но оно прижилось, а 'счетная машина' никто не говорит. Такие вещи происходят естественно, это решает сам народ, а не кучка безграмотных охранителей, которые не знают, что такое бритва Оккама.

  • @suvexman281
    @suvexman281 2 года назад +1

    не( ну это вообще слушать невозможно(

  • @amalrik1
    @amalrik1 10 месяцев назад

    Представленное решение имеет очень мало общего с задачей кредитного скоринга (говорю как тренер, который читал специализированный тренинг на эту тему в российских банках). Достаточно просто открыть любой западный классический учебник на эту тему. А учитывая послужной список автора, Росбанк, это непростительно. Автору хочется пожелать, не стараться быть специалистом во всем и везде, потому что вот такие вот результаты и будут - по верхам, но на всеобщем хайпе DS до поры до времени "прокатит".

    • @miracl6
      @miracl6  10 месяцев назад +1

      Можно просто посоветовать доп литературу, либо указать на ошибки. Не надо переходить на личности, считая нужным что мне простительно, а что нет, а также безосновательно давать оценки (цель видео не поняли). Это не профессионально

    • @AHToHK
      @AHToHK 7 месяцев назад

      Я в сортах кредитных скорингов не разбираюсь, но изложенный в видео подход, по-моему, неплохо демонстрирует суть оценки кредитоспособности. Как минимум, как дополнительный источник для принятия решений его можно было бы использовать, так сказать, в дополнение к имеющейся в учреждении скоринговой системе, сделанной по тёплому ламповому учебнику :)

    • @amalrik1
      @amalrik1 7 месяцев назад

      @@miracl6 Я не увидел, где я перешел на личности. В моем сообщении нет ни одной оценки личности автора (а-ля: некрасивая прическа и т.д.) Советовать доплитературу эксперту и основателю онлайн-школы и сотруднику банка, где культура кредитного скоринга на очень высоком уровне? Ээээ. Вот именно это и непростительно как специалисту, а не личности. Цель видео - пример задачи кредитного скоринга, его тема не раскрыта.

    • @amalrik1
      @amalrik1 7 месяцев назад

      @@AHToHK Вы же сами пишете, что не разбираетесь, а даете оценку.

    • @AHToHK
      @AHToHK 6 месяцев назад

      @@amalrik1 , вы как эксперт в этом деле могли бы пояснить, что не так в этом примере. Расплывчатые оценки типа "не так , как в учебниках" - это ни о чём.
      Цель скоринга какая? Оценить кредитоспособность пациента на основании предоставленных им данных. В видео это есть? Есть! Можно ли это использовать в реальном фин.учреждении? Вряд ли. Но цель видео ведь не в этом - это ж типа "обучающий пример" применения т.н. "data science".

  • @ahmedutuber
    @ahmedutuber 2 года назад

    Use English language explain for foreign

  • @Shiyri_von_der_Berezniki
    @Shiyri_von_der_Berezniki 2 года назад

    Херня какая-то ничего не понятно, от чего отталкиваться? Для чего это все?

  • @user-cp2jh1lw5g
    @user-cp2jh1lw5g 2 года назад +4

    Видео обо всём и не о чем.

    • @user-cp2jh1lw5g
      @user-cp2jh1lw5g 2 года назад +2

      @@miracl6 ну да конечно) только я веду курс глубокого обучения в ШАД.

    • @ioann300
      @ioann300 2 года назад

      @@user-cp2jh1lw5g обо всем и не о чем это коллизия называется?

  • @suvexman281
    @suvexman281 2 года назад +1

    какой отвратный говор(( полезнее просто код посмотреть

    • @suvexman281
      @suvexman281 2 года назад

      @@miracl6 не думаю. что это деревенский акцент. скорее всего худшая версия столичного( но дело не в этом. тут и материал сильно хромает. ну блин. в 20м году рассказывать про prediction modelи для timeseries через lstm и gru(( вот в моей книге специализированные предикативные архитектуры рассматриваются. а тут такое... нельзя людям такое давать)

    • @suvexman281
      @suvexman281 2 года назад

      @@miracl6 , ну так мне же потом после таких "экспертов" ребят переучивать нужно)) приходят, говорят хрень какую-то, спрашиваю "тебе в голову вообще как такое пришло???" - на ютьубе увидел... (facepalm). hello world примеров наберете и к месту и не к месту их показывать начинаете))

    • @suvexman281
      @suvexman281 2 года назад

      @@miracl6 , Не, что-то я наверное грубовато. Прошу прощения) Мне бы было интересно посмотреть видео не тему Reinforcement Learning, еще недостаточно раскрытая тема и содержит много красивых визуализаций подходящих для видео формата. Могу предложить несколько 100% оригинальных идей, я как раз над публикацией связанной с RL сейчас работаю))

  • @Kismonavt
    @Kismonavt 2 года назад +6

    В видео грубая ошибка: score_bki - скоринговый балл по данным из БКИ. И чем выше этот балл (максимум 900), тем выше вероятность одобрения кредита. То есть высокий бки скор говорит об отличной (или хорошей) кредитной истории клиента.

    • @AHToHK
      @AHToHK 7 месяцев назад

      Если вы про американский рейтинг типа FICO, то его возможные значения, если верить Википедии, лежат в диапазоне от ~0 до 850 (там будто бы несколько вариантов этого рейтинга, так что, наверное, значения могут достигать и 900).
      В данных же из видео колонка score_bki содержит отрицательные значения с плавающей точкой, т.е. это какая-то другая шкала.