EDA, РАЗВЕДОЧНЫЙ И ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ | MATPLOTLIB, SEABORN

Поделиться
HTML-код
  • Опубликовано: 24 дек 2024

Комментарии • 54

  • @АленаВзорова
    @АленаВзорова 2 года назад +30

    Очень полезное видео. Вот сразу видно, что человек сам научился и может на пальцах другим обьяснить. Спасибо.

  • @Ley77777
    @Ley77777 Месяц назад

    Огромная благодарность 🙏🤗 Все понятно, наглядно. Сижу как раз с проектом (я еще студент, но возрастной) и осталось завести графики, но что-то не идет. Сейчас после видео точно пойду и добью💃💪💃

  • @askuznecoff
    @askuznecoff 2 года назад +9

    Круто рассказываешь! Останусь с тобой надолго.

  • @rawwwr19
    @rawwwr19 2 года назад +3

    Соглашусь, очень хорошо объясняете :)
    Мало где встречается объяснение основ типа иерархия объектов в matplotlib. А это значительно улучшает понимание.
    Для опытных людей по умолчанию кажется понятным, но новичков, кто в первый раз видит код, может стопорить.

  • @zvezdochete
    @zvezdochete 3 года назад +8

    отличное видео! как всегда - понятно и наглядно, делайте больше)

    • @machine_learrrning
      @machine_learrrning  3 года назад +2

      Спасибо! Буду стараться почаще делать видео.
      А ещё будет лучше, если напишите, какие темы вам интересней послушать :)

    • @zvezdochete
      @zvezdochete 3 года назад +1

      @@machine_learrrning я вот увидел EDA и мне сразу пришли в голову статистические методы анализа переменных - какие библиотеки есть, работа с числовыми и категориальными переменными, ранжирование переменных, как привести таргет к нормальному распределению и тд. Если говорить про графики, то как наглядно визуализировать алгоритмы Random forest, KNN и тд. То есть больше прикладные задачи в ноутбуке) но я не знаю, было бы вам интересно говорить об этом

    • @machine_learrrning
      @machine_learrrning  3 года назад +1

      Спасибо большое за идеи! Посмотрю, что можно рассказать

  • @andreyo.945
    @andreyo.945 2 года назад +2

    Спасибо огромное! Просто великолепное объяснение.

  • @Midjt
    @Midjt 10 месяцев назад

    Прекрасный урок! Спасибо!

  • @saidkarimyuldashev6594
    @saidkarimyuldashev6594 Год назад +1

    Спасибо большое за видео! Очень информативно и полезно!!!

  • @ГульшатА-ц2с
    @ГульшатА-ц2с 2 года назад +2

    Очень классное и полезное видео. Спасибо!😍

  • @GaPPFiLL
    @GaPPFiLL Год назад

    Спасибо! Очень информативное видео, очень доступно объясняете материал. С меня лайк и подписка. Надеюсь что другие Ваши видео такие же понятные, так как они именно на те темы, что мне так нужны, еще раз спасибо за Ваш труд.

  • @nadyamoscow2461
    @nadyamoscow2461 2 года назад

    Большое спасибо. Очень полезное и познавательное видео.

  • @АртёмКомарницкий-я9ь
    @АртёмКомарницкий-я9ь 2 года назад +1

    Спасибо большое!

  • @ТатьянаБарибан
    @ТатьянаБарибан 2 года назад

    Потрясающее видео! Спасибо большое! Все понятно и доступно. Прохожу сейчас небезызвестный платный курс, не буду говорить какой, но здесь сейчас я получила намного больше информации и понимания. Спасибо вам!

  • @fordatascience2810
    @fordatascience2810 2 года назад +1

    Спасибо за видео, очень полезно

  • @РоманРоманов-в2г6д
    @РоманРоманов-в2г6д 6 месяцев назад

    Какая ты крутая, спасибо)

  • @supergorod
    @supergorod 2 года назад +4

    Умничка!
    Очень не хватает живых примеров.
    Я бы сделал по 2-3 различных примера для каждой диаграммы. Это добавит ценности для зрителей.

  • @fordatascience2810
    @fordatascience2810 2 года назад

    Касательно усов ящика с усами на 14:20, когда разговор идёт об усах Вы говорите, что сказали что чаще всего они строятся как медиана +- полтора интерквартильных размаха
    Но matplotlib строит следующим образом
    $X_{нижний}= \check t_{0.25} - 1.5* (\check t_{0.75} - \check t_{0.25})$
    $X_{верхний}= \check t_{0.75} + 1.5* (\check t_{0.75} - \check t_{0.25})$
    Человеческая формула
    Нижняя граница = квантиль(0.25) - полтора интерквартильных размаха
    Верхняя граница = квантиль(0.75) + полтора интерквартильных размаха
    Проверил на своих данных на ящиках с усами
    Подскажите, пожалуйста, как лучше считать ненормальные значения, как Вы предложили или как считает matplotlib?

    • @machine_learrrning
      @machine_learrrning  2 года назад

      Лучше считать, как считает matplotlib, так более общепринято работать с выбросами и рисовать на этих показателях ящики с усами

    • @fordatascience2810
      @fordatascience2810 2 года назад +1

      @@machine_learrrning Спасибо большое) Ваши видео очень помогли разобраться с EDA

    • @machine_learrrning
      @machine_learrrning  2 года назад

      @@fordatascience2810 Очень этому рада! :)

    • @b_o_r-d5d
      @b_o_r-d5d Год назад

      @@machine_learrrning привет! а как считает matplotlib? медиана +- 1.5iqr?

  • @Дмитрий-с2э2в
    @Дмитрий-с2э2в 2 года назад +1

    Полезное видео

  • @Bbk_2018
    @Bbk_2018 2 года назад +1

    спасибо!

  • @ВалерияХорольская-ы9з

    Спасибо большое! Все понятно и структурировано! Можете скинуть ссылку на урок с разбором кода?

    • @machine_learrrning
      @machine_learrrning  2 года назад

      Видео появилось на канале: ruclips.net/video/28XZf0Fv9-0/видео.html

  • @andreybelyusenko4496
    @andreybelyusenko4496 2 года назад

    Умница, всё чётко и по делу. Очень познавательно. Спасибо.
    Такой вопрос, есть способ через hotplot показать корреляуию на большом количестве признаков, скажем на 50.(чтоб это было визуально понятно)

  • @qodirjonsafarov5416
    @qodirjonsafarov5416 2 года назад +1

    Спасибо за старание вы очень доходчево обясняете, a можете снят EDA c plotly-express тоже?

  • @antonkokin5698
    @antonkokin5698 2 года назад +1

    Привет из GB . Отличный урок, спасибо огромное, а есть методичка-шпаргалка?

    • @machine_learrrning
      @machine_learrrning  2 года назад +1

      Очень рада, что видео понравилось!
      Из подобия методички могу предложить два сайта:
      1. www.python-graph-gallery.com/
      2. datavizcatalogue.com/
      на них можно выбрать нужные вид графика и почитать для чего он применяется

  • @pankratovso
    @pankratovso 2 года назад +1

    Очень полезное видео, спасибо! По боксплотам не очень понял расчёт усов. Всегда полагал q1 - 1.5(q3-q1) и q3+1.5(q3-q1), здесь вроде говорится, что отнимаем и прибавляем к медиане…

    • @machine_learrrning
      @machine_learrrning  2 года назад

      Очень рада, что видео полезное!
      Есть разные способы потроения усов:
      1. к среднему +- 3 сигмы
      2. min, max
      3. С медианой разные вариации
      4. и тд

    • @pankratovso
      @pankratovso 2 года назад +1

      Спасибо за разъяснение, буду знать!) Видимо, я просто ориентировался на конкретную реализацию в matplotlib и seaborn.

    • @pankratovso
      @pankratovso 2 года назад

      Спасибо за разъяснение, буду знать!) Видимо, я просто ориентировался на конкретную реализацию в matplotlib и seaborn.

    • @pankratovso
      @pankratovso 2 года назад

      Спасибо за разъяснение, буду знать!) Видимо, я просто ориентировался на конкретную реализацию в matplotlib и seaborn.

    • @pankratovso
      @pankratovso 2 года назад

      Спасибо за разъяснение, буду знать!) Видимо, я просто ориентировался на конкретную реализацию в matplotlib и seaborn.

  • @chekito
    @chekito 2 года назад

    Супер

  • @enrewardronkhall8340
    @enrewardronkhall8340 2 года назад

    Эм, а ничего что сиборн всецело и полностью основан на матплотлиб, поэтому все те графики, которые есть в сиборне априори есть в матплотлиб, с одной лишь оговоркой на простоту реализации.

    • @machine_learrrning
      @machine_learrrning  2 года назад

      да, так и есть, но в matplotlib нет heatmap, нет jointplot, pairplot в удобной упаковке, так что при надобности этих визуализаций лучше пользоваться seaborn или же писать очень большое кол-во строк кода на matplotlib

  • @svbdaa
    @svbdaa 2 года назад

    Хреново уже со старта. Там больше кастомизации, а там меньше. Я так и не понял, что имел ввиду автор. Что такое кастомизация, чего именно там больше - не понятно. Пошёл в гугл, тот сказал, что кастомизация - это подстройка товара под клиента. Ясности не добавило вообще.
    Хрен его знает о чём тут сказал автор...

    • @machine_learrrning
      @machine_learrrning  2 года назад +2

      Кастомизация от слова custom (пользователь), означает создание чего-либо лично для пользователя, лично для разработчика, который создает графики, захотел более яркие цвета - добавил, захотел больше столбик в гистограмме - добавил и т.д
      Жаль, что мое видео вам не помогло, благо есть куча других источников, где можно искать информацию :)

    • @svbdaa
      @svbdaa 2 года назад

      @@machine_learrrning Беда Вашего, как и многих других авторов видео в том, что не оговаривается, для кого это видео создано, на какой уровень подготовки зрителя оно ориентировано.
      Уже одно то, что Вы решились рассказать людям об показанных в видео инструментах, говорит о том, что Ваш рассказ предназначен для тех, кто с этими инструментами не знаком. В рассказе Вы употребляете узкоспециальную терминологию. Разумеется, раз зритель с теми инструментами не знаком, то и терминологию он не знает. Ему нужно это всё пояснять так, чтоб даже ребёнок понял. Но! Улыбнитесь :) не всё так плохо. Эту ошибку делает подавляющее большинство авторов на ютубе.
      Знания приходится собирать по крохам. Кое-что я всё же понял. Жаль вот только что подавляющее большинство слов Вашего звукоряда для меня как тарабарщина - придётся вникать через переводчика (то есть, копать не одну неделю термины, чтоб понять о чём конкретно речь).
      У меня реально другая беда. Я столкнулся с необходимостью визуализации больших массивов данных, взятых с валютного рынка. Я программирую на языке MQL4 уже более 15 лет (да и частично на других тоже - время от времени приходится делать dll-библиотеки). То есть, в программировании я не новичок. в С языком Python столкнулся впервые. И я уже больше недели пытаюсь написать код, который мне хоть что-то нарисует. Не получается хоть тресни - компилятор выдаёт постоянно всё новые и новые ошибки. Тупик какой-то. В случае, если ошибок нет, то просто ни чего не происходит. Вот смотрите, это малюсенький код, который я пытаюсь seaborn-ом визуализировать disk.yandex.ru/d/YEXsf6hID24JOw
      А это результат его выполнения disk.yandex.ru/i/q80cRr0I85hSJw

    • @troll_eybus
      @troll_eybus 9 месяцев назад

      @@svbdaa нарисовать получилось? А кастомизировать?

    • @svbdaa
      @svbdaa 9 месяцев назад

      @@troll_eybus Нарисовать получилось. Для этого мне пришлось на одном из форумов найти тегеграмм-канал, в котором по кодам помогают. Кастомизацию я так и не понял. Отложил пока всё в долгий ящик. Я программирую на MQL4 и уже давно. Поднавалилось сейчас заказов. Просто не до ппайтона сейчас