Pandas - разбор всех основных возможностей на реальном датасете

Поделиться
HTML-код
  • Опубликовано: 18 июн 2024
  • 🔥 Telegram t.me/ershov_diary
    🔥 Индивидуальная программа по обучению data science под вашу цель с моей менторской поддержкой до результата:
    ershov.io/dsprogram?...
    Тут я рассказываю почему я создал эту программу, для кого она подходит и в чем ее преимущества:
    • Video
    🔥 Мой Telegram канал о Data science: t.me/ershovds
    🔥 Поддержать канал: / @alexanderershov
    Ссылка на код:
    github.com/ershovio/youtube_t...
    📖 Контакты
    Instagram: / ershovio
    Twitter: / ershovio
    Facebook: / ershovio
    LinkedIn: / ershovio
    GitHub: github.com/ershovio
    ⏰ Таймкоды:
    0:00 Введение
    1:17 Создание датафрейма (DataFrame)
    3:49 Экспорт датафрейма
    4:38 Первичный анализ датафрейма
    6:17 Одномерные данные / Series
    7:18 Фильтрация по строкам (rows) и столбцам (columns)
    14:43 Сортировка данных
    16:20 Объединение датафреймов с помощью concat и merge
    21:40 Аналитические функции (describe, mean и т.д.)
    23:31 Группировка данных с помощью group by
    26:12 Подсчет корреляции
    26:33 Визуализация данных с помощью функции plot (matplotlib)
    28:47 Изменение данных в Series и DataFrame
    #ershovds
    alexander ershov,александр ершов,pandas,pandas туториал,pandas для анализа данных,анализ данных,пандас,машинное обучение,аналитик данных,аналитик данных с нуля,аналитик данных профессия,pandas с нуля,pandas dataframe,pandas series,pandas series tutorial,pandas merge,pandas join,pandas group by,pandas groupby,python pandas,python pandas tutorial,pandas обучение,визуализация данных и машинное обучение:,визуализация данных,визуализация данных python

Комментарии • 128

  • @user-ze1jo3ln5k
    @user-ze1jo3ln5k 2 года назад +8

    Александр, прекрасная работа! Спасибо! Всё понятно и полезно!

  • @andreychayka4018
    @andreychayka4018 2 года назад +14

    Отлично получилось рассказать об основных моментах четко и сжато. Супер. Еще было бы здорово выложить под видео ссылку на ноутбук с представленным материалом.

  • @sofiasmith4659
    @sofiasmith4659 2 года назад +3

    Спасибо! Всё очень понятно и наглядно, очень нравится ваш способ просто объяснять!

  • @user-it2hg6po5z
    @user-it2hg6po5z Год назад +2

    Благодарю Вас, Александр! Очень полезный, понятный курс!

  • @inthedark122
    @inthedark122 2 года назад +2

    Спасибо за краткую выжимку, довольно полезно для начинающих

  • @kirillmelnikov1700
    @kirillmelnikov1700 Год назад +12

    Обалденное видео, просто раскрыли глаза, всё очень понятно, спасибо за ваш труд !
    И кстати видос этой либы совместно с NumPy было бы очень полезно))

  • @svetlanapopova5012
    @svetlanapopova5012 11 месяцев назад +1

    Спасибо огромное! пересмотрела кучу видео но только вы объясняете понятным для не экспертов языком.

  • @faritr9988
    @faritr9988 2 года назад

    Отлично прошёлся по базе. Большое спасибо!

  • @PetrovMaxim3dmarks
    @PetrovMaxim3dmarks 2 года назад

    Отличное видео, очень полезно на первых порах. Спасибо!

  • @user-xs4ly2cw8e
    @user-xs4ly2cw8e Год назад

    Очень классно видео, все просто, наглядно и без воды!

  • @alexkochevnicke5122
    @alexkochevnicke5122 2 года назад +2

    Очень хорошая работа. Всё понятно, интересно и увлекательно. Благодарю. Присоеденюсь к просьбе сделать лекцию по numpy.

  • @user-kw6sb1rt5b
    @user-kw6sb1rt5b Год назад

    Оч круто. Нужно еще пару разков прослушать ❤

  • @kssmss1240
    @kssmss1240 Год назад

    Спасибо! Лучшее видео по теме библиотеки Pandas!!!!!

  • @user-xy7sf6il5w
    @user-xy7sf6il5w Год назад

    Отличное видео, все понятно объясняете, спасибо!!!

  • @alcomadness
    @alcomadness Год назад

    Самое лучшее, что есть про Pandas в российском RUclips. Спасибо вам!

  • @user-rn9jx7gt7r
    @user-rn9jx7gt7r 2 года назад +2

    Спасибо) Класс, доходчиво

  • @MI-fd9es
    @MI-fd9es 2 года назад

    Спасибо, отличный урок!

  • @donfedor007
    @donfedor007 2 года назад +2

    Спасибо ! Хороший ролик!

  • @maksbelov2155
    @maksbelov2155 2 года назад

    Классное видео, спасибо больше. Очень помогло.

  • @user-hk2rk5yh9f
    @user-hk2rk5yh9f 2 месяца назад

    Спасибо за видео! очень емко, но все понятно.

  • @oldzas
    @oldzas 2 года назад +7

    Отличная грамотная речь, приятно слушать

  • @user-cw2pt5dd7q
    @user-cw2pt5dd7q 2 года назад +1

    Очень круто! Добавил в закладки

  • @alexeyishkov2236
    @alexeyishkov2236 Год назад

    Спасибо! Очень эффективное повествование!

  • @RUSn9
    @RUSn9 2 года назад

    Благодарю, отличное видео.

  • @NIKERRUS
    @NIKERRUS 2 года назад +7

    Спасибо, отличный материал! Интересно посмотреть от вас про numpy)

    • @AlexanderErshov
      @AlexanderErshov  2 года назад +4

      Постараюсь снять)

    • @sergg2711
      @sergg2711 Год назад

      @@AlexanderErshov а что означает такая конструкция df[df['Age'] == (5|1)]?

  • @SamirHabib
    @SamirHabib 4 месяца назад

    Спасибо большое, очень полезное видео. Многое узнал за полчаса. Привет из Баку!

  • @vladsol-wb7kg
    @vladsol-wb7kg Год назад

    Спасибо, очень доходчиво объяснено

  • @user-ed1hy3by5p
    @user-ed1hy3by5p 2 года назад +4

    Реально лучшее вводное видео по пандасу! Лайк со всех моих гугловских учёток.

  • @photo_graf_khv
    @photo_graf_khv 7 месяцев назад

    Отлично подан материал👍

  • @user-fo2lh9he2e
    @user-fo2lh9he2e Год назад

    Видео - топ! Спасибо! Для тех кто знает SQL и хочет Pandas изучить идеально подойдет.

  • @sanjarsanjarov4262
    @sanjarsanjarov4262 7 месяцев назад

    Замечательное видео! Автор благодарю!

  • @erasylzhumadilov4359
    @erasylzhumadilov4359 2 года назад

    все просто и понятно, спасибо

  • @Alex-yx2ye
    @Alex-yx2ye 2 года назад

    Спасибо за инфу и код

  • @user-dg1wo8hs7e
    @user-dg1wo8hs7e 11 месяцев назад +1

    Мне понравилось лаконичность, и подача. Все понятно. Можно использовать как справочник. Я сейчас прохожу курс по DC, так там на все это ушло три недели. Хотя там практики тоже много. Но видео мне будет в помощь, не раз еще пересмотрю. Автору Респект!

    • @user-go1cm3bi7g
      @user-go1cm3bi7g 7 месяцев назад

      Не Яндекс Практикум ли? :)

  • @user-os4ud5vs5n
    @user-os4ud5vs5n 2 года назад +1

    Круто! Спасибо за видео!

  • @Go_ny
    @Go_ny 22 дня назад

    Бро, просто имба, выручил

  • @user-bw2uc6pw5y
    @user-bw2uc6pw5y 4 месяца назад

    Нашел книги по Pandas - Б.Пасхавера, А.Груздева и Хейдта, под 1000 страниц каждая, читал, вникал и вдруг наткнулся на это 35-минутное видео с блокнотами из колаба!!! За 35 минут так охватить тему! Александр, слов нет, здорово! Спасибо!!!!!

  • @cyberpwn4332
    @cyberpwn4332 Год назад +1

    Очень годный видос для новичков, единственное есть замечание по df.shape и df.columns. Это не функции а параметры объекта, и потом в случае классов и объектов правильнее говорить не функции а методы, хотя суть конечно одна и та же. В любом случае пожелаю вам удачи в развитии канала, с меня лайк и подписка

  • @Dmitrii-Zhinzhilov
    @Dmitrii-Zhinzhilov Год назад

    Благодарю! Я полный новичок в Pandas, перепечатывал код, всё получилось, разобрался, понял. Отличное идеальное изложение! 👍💯🔥
    (подписка на канал +1, лайк по умолчанию)

    • @Dmitrii-Zhinzhilov
      @Dmitrii-Zhinzhilov Год назад

      подписка на канал +1, лайк по умолчанию

  • @ilia_meysak
    @ilia_meysak Год назад

    Спасибо!

  • @user-tz1sf2qr6d
    @user-tz1sf2qr6d 2 года назад

    Спасибо!!

  • @mariascofa
    @mariascofa 2 года назад +1

    спасибо!

  • @_tiredofidiocy_
    @_tiredofidiocy_ Год назад

    Если у меня получится с кикстарта с этого видоса один из своих алгоритмов из Mathcad воплотить на пандах то моей благодарочке не будет предела. Для начала услышал csv, уже хорошо, с этого начинаются все мои алгоритмы)

  • @photo_graf_khv
    @photo_graf_khv 7 месяцев назад

    Отличный материал!

  • @user-qy5oz9zd6f
    @user-qy5oz9zd6f 7 месяцев назад

    Очень содержательно. Только изображение лучше разворачивать на весь экран

  • @andreyo.945
    @andreyo.945 2 года назад +1

    Большое спасибо!

  • @user-iv5hw8rm8x
    @user-iv5hw8rm8x Месяц назад

    Не человек, а глыба! Уважение автору!

  • @Yelemessi16
    @Yelemessi16 2 года назад +1

    Полезное видео, спасибо

  • @ekaterinapetrik1008
    @ekaterinapetrik1008 2 года назад +2

    Реально, то что надо

  • @user-dt2ub9no2z
    @user-dt2ub9no2z 11 месяцев назад

    Скоро зима, скоро зима, пароноя. Этот мчк просто находка тем кто смотрит за горизонт, для меня пока на лету, надо готовиться к зиме. У нас 10 месяцев зимы, остальное все лето.

  • @vogor7
    @vogor7 2 года назад +5

    Потрясающий материал! Я прохожу курс онлайн (не у вас), и там половина курса примерно - вот это получасовое видео =) Очень круто, увидел новые фишки (для себя), например обращение по loc и iloc, до этого их не очень понимал. Также понял, что plot - очень простой инструмент в обращении (поначалу по крайней мере). И очень наглядный материал, всё же Титаник - легенда =) НАчинаешь уже сам ковыряться в этом. Спасибо огромное!

    • @AlexanderErshov
      @AlexanderErshov  2 года назад +1

      Спасибо, у меня если что не онлайн курс, а именно индивидуальная программа с менторской поддержкой

    • @vogor7
      @vogor7 2 года назад

      @@AlexanderErshov , сорри, неточность.

    • @SP-cd8be
      @SP-cd8be 2 года назад +1

      @@AlexanderErshov поддерживаю человека, во многих моментах это редкий по понятности в ру-сегменте видос по пандас не только в плане объема, но и донесения информации.

    • @alexanderkoretskiy5260
      @alexanderkoretskiy5260 2 года назад +1

      А что за онлайн курс?

    • @vogor7
      @vogor7 2 года назад

      @@alexanderkoretskiy5260 Udemy, Data Science

  • @gorbatchev41
    @gorbatchev41 Год назад

    Александр, как вы скопировали путь к файлу csv в аргумент в начале видео?

  • @user-lh6xe3zi1t
    @user-lh6xe3zi1t Год назад

    👍👍👍 + подписался!

  • @p.4017
    @p.4017 Год назад

    Хороший урок! Но вопрос, а как создать новый столбец где будет писаться например возраст от 0-18 дети, 18-35 молодёжь и тд? Просто все я смотрю либо булевые значения, либо вообще никак не говорят, хотя знать интересно)

  • @lazyknight8106
    @lazyknight8106 2 года назад +1

    А как выводить информацию как у Вас (красивая табличка)? у меня какая-то неструктурированная ерунда на выходе

  • @user-rh1vi6cd2z
    @user-rh1vi6cd2z 2 года назад

    круто

  • @informatikavaxti7512
    @informatikavaxti7512 2 месяца назад

    Cпасибо!
    А как можно изменить ряд колонн на дф или удалить их?

  • @user-sg9dd7zz1w
    @user-sg9dd7zz1w 8 месяцев назад

    вы супер

  • @miladiter9830
    @miladiter9830 2 года назад

    если я знаю всё то что Вы рассказали в этом ролике - мой уровень Пандас можно определить как 1 из 10 или на этом этапе 0? :)

  • @rassulkz4486
    @rassulkz4486 20 дней назад

    Александр, программа обучения уже не работает? Спасибо за видео

  • @user-lh6xe3zi1t
    @user-lh6xe3zi1t Год назад

    👍👍👍

  • @VlasTrunov
    @VlasTrunov 2 года назад

    @Alexander Ershov, я вижу, что среди источников есть SQL. А зачем бы я использовал pandas, когда все практически те же функции я могу использовать в самом postgreSQL? Я, кстати, не в курсе, может ли pandas парсить так же, как и pg, строки jsonb. Иными словами, поясни, пожалуйста, когда pandas нужен и когда не нужен. Спасибо за видос.

    • @AlexanderErshov
      @AlexanderErshov  2 года назад

      Pandas позволяет делать в том числе и визуализацию, ну а так - да многое можно сделать и в sql

  • @melodic_tech_house
    @melodic_tech_house 2 года назад

    Подскажите почему в pysharm гистограмма не отображается в виде картинки¿? Только данные AxesSubplot() может в ps нет такой опции?

  • @23fire23
    @23fire23 2 года назад +9

    На 5:50 разве shape и columns это функции?) Это же атрибуты класса)

    • @AlexanderErshov
      @AlexanderErshov  2 года назад +5

      да, ты прав, неправильно выразился

  • @kab333
    @kab333 2 года назад

    Всем привет.
    Проблема есть, в общем данные с екселя импортирую в таблицу (oracle), при чтении (read_excel) ошибка выходит UnicodeEncodeError, конкретно ругается на казахскую букву қ.
    Добавлял параметр encoding='utf-8' в read_excel и with open не помогло. Как это решить, помогите пжл?

  • @MrHeavy-po2or
    @MrHeavy-po2or 2 года назад

    спасибо за обзор

  • @worldtech2770
    @worldtech2770 Год назад

    Спасибо! подскажите пожалуйста, как сделать так что бы в pandas отображались оригинальные числа которые я открыл с файла .csv
    добавляются лишние 0 и в некоторых столбцах не на том месте точка стоит.
    Вот оригинал строки: 82; 1; 40.79326147; 354064; 0.1637; 5.12; 5000000000
    Вот что показывает pandas: 82 1.000000 40.793261 3.540640e+05 0.16370 1 5.120000 5.000000e+09

  • @nataliepodgainova6582
    @nataliepodgainova6582 2 года назад

    А если в столбце есть имя и фамилия, как можно сделать выборку только по имени? Имя идёт первым

  • @dGDeika
    @dGDeika 2 года назад

    very good nice

  • @RManar7
    @RManar7 2 года назад +2

    То что надо!Лайк) p.s. первый)

  • @user-gd9ki4mp4t
    @user-gd9ki4mp4t Год назад

    Хотел бы спросить. Если я повторяю Ваши действия в IDLE в интерактивной сессии с открытием файла по Титанику в df, а затем записываю с помощью метода to_csv, то почему-то при открытии с помощью Excel у меня каждая строка (в т. ч. заголовки) записываются в одну клетку первого столбца вместо красивых строк и заголовков. Что может быть не так?

    • @sagatdk2843
      @sagatdk2843 Год назад

      csv файл в exel открывайте через "Данные - получить данные - из текстового файла/csv файла". это нужно сделать в новой таблице

    • @user-gd9ki4mp4t
      @user-gd9ki4mp4t Год назад

      Спасибо, попробую

  • @Sergiypsm
    @Sergiypsm 2 года назад

    А что за браузер такой? Как-то прикольно выглядит юпитер

  • @markblack9378
    @markblack9378 Год назад

    а как он так jupyter настроил, мб вкурсе кто как включить меню слева, а курс реально лучший просто слов нету, как все понятно.

  • @user-zl3rb8rr3t
    @user-zl3rb8rr3t 2 года назад

    Шикарно

  • @murasakir1n448
    @murasakir1n448 5 месяцев назад

    Извините, а эта библиотека нужна для дата инженера или другая?
    Просто все видео о том, что эта библиотека используется для аналитики и нигде не видел, чтобы говорили о том, что она используется для инженерии данных

  • @grafist025111
    @grafist025111 2 года назад

    пилите ышшо, в рунете слишком мало подобного!

  • @kairatalmenov9558
    @kairatalmenov9558 11 месяцев назад

    ДД. помогите плз, что-то я запнулся в самом начале, не смог прочитать с Excel.
    пишу так
    df=pd.read_csv('C://Users/locadm/Desktop/sber.csv')
    но выходит ошибка. не могу разораться как нужно указывать путь к файлу Excel чтоб его открыть?

    • @osukewa7687
      @osukewa7687 2 месяца назад

      надо слэши поменять на обратные слэши

  • @user-yg8xm6oq5q
    @user-yg8xm6oq5q 2 года назад

    Александр Вы на высоте!, может подскажете ( Ваше мнение авторитетно), с помощью какой программы создать активный дашборд? Мы работаем в сфере экологии и нам никто не может объяснить!

    • @AlexanderErshov
      @AlexanderErshov  2 года назад +1

      Можете посмотреть это www.tableau.com/learn/get-started/dashboards

    • @A.M.8181
      @A.M.8181 2 года назад +2

      Можно узнать, а почему не power bi?

  • @rumvitrumvit8055
    @rumvitrumvit8055 Год назад

    А что это за среда разработки? Кажется удобной.

    • @user-cd7bk5xn7w
      @user-cd7bk5xn7w 9 месяцев назад

      вряд ли вопрос ещё актуален, но отвечу для тех, кого заинтересует в комментариях
      среда разработки называется Jupyter Notebook

  • @hinomuratomisaburo4901
    @hinomuratomisaburo4901 2 года назад

    Крутой контент ващпе 😃😃😃👍👍👍👍👍👍👍👍👍👍👍👍👍👍

  • @user-ex7px3np4y
    @user-ex7px3np4y 2 года назад

    Тысяча лайков

  • @GunaevVO
    @GunaevVO 2 года назад

    Народ pandas установлен но выводит ошибку import pandas as pd
    ModuleNotFoundError: No module named 'pandas'
    у кого такая же проблемы была? питон стоит версии 3.9

    • @user-ul3on9fi8b
      @user-ul3on9fi8b 2 года назад

      Возможно не на тот Python установлен модуль.
      pip freeze покажет вам все установленные модули
      Попробуйте pip3 install pandas

  • @lazyknight8106
    @lazyknight8106 2 года назад

    3:20, необязательно, можно не дописывать .from_dict

  • @MisterDraiman
    @MisterDraiman Год назад

    пользователи Титаника одобряют

  • @iiavuk631
    @iiavuk631 Год назад

    Пожалуйста, прочитайте, что такое функция, чтобы каждую язву функцией не обзывать.

  • @sviteribuben7245
    @sviteribuben7245 2 года назад

    хммм. .notna() удобно. Решал иначе данную фильтрацию.

  • @user-hd8oy9xp8m
    @user-hd8oy9xp8m 2 года назад +1

    Зачем нужен pandas если есть. Excel?

    • @AlexanderErshov
      @AlexanderErshov  2 года назад +1

      зачем нужен excel если есть pandas ?)

    • @user-hd8oy9xp8m
      @user-hd8oy9xp8m 2 года назад +1

      @@AlexanderErshov не знаю, вот хотел узнать

  • @spectorone7429
    @spectorone7429 2 года назад

    А как в этой же задаче решить следующее:
    1)Подсчитать долю выживших среди тех, у кого было несколько кают.
    2)Найти выжившую девушку в возрасте от 18 до 25 (включительно) у которой был самый дешевый билет.
    Никак не могу допереть.

    • @ingmarvanchikoff7199
      @ingmarvanchikoff7199 Год назад

      Забыл, что она должна выжить. Правильно будет так:
      df[(df['Survived']==1) & (df['Sex']=='female') & ((df['Age']>=18) & (df['Age']

  • @vliafto2829
    @vliafto2829 11 месяцев назад

    Все отлично. Но я бы увеличил масштаб написания кода для слабовидящих людей. То что самое важное - происходит на площади 1 кв. см. самого экрана. Если бы не звук, закрыл бы видос.

    • @zavgorodny7863
      @zavgorodny7863 2 дня назад

      Настройте zoom экрана через специальные возможности и будет вам счастье. Сможете любой квадратный сантиметр растягивать на пол-экрана и не быть ограниченным в потреблении контента

  • @rz799
    @rz799 2 года назад

    как скачивать ноутбук с github? если сохранить по ссылке, то при открытии в JN выдает ошибку.

    • @AlexanderErshov
      @AlexanderErshov  2 года назад

      Клонировать себе весь проект

    • @rz799
      @rz799 2 года назад

      @@AlexanderErshov как это сделать? подскажи пожалуйста, обычный csv даже скачать не получается, точнее открыть потом у себя на компе

    • @AlexanderErshov
      @AlexanderErshov  2 года назад

      @@rz799 git clone github.com/ershovio/youtube_tutorials.git

  • @dobroubro
    @dobroubro Год назад

    зачем дергается картинка то ? чтобы раздражать ? не буду смотреть сразу

  • @bolatu8273
    @bolatu8273 2 года назад +2

    Лайфхак: на скорости 1,5 тоже всё понятно :)

  • @nickolaytelelichcko7203
    @nickolaytelelichcko7203 2 года назад

    В избранное.

  • @evgeniyagorovaya8075
    @evgeniyagorovaya8075 Год назад

    Невозможно слушать… местечковые объяснения, «каннект»… пока-пока

  • @user-ec8qx6vo9b
    @user-ec8qx6vo9b Год назад

    Код не работает. Пишет Error tokenizing data... Expected 1 fields ..... и.т.д

  • @user-lk1dl3kz6t
    @user-lk1dl3kz6t 2 года назад

    Почему df.groupby('Sex')['Age'].plot(kind='kde') и sns.displot(data=df, x='Age', kind='kde', hue='Sex') выдают разные графики?

    • @mikenerovnya3524
      @mikenerovnya3524 2 года назад +2

      Потому что при отрисовке у них разные стандартные параметры пропускной способности (Погуглите как присваивать вручную и поиграйте со значениями.

  • @C0n3
    @C0n3 Год назад

    "будем мёгджить ", не проше говрить "объеденять"