Pandas - разбор всех основных возможностей на реальном датасете

Поделиться
HTML-код
  • Опубликовано: 26 дек 2024

Комментарии • 133

  • @andreychayka4018
    @andreychayka4018 2 года назад +20

    Отлично получилось рассказать об основных моментах четко и сжато. Супер. Еще было бы здорово выложить под видео ссылку на ноутбук с представленным материалом.

  • @oldzas
    @oldzas 3 года назад +7

    Отличная грамотная речь, приятно слушать

  • @kirillmelnikov1700
    @kirillmelnikov1700 Год назад +17

    Обалденное видео, просто раскрыли глаза, всё очень понятно, спасибо за ваш труд !
    И кстати видос этой либы совместно с NumPy было бы очень полезно))

  • @НиколайДалевич
    @НиколайДалевич 2 года назад +10

    Александр, прекрасная работа! Спасибо! Всё понятно и полезно!

  • @NIKERRUS
    @NIKERRUS 3 года назад +7

    Спасибо, отличный материал! Интересно посмотреть от вас про numpy)

    • @AlexanderErshov
      @AlexanderErshov  3 года назад +4

      Постараюсь снять)

    • @sergg2711
      @sergg2711 Год назад

      @@AlexanderErshov а что означает такая конструкция df[df['Age'] == (5|1)]?

  • @ДоржиГомбоев-ю6й
    @ДоржиГомбоев-ю6й 11 месяцев назад

    Нашел книги по Pandas - Б.Пасхавера, А.Груздева и Хейдта, под 1000 страниц каждая, читал, вникал и вдруг наткнулся на это 35-минутное видео с блокнотами из колаба!!! За 35 минут так охватить тему! Александр, слов нет, здорово! Спасибо!!!!!

  • @ГеоргийПорьяз-з7ы
    @ГеоргийПорьяз-з7ы 2 года назад +1

    Очень круто! Добавил в закладки

  • @alcomadness
    @alcomadness 2 года назад

    Самое лучшее, что есть про Pandas в российском RUclips. Спасибо вам!

  • @mar_kha
    @mar_kha 3 месяца назад

    Ваше видео первое, где я увидела работу c pandas)

  • @photo_graf_khv
    @photo_graf_khv Год назад +1

    Отличный материал!

  • @datatrainee198
    @datatrainee198 3 месяца назад

    да, можно догадаться, что производство видео очень трудоемкий процесс (судя по частоте выхода последних). Но, мы оценили, у Вас одни из лучших видео по насыщенности и доступности, что я видел на ютубе.
    Огромная благодарность вам за это.

  • @sofiasmith4659
    @sofiasmith4659 2 года назад +4

    Спасибо! Всё очень понятно и наглядно, очень нравится ваш способ просто объяснять!

  • @НикитаЛевтеров
    @НикитаЛевтеров Год назад +1

    Видео - топ! Спасибо! Для тех кто знает SQL и хочет Pandas изучить идеально подойдет.

  • @ИванПокрышкин-ь9к
    @ИванПокрышкин-ь9к 8 месяцев назад

    Не человек, а глыба! Уважение автору!

  • @inthedark122
    @inthedark122 2 года назад +2

    Спасибо за краткую выжимку, довольно полезно для начинающих

  • @iMan-ql4gx
    @iMan-ql4gx 2 месяца назад

    Метод df.corr() работает только с числовыми данными, поэтому он не может вычислить корреляцию для строковых столбцов.Исключаем нечисловые столбцы из вычисления корреляционной матрицы.
    df_numeric = df.select_dtypes(include='number')
    df_numeric.corr()

  • @svetlanapopova5012
    @svetlanapopova5012 Год назад +1

    Спасибо огромное! пересмотрела кучу видео но только вы объясняете понятным для не экспертов языком.

  • @SamirHabib
    @SamirHabib 10 месяцев назад

    Спасибо большое, очень полезное видео. Многое узнал за полчаса. Привет из Баку!

  • @ПавелМельников-в1щ

    Очень содержательно. Только изображение лучше разворачивать на весь экран

  • @Арт1234-с3г
    @Арт1234-с3г 2 года назад +2

    Спасибо) Класс, доходчиво

  • @Олег-п9ш1я
    @Олег-п9ш1я 8 месяцев назад

    Спасибо за видео! очень емко, но все понятно.

  • @donfedor007
    @donfedor007 3 года назад +2

    Спасибо ! Хороший ролик!

  • @sanjarsanjarov4262
    @sanjarsanjarov4262 Год назад

    Замечательное видео! Автор благодарю!

  • @АлександрКузнецов-ч3э9с

    Благодарю Вас, Александр! Очень полезный, понятный курс!

  • @ХатинМаликов
    @ХатинМаликов Год назад

    Скоро зима, скоро зима, пароноя. Этот мчк просто находка тем кто смотрит за горизонт, для меня пока на лету, надо готовиться к зиме. У нас 10 месяцев зимы, остальное все лето.

  • @kssmss1240
    @kssmss1240 2 года назад

    Спасибо! Лучшее видео по теме библиотеки Pandas!!!!!

  • @photo_graf_khv
    @photo_graf_khv Год назад

    Отлично подан материал👍

  • @ВадимМешков-ю7х
    @ВадимМешков-ю7х Год назад +1

    Мне понравилось лаконичность, и подача. Все понятно. Можно использовать как справочник. Я сейчас прохожу курс по DC, так там на все это ушло три недели. Хотя там практики тоже много. Но видео мне будет в помощь, не раз еще пересмотрю. Автору Респект!

  • @alexkochevnicke5122
    @alexkochevnicke5122 2 года назад +2

    Очень хорошая работа. Всё понятно, интересно и увлекательно. Благодарю. Присоеденюсь к просьбе сделать лекцию по numpy.

  • @faritr9988
    @faritr9988 2 года назад

    Отлично прошёлся по базе. Большое спасибо!

  • @Йиилийлилль
    @Йиилийлилль Год назад

    Отличное видео, все понятно объясняете, спасибо!!!

  • @AlexanderLetetski
    @AlexanderLetetski Год назад

    Оч круто. Нужно еще пару разков прослушать ❤

  • @АлексейТаганрогов
    @АлексейТаганрогов 3 года назад +5

    Реально лучшее вводное видео по пандасу! Лайк со всех моих гугловских учёток.

  • @mar_kha
    @mar_kha 3 месяца назад

    Хотела подписаться на ваш канал, но оказалось, что уже подписана 😅

  • @cyberpwn4332
    @cyberpwn4332 Год назад +1

    Очень годный видос для новичков, единственное есть замечание по df.shape и df.columns. Это не функции а параметры объекта, и потом в случае классов и объектов правильнее говорить не функции а методы, хотя суть конечно одна и та же. В любом случае пожелаю вам удачи в развитии канала, с меня лайк и подписка

  • @VSProger
    @VSProger 7 месяцев назад

    Бро, просто имба, выручил

  • @Dmitrii-Zhinzhilov
    @Dmitrii-Zhinzhilov Год назад

    Благодарю! Я полный новичок в Pandas, перепечатывал код, всё получилось, разобрался, понял. Отличное идеальное изложение! 👍💯🔥
    (подписка на канал +1, лайк по умолчанию)

    • @Dmitrii-Zhinzhilov
      @Dmitrii-Zhinzhilov Год назад

      подписка на канал +1, лайк по умолчанию

  • @СергейСмирнов-л5я1й
    @СергейСмирнов-л5я1й 2 года назад

    Очень классно видео, все просто, наглядно и без воды!

  • @alexeyishkov2236
    @alexeyishkov2236 2 года назад

    Спасибо! Очень эффективное повествование!

  • @АндрейИльичНасонов
    @АндрейИльичНасонов 4 месяца назад

    В колабе просто corr не захотела работать с датафреймом из за ошибки:
    ValueError: could not convert string to float: 'Braund, Mr. Owen Harris'
    AI Gemeni подсказала как исправить:
    # Select only the numeric columns before calculating the correlation.
    numeric_df = df.select_dtypes(include=['number'])
    numeric_df.corr()

  • @23fire23
    @23fire23 3 года назад +9

    На 5:50 разве shape и columns это функции?) Это же атрибуты класса)

    • @AlexanderErshov
      @AlexanderErshov  3 года назад +5

      да, ты прав, неправильно выразился

  • @vladsol-wb7kg
    @vladsol-wb7kg Год назад

    Спасибо, очень доходчиво объяснено

  • @lazyknight8106
    @lazyknight8106 2 года назад +1

    А как выводить информацию как у Вас (красивая табличка)? у меня какая-то неструктурированная ерунда на выходе

  • @PetrovMaxim3dmarks
    @PetrovMaxim3dmarks 2 года назад

    Отличное видео, очень полезно на первых порах. Спасибо!

  • @maksbelov2155
    @maksbelov2155 2 года назад

    Классное видео, спасибо больше. Очень помогло.

  • @MI-fd9es
    @MI-fd9es 2 года назад

    Спасибо, отличный урок!

  • @Alex-yx2ye
    @Alex-yx2ye 2 года назад

    Спасибо за инфу и код

  • @erasylzhumadilov4359
    @erasylzhumadilov4359 2 года назад

    все просто и понятно, спасибо

  • @rassulkz4486
    @rassulkz4486 7 месяцев назад

    Александр, программа обучения уже не работает? Спасибо за видео

  • @informatikavaxti7512
    @informatikavaxti7512 8 месяцев назад

    Cпасибо!
    А как можно изменить ряд колонн на дф или удалить их?

  • @_tiredofidiocy_
    @_tiredofidiocy_ 2 года назад

    Если у меня получится с кикстарта с этого видоса один из своих алгоритмов из Mathcad воплотить на пандах то моей благодарочке не будет предела. Для начала услышал csv, уже хорошо, с этого начинаются все мои алгоритмы)

  • @mariascofa
    @mariascofa 2 года назад +1

    спасибо!

  • @melodic_tech_house
    @melodic_tech_house 2 года назад

    Подскажите почему в pysharm гистограмма не отображается в виде картинки¿? Только данные AxesSubplot() может в ps нет такой опции?

  • @gorbatchev41
    @gorbatchev41 2 года назад

    Александр, как вы скопировали путь к файлу csv в аргумент в начале видео?

  • @vogor7
    @vogor7 3 года назад +6

    Потрясающий материал! Я прохожу курс онлайн (не у вас), и там половина курса примерно - вот это получасовое видео =) Очень круто, увидел новые фишки (для себя), например обращение по loc и iloc, до этого их не очень понимал. Также понял, что plot - очень простой инструмент в обращении (поначалу по крайней мере). И очень наглядный материал, всё же Титаник - легенда =) НАчинаешь уже сам ковыряться в этом. Спасибо огромное!

    • @AlexanderErshov
      @AlexanderErshov  3 года назад +1

      Спасибо, у меня если что не онлайн курс, а именно индивидуальная программа с менторской поддержкой

    • @vogor7
      @vogor7 3 года назад

      @@AlexanderErshov , сорри, неточность.

    • @SP-cd8be
      @SP-cd8be 3 года назад +1

      @@AlexanderErshov поддерживаю человека, во многих моментах это редкий по понятности в ру-сегменте видос по пандас не только в плане объема, но и донесения информации.

    • @alexanderkoretskiy5260
      @alexanderkoretskiy5260 3 года назад +1

      А что за онлайн курс?

    • @vogor7
      @vogor7 3 года назад

      @@alexanderkoretskiy5260 Udemy, Data Science

  • @kairatalmenov9558
    @kairatalmenov9558 Год назад

    ДД. помогите плз, что-то я запнулся в самом начале, не смог прочитать с Excel.
    пишу так
    df=pd.read_csv('C://Users/locadm/Desktop/sber.csv')
    но выходит ошибка. не могу разораться как нужно указывать путь к файлу Excel чтоб его открыть?

    • @osukewa7687
      @osukewa7687 9 месяцев назад

      надо слэши поменять на обратные слэши

  • @БогданДунайцев
    @БогданДунайцев 2 года назад

    Спасибо!!

  • @murasakir1n448
    @murasakir1n448 11 месяцев назад

    Извините, а эта библиотека нужна для дата инженера или другая?
    Просто все видео о том, что эта библиотека используется для аналитики и нигде не видел, чтобы говорили о том, что она используется для инженерии данных

  • @kab333
    @kab333 2 года назад

    Всем привет.
    Проблема есть, в общем данные с екселя импортирую в таблицу (oracle), при чтении (read_excel) ошибка выходит UnicodeEncodeError, конкретно ругается на казахскую букву қ.
    Добавлял параметр encoding='utf-8' в read_excel и with open не помогло. Как это решить, помогите пжл?

  • @ИлларионИванов-л1е

    👍👍👍 + подписался!

  • @nataliepodgainova6582
    @nataliepodgainova6582 2 года назад

    А если в столбце есть имя и фамилия, как можно сделать выборку только по имени? Имя идёт первым

  • @miladiter9830
    @miladiter9830 2 года назад

    если я знаю всё то что Вы рассказали в этом ролике - мой уровень Пандас можно определить как 1 из 10 или на этом этапе 0? :)

  • @worldtech2770
    @worldtech2770 2 года назад

    Спасибо! подскажите пожалуйста, как сделать так что бы в pandas отображались оригинальные числа которые я открыл с файла .csv
    добавляются лишние 0 и в некоторых столбцах не на том месте точка стоит.
    Вот оригинал строки: 82; 1; 40.79326147; 354064; 0.1637; 5.12; 5000000000
    Вот что показывает pandas: 82 1.000000 40.793261 3.540640e+05 0.16370 1 5.120000 5.000000e+09

  • @markblack9378
    @markblack9378 2 года назад

    а как он так jupyter настроил, мб вкурсе кто как включить меню слева, а курс реально лучший просто слов нету, как все понятно.

  • @Sergiypsm
    @Sergiypsm 2 года назад

    А что за браузер такой? Как-то прикольно выглядит юпитер

  • @p.4017
    @p.4017 2 года назад

    Хороший урок! Но вопрос, а как создать новый столбец где будет писаться например возраст от 0-18 дети, 18-35 молодёжь и тд? Просто все я смотрю либо булевые значения, либо вообще никак не говорят, хотя знать интересно)

  • @ИльяКолотыгин
    @ИльяКолотыгин Год назад

    Хотел бы спросить. Если я повторяю Ваши действия в IDLE в интерактивной сессии с открытием файла по Титанику в df, а затем записываю с помощью метода to_csv, то почему-то при открытии с помощью Excel у меня каждая строка (в т. ч. заголовки) записываются в одну клетку первого столбца вместо красивых строк и заголовков. Что может быть не так?

    • @sagatdk2843
      @sagatdk2843 Год назад

      csv файл в exel открывайте через "Данные - получить данные - из текстового файла/csv файла". это нужно сделать в новой таблице

    • @ИльяКолотыгин
      @ИльяКолотыгин Год назад

      Спасибо, попробую

  • @ДмитрийДирко-щ7п

    вы супер

  • @VlasTrunov
    @VlasTrunov 2 года назад

    @Alexander Ershov, я вижу, что среди источников есть SQL. А зачем бы я использовал pandas, когда все практически те же функции я могу использовать в самом postgreSQL? Я, кстати, не в курсе, может ли pandas парсить так же, как и pg, строки jsonb. Иными словами, поясни, пожалуйста, когда pandas нужен и когда не нужен. Спасибо за видос.

    • @AlexanderErshov
      @AlexanderErshov  2 года назад

      Pandas позволяет делать в том числе и визуализацию, ну а так - да многое можно сделать и в sql

  • @ДенисСеверинов-щ6х
    @ДенисСеверинов-щ6х 3 года назад +1

    Круто! Спасибо за видео!

  • @rumvitrumvit8055
    @rumvitrumvit8055 Год назад

    А что это за среда разработки? Кажется удобной.

    • @ДавидГеворгян-н4ц
      @ДавидГеворгян-н4ц Год назад

      вряд ли вопрос ещё актуален, но отвечу для тех, кого заинтересует в комментариях
      среда разработки называется Jupyter Notebook

  • @grafist025111
    @grafist025111 2 года назад

    пилите ышшо, в рунете слишком мало подобного!

  • @АлександрПокровский-к4ь

    Зачем нужен pandas если есть. Excel?

  • @lazyknight8106
    @lazyknight8106 2 года назад

    3:20, необязательно, можно не дописывать .from_dict

  • @andreyo.945
    @andreyo.945 3 года назад +1

    Большое спасибо!

  • @ekaterinapetrik1008
    @ekaterinapetrik1008 3 года назад +2

    Реально, то что надо

  • @GunaevVO
    @GunaevVO 3 года назад

    Народ pandas установлен но выводит ошибку import pandas as pd
    ModuleNotFoundError: No module named 'pandas'
    у кого такая же проблемы была? питон стоит версии 3.9

    • @ЕвгенийКонстанта
      @ЕвгенийКонстанта 3 года назад

      Возможно не на тот Python установлен модуль.
      pip freeze покажет вам все установленные модули
      Попробуйте pip3 install pandas

  • @ИлларионИванов-л1е

    👍👍👍

  • @Yelemessi16
    @Yelemessi16 3 года назад +1

    Полезное видео, спасибо

  • @iiavuk631
    @iiavuk631 2 года назад

    Пожалуйста, прочитайте, что такое функция, чтобы каждую язву функцией не обзывать.

  • @АртурКамалетдинов-у6э

    круто

  • @СергейЕременко-и5з
    @СергейЕременко-и5з 3 года назад

    Александр Вы на высоте!, может подскажете ( Ваше мнение авторитетно), с помощью какой программы создать активный дашборд? Мы работаем в сфере экологии и нам никто не может объяснить!

    • @AlexanderErshov
      @AlexanderErshov  3 года назад +1

      Можете посмотреть это www.tableau.com/learn/get-started/dashboards

    • @A.M.8181
      @A.M.8181 3 года назад +2

      Можно узнать, а почему не power bi?

  • @MisterDraiman
    @MisterDraiman Год назад

    пользователи Титаника одобряют

  • @RManar7
    @RManar7 3 года назад +2

    То что надо!Лайк) p.s. первый)

  • @vliafto2829
    @vliafto2829 Год назад

    Все отлично. Но я бы увеличил масштаб написания кода для слабовидящих людей. То что самое важное - происходит на площади 1 кв. см. самого экрана. Если бы не звук, закрыл бы видос.

    • @zavdev
      @zavdev 6 месяцев назад

      Настройте zoom экрана через специальные возможности и будет вам счастье. Сможете любой квадратный сантиметр растягивать на пол-экрана и не быть ограниченным в потреблении контента

  • @spectorone7429
    @spectorone7429 2 года назад

    А как в этой же задаче решить следующее:
    1)Подсчитать долю выживших среди тех, у кого было несколько кают.
    2)Найти выжившую девушку в возрасте от 18 до 25 (включительно) у которой был самый дешевый билет.
    Никак не могу допереть.

    • @ingmarvanchikoff7199
      @ingmarvanchikoff7199 2 года назад

      Забыл, что она должна выжить. Правильно будет так:
      df[(df['Survived']==1) & (df['Sex']=='female') & ((df['Age']>=18) & (df['Age']

  • @dobroubro
    @dobroubro 2 года назад

    зачем дергается картинка то ? чтобы раздражать ? не буду смотреть сразу

  • @rz799
    @rz799 3 года назад

    как скачивать ноутбук с github? если сохранить по ссылке, то при открытии в JN выдает ошибку.

    • @AlexanderErshov
      @AlexanderErshov  3 года назад

      Клонировать себе весь проект

    • @rz799
      @rz799 3 года назад

      @@AlexanderErshov как это сделать? подскажи пожалуйста, обычный csv даже скачать не получается, точнее открыть потом у себя на компе

    • @AlexanderErshov
      @AlexanderErshov  3 года назад

      @@rz799 git clone github.com/ershovio/youtube_tutorials.git

  • @MrHeavy-po2or
    @MrHeavy-po2or 3 года назад

    спасибо за обзор

  • @dGDeika
    @dGDeika 2 года назад

    very good nice

  • @ДмитрийАверьянов-щ4г

    Шикарно

  • @hinomuratomisaburo4901
    @hinomuratomisaburo4901 3 года назад

    Крутой контент ващпе 😃😃😃👍👍👍👍👍👍👍👍👍👍👍👍👍👍

  • @АнтонДраганчук
    @АнтонДраганчук 3 года назад

    Тысяча лайков

  • @sviteribuben7245
    @sviteribuben7245 3 года назад

    хммм. .notna() удобно. Решал иначе данную фильтрацию.

  • @bolatu8273
    @bolatu8273 3 года назад +2

    Лайфхак: на скорости 1,5 тоже всё понятно :)

  • @nickolaytelelichcko7203
    @nickolaytelelichcko7203 3 года назад

    В избранное.

  • @Jaggerglam9043
    @Jaggerglam9043 2 года назад

    Невозможно слушать… местечковые объяснения, «каннект»… пока-пока

  • @АнтонС-е6е
    @АнтонС-е6е 2 года назад

    Код не работает. Пишет Error tokenizing data... Expected 1 fields ..... и.т.д

  • @chillinzo
    @chillinzo 3 года назад

    Почему df.groupby('Sex')['Age'].plot(kind='kde') и sns.displot(data=df, x='Age', kind='kde', hue='Sex') выдают разные графики?

    • @mikenerovnya3524
      @mikenerovnya3524 3 года назад +2

      Потому что при отрисовке у них разные стандартные параметры пропускной способности (Погуглите как присваивать вручную и поиграйте со значениями.

  • @C0n3
    @C0n3 2 года назад

    "будем мёгджить ", не проше говрить "объеденять"