Pandas - разбор всех основных возможностей на реальном датасете

Alexander Ershov

Просмотров 114 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 26 дек 2024

Комментарии • 133

@andreychayka4018 2 года назад ⁺²⁰
Отлично получилось рассказать об основных моментах четко и сжато. Супер. Еще было бы здорово выложить под видео ссылку на ноутбук с представленным материалом.
@oldzas 3 года назад ⁺⁷
Отличная грамотная речь, приятно слушать
@kirillmelnikov1700 Год назад ⁺¹⁷
Обалденное видео, просто раскрыли глаза, всё очень понятно, спасибо за ваш труд !
И кстати видос этой либы совместно с NumPy было бы очень полезно))
@НиколайДалевич 2 года назад ⁺¹⁰
Александр, прекрасная работа! Спасибо! Всё понятно и полезно!
@NIKERRUS 3 года назад ⁺⁷
Спасибо, отличный материал! Интересно посмотреть от вас про numpy)
@AlexanderErshov 3 года назад ⁺⁴
Постараюсь снять)
@sergg2711 Год назад
@@AlexanderErshov а что означает такая конструкция df[df['Age'] == (5|1)]?
@ДоржиГомбоев-ю6й 11 месяцев назад
Нашел книги по Pandas - Б.Пасхавера, А.Груздева и Хейдта, под 1000 страниц каждая, читал, вникал и вдруг наткнулся на это 35-минутное видео с блокнотами из колаба!!! За 35 минут так охватить тему! Александр, слов нет, здорово! Спасибо!!!!!
@ГеоргийПорьяз-з7ы 2 года назад ⁺¹
Очень круто! Добавил в закладки
@alcomadness 2 года назад
Самое лучшее, что есть про Pandas в российском RUclips. Спасибо вам!
@mar_kha 3 месяца назад
Ваше видео первое, где я увидела работу c pandas)
@photo_graf_khv Год назад ⁺¹
Отличный материал!
@jrdipper9616 11 месяцев назад
хуичный
@datatrainee198 3 месяца назад
да, можно догадаться, что производство видео очень трудоемкий процесс (судя по частоте выхода последних). Но, мы оценили, у Вас одни из лучших видео по насыщенности и доступности, что я видел на ютубе.
Огромная благодарность вам за это.
@sofiasmith4659 2 года назад ⁺⁴
Спасибо! Всё очень понятно и наглядно, очень нравится ваш способ просто объяснять!
@НикитаЛевтеров Год назад ⁺¹
Видео - топ! Спасибо! Для тех кто знает SQL и хочет Pandas изучить идеально подойдет.
@ИванПокрышкин-ь9к 8 месяцев назад
Не человек, а глыба! Уважение автору!
@inthedark122 2 года назад ⁺²
Спасибо за краткую выжимку, довольно полезно для начинающих
@iMan-ql4gx 2 месяца назад
Метод df.corr() работает только с числовыми данными, поэтому он не может вычислить корреляцию для строковых столбцов.Исключаем нечисловые столбцы из вычисления корреляционной матрицы.
df_numeric = df.select_dtypes(include='number')
df_numeric.corr()
@svetlanapopova5012 Год назад ⁺¹
Спасибо огромное! пересмотрела кучу видео но только вы объясняете понятным для не экспертов языком.
@SamirHabib 10 месяцев назад
Спасибо большое, очень полезное видео. Многое узнал за полчаса. Привет из Баку!
@ПавелМельников-в1щ Год назад
Очень содержательно. Только изображение лучше разворачивать на весь экран
@Арт1234-с3г 2 года назад ⁺²
Спасибо) Класс, доходчиво
@Олег-п9ш1я 8 месяцев назад
Спасибо за видео! очень емко, но все понятно.
@donfedor007 3 года назад ⁺²
Спасибо ! Хороший ролик!
@sanjarsanjarov4262 Год назад
Замечательное видео! Автор благодарю!
@АлександрКузнецов-ч3э9с 2 года назад ⁺²
Благодарю Вас, Александр! Очень полезный, понятный курс!
@ХатинМаликов Год назад
Скоро зима, скоро зима, пароноя. Этот мчк просто находка тем кто смотрит за горизонт, для меня пока на лету, надо готовиться к зиме. У нас 10 месяцев зимы, остальное все лето.
@kssmss1240 2 года назад
Спасибо! Лучшее видео по теме библиотеки Pandas!!!!!
@photo_graf_khv Год назад
Отлично подан материал👍
@ВадимМешков-ю7х Год назад ⁺¹
Мне понравилось лаконичность, и подача. Все понятно. Можно использовать как справочник. Я сейчас прохожу курс по DC, так там на все это ушло три недели. Хотя там практики тоже много. Но видео мне будет в помощь, не раз еще пересмотрю. Автору Респект!
@the_pac1fic0cean Год назад
Не Яндекс Практикум ли? :)
@alexkochevnicke5122 2 года назад ⁺²
Очень хорошая работа. Всё понятно, интересно и увлекательно. Благодарю. Присоеденюсь к просьбе сделать лекцию по numpy.
@faritr9988 2 года назад
Отлично прошёлся по базе. Большое спасибо!
@Йиилийлилль Год назад
Отличное видео, все понятно объясняете, спасибо!!!
@AlexanderLetetski Год назад
Оч круто. Нужно еще пару разков прослушать ❤
@АлексейТаганрогов 3 года назад ⁺⁵
Реально лучшее вводное видео по пандасу! Лайк со всех моих гугловских учёток.
@mar_kha 3 месяца назад
Хотела подписаться на ваш канал, но оказалось, что уже подписана 😅
@cyberpwn4332 Год назад ⁺¹
Очень годный видос для новичков, единственное есть замечание по df.shape и df.columns. Это не функции а параметры объекта, и потом в случае классов и объектов правильнее говорить не функции а методы, хотя суть конечно одна и та же. В любом случае пожелаю вам удачи в развитии канала, с меня лайк и подписка
@VSProger 7 месяцев назад
Бро, просто имба, выручил
@Dmitrii-Zhinzhilov Год назад
Благодарю! Я полный новичок в Pandas, перепечатывал код, всё получилось, разобрался, понял. Отличное идеальное изложение! 👍💯🔥
(подписка на канал +1, лайк по умолчанию)
@Dmitrii-Zhinzhilov Год назад
подписка на канал +1, лайк по умолчанию
@СергейСмирнов-л5я1й 2 года назад
Очень классно видео, все просто, наглядно и без воды!
@alexeyishkov2236 2 года назад
Спасибо! Очень эффективное повествование!
@АндрейИльичНасонов 4 месяца назад
В колабе просто corr не захотела работать с датафреймом из за ошибки:
ValueError: could not convert string to float: 'Braund, Mr. Owen Harris'
AI Gemeni подсказала как исправить:
# Select only the numeric columns before calculating the correlation.
numeric_df = df.select_dtypes(include=['number'])
numeric_df.corr()
@23fire23 3 года назад ⁺⁹
На 5:50 разве shape и columns это функции?) Это же атрибуты класса)
@AlexanderErshov 3 года назад ⁺⁵
да, ты прав, неправильно выразился
@vladsol-wb7kg Год назад
Спасибо, очень доходчиво объяснено
@lazyknight8106 2 года назад ⁺¹
А как выводить информацию как у Вас (красивая табличка)? у меня какая-то неструктурированная ерунда на выходе
@PetrovMaxim3dmarks 2 года назад
Отличное видео, очень полезно на первых порах. Спасибо!
@maksbelov2155 2 года назад
Классное видео, спасибо больше. Очень помогло.
@MI-fd9es 2 года назад
Спасибо, отличный урок!
@Alex-yx2ye 2 года назад
Спасибо за инфу и код
@erasylzhumadilov4359 2 года назад
все просто и понятно, спасибо
@rassulkz4486 7 месяцев назад
Александр, программа обучения уже не работает? Спасибо за видео
@informatikavaxti7512 8 месяцев назад
Cпасибо!
А как можно изменить ряд колонн на дф или удалить их?
@_tiredofidiocy_ 2 года назад
Если у меня получится с кикстарта с этого видоса один из своих алгоритмов из Mathcad воплотить на пандах то моей благодарочке не будет предела. Для начала услышал csv, уже хорошо, с этого начинаются все мои алгоритмы)
@mariascofa 2 года назад ⁺¹
спасибо!
@melodic_tech_house 2 года назад
Подскажите почему в pysharm гистограмма не отображается в виде картинки¿? Только данные AxesSubplot() может в ps нет такой опции?
@gorbatchev41 2 года назад
Александр, как вы скопировали путь к файлу csv в аргумент в начале видео?
@vogor7 3 года назад ⁺⁶
Потрясающий материал! Я прохожу курс онлайн (не у вас), и там половина курса примерно - вот это получасовое видео =) Очень круто, увидел новые фишки (для себя), например обращение по loc и iloc, до этого их не очень понимал. Также понял, что plot - очень простой инструмент в обращении (поначалу по крайней мере). И очень наглядный материал, всё же Титаник - легенда =) НАчинаешь уже сам ковыряться в этом. Спасибо огромное!
@AlexanderErshov 3 года назад ⁺¹
Спасибо, у меня если что не онлайн курс, а именно индивидуальная программа с менторской поддержкой
@vogor7 3 года назад
@@AlexanderErshov , сорри, неточность.
@SP-cd8be 3 года назад ⁺¹
@@AlexanderErshov поддерживаю человека, во многих моментах это редкий по понятности в ру-сегменте видос по пандас не только в плане объема, но и донесения информации.
@alexanderkoretskiy5260 3 года назад ⁺¹
А что за онлайн курс?
@vogor7 3 года назад
@@alexanderkoretskiy5260 Udemy, Data Science
@kairatalmenov9558 Год назад
ДД. помогите плз, что-то я запнулся в самом начале, не смог прочитать с Excel.
пишу так
df=pd.read_csv('C://Users/locadm/Desktop/sber.csv')
но выходит ошибка. не могу разораться как нужно указывать путь к файлу Excel чтоб его открыть?
@osukewa7687 9 месяцев назад
надо слэши поменять на обратные слэши
@БогданДунайцев 2 года назад
Спасибо!!
@murasakir1n448 11 месяцев назад
Извините, а эта библиотека нужна для дата инженера или другая?
Просто все видео о том, что эта библиотека используется для аналитики и нигде не видел, чтобы говорили о том, что она используется для инженерии данных
@kab333 2 года назад
Всем привет.
Проблема есть, в общем данные с екселя импортирую в таблицу (oracle), при чтении (read_excel) ошибка выходит UnicodeEncodeError, конкретно ругается на казахскую букву қ.
Добавлял параметр encoding='utf-8' в read_excel и with open не помогло. Как это решить, помогите пжл?
@ИлларионИванов-л1е Год назад
👍👍👍 + подписался!
@nataliepodgainova6582 2 года назад
А если в столбце есть имя и фамилия, как можно сделать выборку только по имени? Имя идёт первым
@miladiter9830 2 года назад
если я знаю всё то что Вы рассказали в этом ролике - мой уровень Пандас можно определить как 1 из 10 или на этом этапе 0? :)
@worldtech2770 2 года назад
Спасибо! подскажите пожалуйста, как сделать так что бы в pandas отображались оригинальные числа которые я открыл с файла .csv
добавляются лишние 0 и в некоторых столбцах не на том месте точка стоит.
Вот оригинал строки: 82; 1; 40.79326147; 354064; 0.1637; 5.12; 5000000000
Вот что показывает pandas: 82 1.000000 40.793261 3.540640e+05 0.16370 1 5.120000 5.000000e+09
@markblack9378 2 года назад
а как он так jupyter настроил, мб вкурсе кто как включить меню слева, а курс реально лучший просто слов нету, как все понятно.
@Sergiypsm 2 года назад
А что за браузер такой? Как-то прикольно выглядит юпитер
@p.4017 2 года назад
Хороший урок! Но вопрос, а как создать новый столбец где будет писаться например возраст от 0-18 дети, 18-35 молодёжь и тд? Просто все я смотрю либо булевые значения, либо вообще никак не говорят, хотя знать интересно)
@ИльяКолотыгин Год назад
Хотел бы спросить. Если я повторяю Ваши действия в IDLE в интерактивной сессии с открытием файла по Титанику в df, а затем записываю с помощью метода to_csv, то почему-то при открытии с помощью Excel у меня каждая строка (в т. ч. заголовки) записываются в одну клетку первого столбца вместо красивых строк и заголовков. Что может быть не так?
@sagatdk2843 Год назад
csv файл в exel открывайте через "Данные - получить данные - из текстового файла/csv файла". это нужно сделать в новой таблице
@ИльяКолотыгин Год назад
Спасибо, попробую
@ДмитрийДирко-щ7п Год назад
вы супер
@VlasTrunov 2 года назад
@Alexander Ershov, я вижу, что среди источников есть SQL. А зачем бы я использовал pandas, когда все практически те же функции я могу использовать в самом postgreSQL? Я, кстати, не в курсе, может ли pandas парсить так же, как и pg, строки jsonb. Иными словами, поясни, пожалуйста, когда pandas нужен и когда не нужен. Спасибо за видос.
@AlexanderErshov 2 года назад
Pandas позволяет делать в том числе и визуализацию, ну а так - да многое можно сделать и в sql
@ДенисСеверинов-щ6х 3 года назад ⁺¹
Круто! Спасибо за видео!
@rumvitrumvit8055 Год назад
А что это за среда разработки? Кажется удобной.
@ДавидГеворгян-н4ц Год назад
вряд ли вопрос ещё актуален, но отвечу для тех, кого заинтересует в комментариях
среда разработки называется Jupyter Notebook
@grafist025111 2 года назад
пилите ышшо, в рунете слишком мало подобного!
@АлександрПокровский-к4ь 2 года назад ⁺¹
Зачем нужен pandas если есть. Excel?
@AlexanderErshov 2 года назад ⁺¹
зачем нужен excel если есть pandas ?)
@АлександрПокровский-к4ь 2 года назад ⁺¹
@@AlexanderErshov не знаю, вот хотел узнать
@lazyknight8106 2 года назад
3:20, необязательно, можно не дописывать .from_dict
@andreyo.945 3 года назад ⁺¹
Большое спасибо!
@ekaterinapetrik1008 3 года назад ⁺²
Реально, то что надо
@GunaevVO 3 года назад
Народ pandas установлен но выводит ошибку import pandas as pd
ModuleNotFoundError: No module named 'pandas'
у кого такая же проблемы была? питон стоит версии 3.9
@ЕвгенийКонстанта 3 года назад
Возможно не на тот Python установлен модуль.
pip freeze покажет вам все установленные модули
Попробуйте pip3 install pandas
@ИлларионИванов-л1е Год назад
👍👍👍
@Yelemessi16 3 года назад ⁺¹
Полезное видео, спасибо
@iiavuk631 2 года назад
Пожалуйста, прочитайте, что такое функция, чтобы каждую язву функцией не обзывать.
@АртурКамалетдинов-у6э 3 года назад
круто
@СергейЕременко-и5з 3 года назад
Александр Вы на высоте!, может подскажете ( Ваше мнение авторитетно), с помощью какой программы создать активный дашборд? Мы работаем в сфере экологии и нам никто не может объяснить!
@AlexanderErshov 3 года назад ⁺¹
Можете посмотреть это www.tableau.com/learn/get-started/dashboards
@A.M.8181 3 года назад ⁺²
Можно узнать, а почему не power bi?
@MisterDraiman Год назад
пользователи Титаника одобряют
@RManar7 3 года назад ⁺²
То что надо!Лайк) p.s. первый)
@vliafto2829 Год назад
Все отлично. Но я бы увеличил масштаб написания кода для слабовидящих людей. То что самое важное - происходит на площади 1 кв. см. самого экрана. Если бы не звук, закрыл бы видос.
@zavdev 6 месяцев назад
Настройте zoom экрана через специальные возможности и будет вам счастье. Сможете любой квадратный сантиметр растягивать на пол-экрана и не быть ограниченным в потреблении контента
@spectorone7429 2 года назад
А как в этой же задаче решить следующее:
1)Подсчитать долю выживших среди тех, у кого было несколько кают.
2)Найти выжившую девушку в возрасте от 18 до 25 (включительно) у которой был самый дешевый билет.
Никак не могу допереть.
@ingmarvanchikoff7199 2 года назад
Забыл, что она должна выжить. Правильно будет так:
df[(df['Survived']==1) & (df['Sex']=='female') & ((df['Age']>=18) & (df['Age']
@dobroubro 2 года назад
зачем дергается картинка то ? чтобы раздражать ? не буду смотреть сразу
@rz799 3 года назад
как скачивать ноутбук с github? если сохранить по ссылке, то при открытии в JN выдает ошибку.
@AlexanderErshov 3 года назад
Клонировать себе весь проект
@rz799 3 года назад
@@AlexanderErshov как это сделать? подскажи пожалуйста, обычный csv даже скачать не получается, точнее открыть потом у себя на компе
@AlexanderErshov 3 года назад
@@rz799 git clone github.com/ershovio/youtube_tutorials.git
@MrHeavy-po2or 3 года назад
спасибо за обзор
@dGDeika 2 года назад
very good nice
@ДмитрийАверьянов-щ4г 3 года назад
Шикарно
@hinomuratomisaburo4901 3 года назад
Крутой контент ващпе 😃😃😃👍👍👍👍👍👍👍👍👍👍👍👍👍👍
@АнтонДраганчук 3 года назад
Тысяча лайков
@sviteribuben7245 3 года назад
хммм. .notna() удобно. Решал иначе данную фильтрацию.
@bolatu8273 3 года назад ⁺²
Лайфхак: на скорости 1,5 тоже всё понятно :)
@nickolaytelelichcko7203 3 года назад
В избранное.
@Jaggerglam9043 2 года назад
Невозможно слушать… местечковые объяснения, «каннект»… пока-пока
@АнтонС-е6е 2 года назад
Код не работает. Пишет Error tokenizing data... Expected 1 fields ..... и.т.д
@chillinzo 3 года назад
Почему df.groupby('Sex')['Age'].plot(kind='kde') и sns.displot(data=df, x='Age', kind='kde', hue='Sex') выдают разные графики?
@mikenerovnya3524 3 года назад ⁺²
Потому что при отрисовке у них разные стандартные параметры пропускной способности (Погуглите как присваивать вручную и поиграйте со значениями.
@C0n3 2 года назад
"будем мёгджить ", не проше говрить "объеденять"

Следующие

Автовоспроизведение