Отлично получилось рассказать об основных моментах четко и сжато. Супер. Еще было бы здорово выложить под видео ссылку на ноутбук с представленным материалом.
Нашел книги по Pandas - Б.Пасхавера, А.Груздева и Хейдта, под 1000 страниц каждая, читал, вникал и вдруг наткнулся на это 35-минутное видео с блокнотами из колаба!!! За 35 минут так охватить тему! Александр, слов нет, здорово! Спасибо!!!!!
да, можно догадаться, что производство видео очень трудоемкий процесс (судя по частоте выхода последних). Но, мы оценили, у Вас одни из лучших видео по насыщенности и доступности, что я видел на ютубе. Огромная благодарность вам за это.
Метод df.corr() работает только с числовыми данными, поэтому он не может вычислить корреляцию для строковых столбцов.Исключаем нечисловые столбцы из вычисления корреляционной матрицы. df_numeric = df.select_dtypes(include='number') df_numeric.corr()
Скоро зима, скоро зима, пароноя. Этот мчк просто находка тем кто смотрит за горизонт, для меня пока на лету, надо готовиться к зиме. У нас 10 месяцев зимы, остальное все лето.
Мне понравилось лаконичность, и подача. Все понятно. Можно использовать как справочник. Я сейчас прохожу курс по DC, так там на все это ушло три недели. Хотя там практики тоже много. Но видео мне будет в помощь, не раз еще пересмотрю. Автору Респект!
Очень годный видос для новичков, единственное есть замечание по df.shape и df.columns. Это не функции а параметры объекта, и потом в случае классов и объектов правильнее говорить не функции а методы, хотя суть конечно одна и та же. В любом случае пожелаю вам удачи в развитии канала, с меня лайк и подписка
Благодарю! Я полный новичок в Pandas, перепечатывал код, всё получилось, разобрался, понял. Отличное идеальное изложение! 👍💯🔥 (подписка на канал +1, лайк по умолчанию)
В колабе просто corr не захотела работать с датафреймом из за ошибки: ValueError: could not convert string to float: 'Braund, Mr. Owen Harris' AI Gemeni подсказала как исправить: # Select only the numeric columns before calculating the correlation. numeric_df = df.select_dtypes(include=['number']) numeric_df.corr()
Если у меня получится с кикстарта с этого видоса один из своих алгоритмов из Mathcad воплотить на пандах то моей благодарочке не будет предела. Для начала услышал csv, уже хорошо, с этого начинаются все мои алгоритмы)
Потрясающий материал! Я прохожу курс онлайн (не у вас), и там половина курса примерно - вот это получасовое видео =) Очень круто, увидел новые фишки (для себя), например обращение по loc и iloc, до этого их не очень понимал. Также понял, что plot - очень простой инструмент в обращении (поначалу по крайней мере). И очень наглядный материал, всё же Титаник - легенда =) НАчинаешь уже сам ковыряться в этом. Спасибо огромное!
@@AlexanderErshov поддерживаю человека, во многих моментах это редкий по понятности в ру-сегменте видос по пандас не только в плане объема, но и донесения информации.
ДД. помогите плз, что-то я запнулся в самом начале, не смог прочитать с Excel. пишу так df=pd.read_csv('C://Users/locadm/Desktop/sber.csv') но выходит ошибка. не могу разораться как нужно указывать путь к файлу Excel чтоб его открыть?
Извините, а эта библиотека нужна для дата инженера или другая? Просто все видео о том, что эта библиотека используется для аналитики и нигде не видел, чтобы говорили о том, что она используется для инженерии данных
Всем привет. Проблема есть, в общем данные с екселя импортирую в таблицу (oracle), при чтении (read_excel) ошибка выходит UnicodeEncodeError, конкретно ругается на казахскую букву қ. Добавлял параметр encoding='utf-8' в read_excel и with open не помогло. Как это решить, помогите пжл?
Спасибо! подскажите пожалуйста, как сделать так что бы в pandas отображались оригинальные числа которые я открыл с файла .csv добавляются лишние 0 и в некоторых столбцах не на том месте точка стоит. Вот оригинал строки: 82; 1; 40.79326147; 354064; 0.1637; 5.12; 5000000000 Вот что показывает pandas: 82 1.000000 40.793261 3.540640e+05 0.16370 1 5.120000 5.000000e+09
Хороший урок! Но вопрос, а как создать новый столбец где будет писаться например возраст от 0-18 дети, 18-35 молодёжь и тд? Просто все я смотрю либо булевые значения, либо вообще никак не говорят, хотя знать интересно)
Хотел бы спросить. Если я повторяю Ваши действия в IDLE в интерактивной сессии с открытием файла по Титанику в df, а затем записываю с помощью метода to_csv, то почему-то при открытии с помощью Excel у меня каждая строка (в т. ч. заголовки) записываются в одну клетку первого столбца вместо красивых строк и заголовков. Что может быть не так?
@Alexander Ershov, я вижу, что среди источников есть SQL. А зачем бы я использовал pandas, когда все практически те же функции я могу использовать в самом postgreSQL? Я, кстати, не в курсе, может ли pandas парсить так же, как и pg, строки jsonb. Иными словами, поясни, пожалуйста, когда pandas нужен и когда не нужен. Спасибо за видос.
Народ pandas установлен но выводит ошибку import pandas as pd ModuleNotFoundError: No module named 'pandas' у кого такая же проблемы была? питон стоит версии 3.9
Александр Вы на высоте!, может подскажете ( Ваше мнение авторитетно), с помощью какой программы создать активный дашборд? Мы работаем в сфере экологии и нам никто не может объяснить!
Все отлично. Но я бы увеличил масштаб написания кода для слабовидящих людей. То что самое важное - происходит на площади 1 кв. см. самого экрана. Если бы не звук, закрыл бы видос.
Настройте zoom экрана через специальные возможности и будет вам счастье. Сможете любой квадратный сантиметр растягивать на пол-экрана и не быть ограниченным в потреблении контента
А как в этой же задаче решить следующее: 1)Подсчитать долю выживших среди тех, у кого было несколько кают. 2)Найти выжившую девушку в возрасте от 18 до 25 (включительно) у которой был самый дешевый билет. Никак не могу допереть.
Отлично получилось рассказать об основных моментах четко и сжато. Супер. Еще было бы здорово выложить под видео ссылку на ноутбук с представленным материалом.
Отличная грамотная речь, приятно слушать
Обалденное видео, просто раскрыли глаза, всё очень понятно, спасибо за ваш труд !
И кстати видос этой либы совместно с NumPy было бы очень полезно))
Александр, прекрасная работа! Спасибо! Всё понятно и полезно!
Спасибо, отличный материал! Интересно посмотреть от вас про numpy)
Постараюсь снять)
@@AlexanderErshov а что означает такая конструкция df[df['Age'] == (5|1)]?
Нашел книги по Pandas - Б.Пасхавера, А.Груздева и Хейдта, под 1000 страниц каждая, читал, вникал и вдруг наткнулся на это 35-минутное видео с блокнотами из колаба!!! За 35 минут так охватить тему! Александр, слов нет, здорово! Спасибо!!!!!
Очень круто! Добавил в закладки
Самое лучшее, что есть про Pandas в российском RUclips. Спасибо вам!
Ваше видео первое, где я увидела работу c pandas)
Отличный материал!
хуичный
да, можно догадаться, что производство видео очень трудоемкий процесс (судя по частоте выхода последних). Но, мы оценили, у Вас одни из лучших видео по насыщенности и доступности, что я видел на ютубе.
Огромная благодарность вам за это.
Спасибо! Всё очень понятно и наглядно, очень нравится ваш способ просто объяснять!
Видео - топ! Спасибо! Для тех кто знает SQL и хочет Pandas изучить идеально подойдет.
Не человек, а глыба! Уважение автору!
Спасибо за краткую выжимку, довольно полезно для начинающих
Метод df.corr() работает только с числовыми данными, поэтому он не может вычислить корреляцию для строковых столбцов.Исключаем нечисловые столбцы из вычисления корреляционной матрицы.
df_numeric = df.select_dtypes(include='number')
df_numeric.corr()
Спасибо огромное! пересмотрела кучу видео но только вы объясняете понятным для не экспертов языком.
Спасибо большое, очень полезное видео. Многое узнал за полчаса. Привет из Баку!
Очень содержательно. Только изображение лучше разворачивать на весь экран
Спасибо) Класс, доходчиво
Спасибо за видео! очень емко, но все понятно.
Спасибо ! Хороший ролик!
Замечательное видео! Автор благодарю!
Благодарю Вас, Александр! Очень полезный, понятный курс!
Скоро зима, скоро зима, пароноя. Этот мчк просто находка тем кто смотрит за горизонт, для меня пока на лету, надо готовиться к зиме. У нас 10 месяцев зимы, остальное все лето.
Спасибо! Лучшее видео по теме библиотеки Pandas!!!!!
Отлично подан материал👍
Мне понравилось лаконичность, и подача. Все понятно. Можно использовать как справочник. Я сейчас прохожу курс по DC, так там на все это ушло три недели. Хотя там практики тоже много. Но видео мне будет в помощь, не раз еще пересмотрю. Автору Респект!
Не Яндекс Практикум ли? :)
Очень хорошая работа. Всё понятно, интересно и увлекательно. Благодарю. Присоеденюсь к просьбе сделать лекцию по numpy.
Отлично прошёлся по базе. Большое спасибо!
Отличное видео, все понятно объясняете, спасибо!!!
Оч круто. Нужно еще пару разков прослушать ❤
Реально лучшее вводное видео по пандасу! Лайк со всех моих гугловских учёток.
Хотела подписаться на ваш канал, но оказалось, что уже подписана 😅
Очень годный видос для новичков, единственное есть замечание по df.shape и df.columns. Это не функции а параметры объекта, и потом в случае классов и объектов правильнее говорить не функции а методы, хотя суть конечно одна и та же. В любом случае пожелаю вам удачи в развитии канала, с меня лайк и подписка
Бро, просто имба, выручил
Благодарю! Я полный новичок в Pandas, перепечатывал код, всё получилось, разобрался, понял. Отличное идеальное изложение! 👍💯🔥
(подписка на канал +1, лайк по умолчанию)
подписка на канал +1, лайк по умолчанию
Очень классно видео, все просто, наглядно и без воды!
Спасибо! Очень эффективное повествование!
В колабе просто corr не захотела работать с датафреймом из за ошибки:
ValueError: could not convert string to float: 'Braund, Mr. Owen Harris'
AI Gemeni подсказала как исправить:
# Select only the numeric columns before calculating the correlation.
numeric_df = df.select_dtypes(include=['number'])
numeric_df.corr()
На 5:50 разве shape и columns это функции?) Это же атрибуты класса)
да, ты прав, неправильно выразился
Спасибо, очень доходчиво объяснено
А как выводить информацию как у Вас (красивая табличка)? у меня какая-то неструктурированная ерунда на выходе
Отличное видео, очень полезно на первых порах. Спасибо!
Классное видео, спасибо больше. Очень помогло.
Спасибо, отличный урок!
Спасибо за инфу и код
все просто и понятно, спасибо
Александр, программа обучения уже не работает? Спасибо за видео
Cпасибо!
А как можно изменить ряд колонн на дф или удалить их?
Если у меня получится с кикстарта с этого видоса один из своих алгоритмов из Mathcad воплотить на пандах то моей благодарочке не будет предела. Для начала услышал csv, уже хорошо, с этого начинаются все мои алгоритмы)
спасибо!
Подскажите почему в pysharm гистограмма не отображается в виде картинки¿? Только данные AxesSubplot() может в ps нет такой опции?
Александр, как вы скопировали путь к файлу csv в аргумент в начале видео?
Потрясающий материал! Я прохожу курс онлайн (не у вас), и там половина курса примерно - вот это получасовое видео =) Очень круто, увидел новые фишки (для себя), например обращение по loc и iloc, до этого их не очень понимал. Также понял, что plot - очень простой инструмент в обращении (поначалу по крайней мере). И очень наглядный материал, всё же Титаник - легенда =) НАчинаешь уже сам ковыряться в этом. Спасибо огромное!
Спасибо, у меня если что не онлайн курс, а именно индивидуальная программа с менторской поддержкой
@@AlexanderErshov , сорри, неточность.
@@AlexanderErshov поддерживаю человека, во многих моментах это редкий по понятности в ру-сегменте видос по пандас не только в плане объема, но и донесения информации.
А что за онлайн курс?
@@alexanderkoretskiy5260 Udemy, Data Science
ДД. помогите плз, что-то я запнулся в самом начале, не смог прочитать с Excel.
пишу так
df=pd.read_csv('C://Users/locadm/Desktop/sber.csv')
но выходит ошибка. не могу разораться как нужно указывать путь к файлу Excel чтоб его открыть?
надо слэши поменять на обратные слэши
Спасибо!!
Извините, а эта библиотека нужна для дата инженера или другая?
Просто все видео о том, что эта библиотека используется для аналитики и нигде не видел, чтобы говорили о том, что она используется для инженерии данных
Всем привет.
Проблема есть, в общем данные с екселя импортирую в таблицу (oracle), при чтении (read_excel) ошибка выходит UnicodeEncodeError, конкретно ругается на казахскую букву қ.
Добавлял параметр encoding='utf-8' в read_excel и with open не помогло. Как это решить, помогите пжл?
👍👍👍 + подписался!
А если в столбце есть имя и фамилия, как можно сделать выборку только по имени? Имя идёт первым
если я знаю всё то что Вы рассказали в этом ролике - мой уровень Пандас можно определить как 1 из 10 или на этом этапе 0? :)
Спасибо! подскажите пожалуйста, как сделать так что бы в pandas отображались оригинальные числа которые я открыл с файла .csv
добавляются лишние 0 и в некоторых столбцах не на том месте точка стоит.
Вот оригинал строки: 82; 1; 40.79326147; 354064; 0.1637; 5.12; 5000000000
Вот что показывает pandas: 82 1.000000 40.793261 3.540640e+05 0.16370 1 5.120000 5.000000e+09
а как он так jupyter настроил, мб вкурсе кто как включить меню слева, а курс реально лучший просто слов нету, как все понятно.
А что за браузер такой? Как-то прикольно выглядит юпитер
Хороший урок! Но вопрос, а как создать новый столбец где будет писаться например возраст от 0-18 дети, 18-35 молодёжь и тд? Просто все я смотрю либо булевые значения, либо вообще никак не говорят, хотя знать интересно)
Хотел бы спросить. Если я повторяю Ваши действия в IDLE в интерактивной сессии с открытием файла по Титанику в df, а затем записываю с помощью метода to_csv, то почему-то при открытии с помощью Excel у меня каждая строка (в т. ч. заголовки) записываются в одну клетку первого столбца вместо красивых строк и заголовков. Что может быть не так?
csv файл в exel открывайте через "Данные - получить данные - из текстового файла/csv файла". это нужно сделать в новой таблице
Спасибо, попробую
вы супер
@Alexander Ershov, я вижу, что среди источников есть SQL. А зачем бы я использовал pandas, когда все практически те же функции я могу использовать в самом postgreSQL? Я, кстати, не в курсе, может ли pandas парсить так же, как и pg, строки jsonb. Иными словами, поясни, пожалуйста, когда pandas нужен и когда не нужен. Спасибо за видос.
Pandas позволяет делать в том числе и визуализацию, ну а так - да многое можно сделать и в sql
Круто! Спасибо за видео!
А что это за среда разработки? Кажется удобной.
вряд ли вопрос ещё актуален, но отвечу для тех, кого заинтересует в комментариях
среда разработки называется Jupyter Notebook
пилите ышшо, в рунете слишком мало подобного!
Зачем нужен pandas если есть. Excel?
зачем нужен excel если есть pandas ?)
@@AlexanderErshov не знаю, вот хотел узнать
3:20, необязательно, можно не дописывать .from_dict
Большое спасибо!
Реально, то что надо
Народ pandas установлен но выводит ошибку import pandas as pd
ModuleNotFoundError: No module named 'pandas'
у кого такая же проблемы была? питон стоит версии 3.9
Возможно не на тот Python установлен модуль.
pip freeze покажет вам все установленные модули
Попробуйте pip3 install pandas
👍👍👍
Полезное видео, спасибо
Пожалуйста, прочитайте, что такое функция, чтобы каждую язву функцией не обзывать.
круто
Александр Вы на высоте!, может подскажете ( Ваше мнение авторитетно), с помощью какой программы создать активный дашборд? Мы работаем в сфере экологии и нам никто не может объяснить!
Можете посмотреть это www.tableau.com/learn/get-started/dashboards
Можно узнать, а почему не power bi?
пользователи Титаника одобряют
То что надо!Лайк) p.s. первый)
Все отлично. Но я бы увеличил масштаб написания кода для слабовидящих людей. То что самое важное - происходит на площади 1 кв. см. самого экрана. Если бы не звук, закрыл бы видос.
Настройте zoom экрана через специальные возможности и будет вам счастье. Сможете любой квадратный сантиметр растягивать на пол-экрана и не быть ограниченным в потреблении контента
А как в этой же задаче решить следующее:
1)Подсчитать долю выживших среди тех, у кого было несколько кают.
2)Найти выжившую девушку в возрасте от 18 до 25 (включительно) у которой был самый дешевый билет.
Никак не могу допереть.
Забыл, что она должна выжить. Правильно будет так:
df[(df['Survived']==1) & (df['Sex']=='female') & ((df['Age']>=18) & (df['Age']
зачем дергается картинка то ? чтобы раздражать ? не буду смотреть сразу
как скачивать ноутбук с github? если сохранить по ссылке, то при открытии в JN выдает ошибку.
Клонировать себе весь проект
@@AlexanderErshov как это сделать? подскажи пожалуйста, обычный csv даже скачать не получается, точнее открыть потом у себя на компе
@@rz799 git clone github.com/ershovio/youtube_tutorials.git
спасибо за обзор
very good nice
Шикарно
Крутой контент ващпе 😃😃😃👍👍👍👍👍👍👍👍👍👍👍👍👍👍
Тысяча лайков
хммм. .notna() удобно. Решал иначе данную фильтрацию.
Лайфхак: на скорости 1,5 тоже всё понятно :)
В избранное.
Невозможно слушать… местечковые объяснения, «каннект»… пока-пока
Код не работает. Пишет Error tokenizing data... Expected 1 fields ..... и.т.д
Почему df.groupby('Sex')['Age'].plot(kind='kde') и sns.displot(data=df, x='Age', kind='kde', hue='Sex') выдают разные графики?
Потому что при отрисовке у них разные стандартные параметры пропускной способности (Погуглите как присваивать вручную и поиграйте со значениями.
"будем мёгджить ", не проше говрить "объеденять"