Обучение парсингу на Python #1 | Парсинг сайтов | Разбираем методы библиотеки Beautifulsoup
HTML-код
- Опубликовано: 28 апр 2024
- Обучение (Web-Scraping) веб парсингу на Python. В данном видео разбираем методы одной из основных библиотек для парсинга веб сайтов на Python Beautifulsoup4.
🔥 Доступ в приват | Поддержать проект:
boosty.to/pythontoday
/ pythontoday
yoomoney.ru/to/410019570956160
🔥 Стать спонсором канала:
/ @pythontoday
Таймкоды:
00:00 - О библиотеке Beautifulsoup
01:18 - Установка Beautifulsoup
01:58 - Установка lxml
02:55 - Работа с основными методами .find() и .find_all()
09:37 - Методы .find_parent() и .find_parents()
11:25 - Методы .next_element .previous_element .find_next()
12:38 - Методы .find_next_sibling() и .find_previous_sibling()
13:30 - Комбинирование методов
14:25 - Как забрать атрибуты из тегов
15:44 - Поиск по тексту
16:20 - Пример использования регулярных выражений при парсинге
****Ссылки****
Дешевый/надежный сервер в Европе + СКИДКА 10%:
vdsina.ru/?partner=858b36ud3p
Хороший proxy сервис:
proxy6.net/a/149995
Документация Beautifulsoup:
EN: www.crummy.com/software/Beaut...
RU: www.crummy.com/software/Beaut...
Код проекта на github:
github.com/pythontoday/scrap_...
И в telegram канале:
t.me/python2day
****Соц.сети****
Telegram: t.me/python2day
Вот только заинтересовался парсингом и хорошо что тебя нашёл. Максимально приятно все объясняешь
Сапасибо за фидбэк 👍
Как идут успехи, в сфере парсинга? Многое что уже умеете?)
@@1ntrigo364 не отвечает, забросил ведать всё это дело...
@@PythonToday и информация по парсингу представлена элегантно, за это спасибо
ну как там твой парсинг?
Вот так нужно объяснять! Без воды быстро и сразу на живых примерах. Спасибо.
Всем у кого открывается набор символов, вместо русского языка!
Нужно перекодировать файл в кодировку UTF-8 добавив в первую строчку команду encoding="utf-8".
Вот таким образом: with open('blank/index.html', encoding="utf-8") as file:
Много часов ты наверное многим сэкономишь, но к сожалению я увидел этот комментарий уже после того, как нашел решение
@@ferterhard тоже помучился просто)
блин :) как решил эту проблему потом увидел комент, оказывается можно было в html коде просто изменить на и перезагрузить pycarm
Согласен с предыдущими. Сначала нашел решение, а потом уже прочитал коммент. Спасибо, многие бы мучились
@@user-nv7cq8xt2k ну в рабочих проектах так не выйдет, когда паришь сторонний сайт поэтому лучше в коде питона указывать)
Спасибо большое за вашу работу, жду следующий урок
Отличный урок, пересмотрел уже несколько на данную тематику. Тут есть логика и системное изложение материала, что позволяет понять технологию, а не просто наблюдать за тем, как кто-то пишет код, который при повторении почему-то часто не работает.
Благодарю за фидбэк 💪
Здраствуйте, я как абсолютный новичок в этой сфере говорю вам что за один ваш урок узнал очень много нового для себя, очень доступно и понятно объясняете, спасибо за ваш контент!)
Один из самых понятных уроков по парсингу на BS.
Спасибо!
Спасибо за фидбэк!
Классно, спасибо огромное за уроки! Буду с огромным желанием смотреть до конца и обучаться!
Превосходная подача материала. Спасибо
Благодарю за фидбэк 💪
сколько не искал - НИЧЕГО лучше твоего виде не нашел!!! ОГРОМНОЕ СПАСИБО!
После ваших видео мне стало интересно разбираться в кодирование,а именно в парсинге , невероятно. Спасибо ❤
На мой взгляд, этот видос - лучший по соотношению полезность/понятность/длительность
Для 3х к подписчиков уж слишком годно! Спасибо за уроки !
есть такое
На сегодня >5.5 k. Годная динамика.
@@shamanskiy Уже почти 11к
@@user-hc1ne6td1z 42.7к
@@dmitryvladimirov611 112к уже)
Редко оставляю комменты, но тут грех пройти мимо...
Спасибо тебе, автор, за качество работы! Я, как раз начинаю изучать, тему программирования, а твои работы как раз в тему.
Подписка, лайк е едем дальше) 😎👍
Благодарю за фидбэк!
как процесс изучения год спустя?)
Это лучший урок! По существу, без воды. Респектище!
Спасибо за поддержку!
Предлагаю сделать ещё одно видео по этой теме)
А так всё очень доходчиво обьяснил
Благодарю. Видео будет много 👍
Приятный голос, слушать одно удовольствие. Доходчиво и понятно. Спасибо за труд
Спасибо за фидбэк и интерес!
Разобрано на простом примере. Все очень понятно. Большое спасибо! То что надо.
спасибо за урок! офигенная подача материала.
Очень понятно и доступно и исходники есть-спасибо человеку за проделанную работу!
Спасибо за фидбэк! Рад что полезно
Очень круто! И понятно изложено. На лекция 2 часа объясняют непонятно о чём... А тут всё ясно и наглядно.
Спасибо, твой канал очень классный! Всё кратко, понятно и по делу.
Огромное спасибо!
Идеальные уроки по парсингу! Автор, ты лучший!
Большое спасибо за поддержку!
Очень крутое видео. Огромное спасибо за Ваш труд!
Объём информативности зашкаливае
Спасибо за труд!
Спасибо за фидбэк!
ИНтересно и познавательно! Побольше таких видео!
Какой Вы молодец! Здоровья Вам и процветания!
Большое спасибо! Взаимно!
Чувак,ты лучший!!!я начинающий питонист, на данный момент лучше тебя еще не встречал!!!Спасибо за урок,очень понятно и доходчиво обьясняешь.🍺🍺🍺
Ты братишка не питонист а аутист
Очень круто наблюдать за магией! Потрясающе!
Большое спасибо за фидбэк и поддержку!
Просто лучший, всё понятно и чётко объясняешь !
Благодарю!
Это очень хороший курс. Спасибо огромное. С первого урка всё понятно. Ссылки на документацию пригодились. Всем рекомендую прочесть для большего понимания действий автора видео. Ещё раз спасибо.
Большое спасибо за фидбэк!
прошло два часа, но наконец это все понял и законспектировал , спасибо большое что оставили страницу для тренировки на github, очень хороший ролик и объяснение :] //а еще приятно видеть ubuntu , очень мне нравится она ( у самого стоит)
Капец, как круто! Вот сейчас я реально распечатался по Пайтону. А то сидел простые задачки решал по два плюс два складывать.
Никогда не любил решать задачи. Спасибо за фидбэк
@@PythonToday А это вы про те задачи как: нарисуйте из звездочек чайник с помощью цикла for)))
Все четко и по делу, отличная подача информации и микрофон
Ты - супер! Первый канал, на котором все легко укладывается :) Даже появилось ощущение, а вдруг я смогу когда-нибудь кодить)
Спасибо за фидбэк! Конечно сможешь, вливайся 👍
Просто великолепное видео, столько удовольствия! Спасибо большое!!!
Спасибо за поддержку! Рад что полезно.
Ты лучший старина, спасибо за материал!
классно. Спс. Начал изучать Парс по твоим роликам.
Вернулся с видео "Обучение парсингу на python #4", чтобы еще раз все осознанно посмотреть и достать текст из тега span без класса. АВТОР МОЛОДЧИНА! СПАСИБО!
Большое спасибо за интерес!
Если вывалится ошибка при чтении html то, пропишите кодировку:
with open(r"blank/index.html", encoding='utf-8') as file:
src = file.read()
print(src)
Спасибо! У меня неверно выводился русский текст, что содержится в тегах. Установка кодировки таким образом помогла!
Спасибо, подскажите из-за чего была ошибка ?
Спасибо. Час времени потерял.
@@user-ze1fb8jw8q на кирилице бывает принудительно нужно указывать кодировку
Спасибо!
Прекрасно, замечательно продуманный план урока.
Благодарю!
Видос ОГОНЬ!
У меня возникла проблема с кодировкой (отображение русского), для решения использовал with open('blank/index.html', encoding='utf-8') as file:
Это мне помогло, спасибо!
а я просто залезла в настройки pyCharm и там выбрала в разделе file encodings - Windows 1251
благодарю
спасибо, от души
И мне помогло, спасибо!
Приятный голос, хорошее качество звука, понятное объяснение спасибо
Благодарю за фидбэк!
Таймкоды для вас:
00:00 - О библиотеке Beautifulsoup
01:18 - Установка Beautifulsoup
01:58 - Установка lxml
02:55 - Работа с основными методами .find() и .find_all()
09:37 - Методы .find_parent() и .find_parents()
11:25 - Методы .next_element .previous_element .find_next()
12:38 - Методы .find_next_sibling() и .find_previous_sibling()
13:30 - Комбинирование методов
14:25 - Как забрать атрибуты из тегов
15:44 - Поиск по тексту
16:20 - Пример использования регулярных выражений при парсинге
Огромное спасибоза видео! Очень рад что наткнулся на ваше видео, на всякий случай сохранил в плейлист)
Рад что полезно! Спасибо за фидбэк!
Отличный урок) и хорошее объянения) спасибо!
Благодарю за фидбэк! Рад что полезно)
Очень крутой видос! Библиотека сама очень очень вкусная! Спасибо за гайд!
Спасибо за фидбэк!
отличный урок! спасибо за гайд!👍🤘
Спасибо за фидбэк 💪
Спасибо, очень понятно, прекрасно рассказали.
Огромное СПАСИБО за видео и за коды на ГитХабе
Огромное спасибо. Очень доходчиво, хороший стиль изложения урока
Благодарю 💪
@@PythonToday Было бы здорово раширить урок по пагинации. В принципе это вообще отдельный урок, так как тема, мне кажется сложная, учитывая разнообразие сайтов. Буду очень благодарен если сделаете видео на эту тему. Пример пагинации на разных сайтах и всякие хитрости.
Очень качественное видео. Всё подробно рассказано. Всё понятно.👍
Спасибо!
Как всегда супер!)
Большое спасибо за видео! Очень качественные видеоролики.
Большое спасибо за поддержку!
подача материала отличная.все понятно.спасибо
Благодарю!
Спасибо за видос!
ахренеть какой крутой канал, с первого видео я понял, что это супер качественный контент, а не вода! доходчиво быстро!
Благодарю за фидбэк, рад что полезно
Хорошая подача! Спасибо!
Кайф! с удовольствием посмотрел и попрактиковался. ❤
Офигеть, с первых минут нашел, что искал - работа с полученными тегами через список. Лайк и подписка с меня
Огромное спасибо, очень грамотно и понятно изложен материал
Спасибо за фидбэк!
самый полезный гайд из всех, что на ютубе
Очень крутая и полезная информация, Вы молодец)
Спасибо, рад стараться 👍
Четко, внятно и понятно. Благодарю!
Благодарю за фидбэк!
Видео огонь. Все оочень доступно и интересно🔥🔥🔥
Благодарю!
Шикарно!)))Большое СПАСИБО!!!
Благодарю за фидбэк!
Видео очень простое и легкое для понимания, спасибо!
Благодарю за фидбэк!
Как же это информативно!
Реально годное видео, без лишней информации.
Благодарю
спасибо большое за познавательный ролик!
Ооо, вот это было очень здорово! Спасибо!
Спасибо за фидбэк!
Автору респект за ненавязчивый и понятный стиль изложения!
Большое спасибо!
Огромное спасибо за урок, очень полезное видео!
Благодарю за фидбэк, рад что полезно!
Быстро, коротко, существенно, понятно, безумно интересно, при просмотре получаешь кайф) респект желаю продвижение твоему каналу. Большая просьба если будет возможность про nginx и докеры был бы благодарен.... понимаю что уклон от парсинга) хотя я тоже решил углубился в парсинг)
Спасибо за фидбэк! Залил бы разом 200 роликов, но к сожалению не хватает на всё времени)
Классно объясняешь! Я рад что подписался !
Благодарю 👍
Долго не мог разобраться в порядке перемещения по дом дереву а сейчас как осенило. Крутой урок буду смотреть весь плейлист.
Благодарю за фидбэк и поддержку! Рад что полезно)
Наредкость отличный канал. Отличная подача материала, просто замечателная. Лайк, подписка, колокольчик!
Благодарю!
🔥🔥🔥🔥🔥 ты молодец, обучение просто бомба, все предельно просто и ясно🔥🔥🔥🔥🔥
Благодарю!
Наглядно, спасибо!
Очень круто все и подробно, вообще классно❤️
Большое спасибо за фидбэк!
огромное спасибо! прям по полочкам разложено)
Благодарю за фидбэк!
Спасибо большое, максимально ясно и кратко
Благодарю
Это шикарно! Благодарю!!!!
Спасибо за фидбэк и поддержку!
Спасибо, очень крутые видео!
Благодарю 💪
Очень круто, спасибо!
Благодарю за фидбэк 👍
Спасибо Учитель :) как говорится без воды!
Сам учусь)) Спасибо за фидбэк! Надеюсь было полезно
@@PythonToday ✊✊✊ еще раз спасибо,и за такой открытый урок, и за такие теплые коменты.
классное видео, повторил всё, что ты сделал, спасибо
Спасибо за фидбэк и поддержку!
Все максимально понятно. Спасибо!
Спасибо за фидбэк и поддержку!
Изначально начал изучать селениум, но почитал про данную библиотеку и решил перейти на нее. Уроки просто топ! Продолжайте в том же духе!
Спасибо за поддержку!
а суп позволяет логинится?
@@RandallSFlagg через post запросы
Спасибо большое для новичка самое то. Пересмотрел пару раз. И теперь буду двигаться дальше.
Молодцом! Рад что полезно. Спасибо за фидбэк!
Спасибо, интересно смотреть и слушать! Ролик вылез случайно, а подписку оформляю специально.
Большое спасибо за поддержку!
Очень хороший урок, сжато и информативно.
Благодарю за фидбэк и поддержку!
Красава, чувак! Круто объясняешь
Благодарю 💪
Просто божественно! Мне как новичку сложно быстро воспринимать всю информацию, но я не считаю, что скорость подачи слишком большая, пойду крутить повторные просмотры, чтоб закрепить инфу
Благодарю! Рад что полезно
сначала нужно изучить html, и ознакомится с dom, тогда даже с самого нуля будет легко воспринимать
спасибо! Самое толковое видео на эту тему!
Благодарю за фидбэк 💪
Спасибо большое, отличное видео)
Благодарю за фидбэк!
Годно! спасибо за работу!
Благодарю
Спасибо ! Доступно для понимания.
Благодарю за фидбэк!
единственный человек который нормально всё обьянснил
Спасибо! Очень круто
Благодарю 👍