Parsing sites PYTHON - # 1 REQUESTS REQUESTS (GET / POST)

ZProger [ IT ]

Просмотров 117 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 26 сен 2024
Parsing sites PYTHON - # 1 REQUESTS REQUESTS (GET / POST)
📗 All links to useful materials are below 📗
We will analyze the parsing of python sites, examine the modules
requests, bs4 (BeautifulSoup), fake-useragent, multiprocessing.
Let's write a lot of parsers in python, learn how to find the elements we need
on the page, we will analyze the structure of requests requests, learn how to transfer
your headers and your data to the site.
During the course, we will write a program to download files
from the site, we will learn how to transfer proxies and user agents to the request.
Let's take a look at how to parse the site using the ones we have already studied.
tools. Towards the end of the course, we will also explore multiprocessing for accelerated parsing. In the course of this video, we will go over the basics of python GET / POST requests and learn how you can use it to get data from the site.
⭐ Free version of Kite: bit.ly/3cKz97C
⭐ PyQt5 Python Course: pyqt5.ru
⭐ Channel with useful material: t.me/codeblog8
📁 Website scraping course: bit.ly/394VKtG
📁 Selenium Python Course: bit.ly/3p669ef
📁 Contact me: zproger777@gmail.com
📁 Support channel: www.donational...
Libraries used:
requests, bs4
lxml, fake-useragent
multiprocessing
#ParsingSites #ParsingSitesPython #ParsingPython

Комментарии • 83

@zproger 3 года назад ⁺⁶
⭐Курс ООП и Приват канал: zproger-school.com/
⭐Телеграм канал: t.me/+ltjhP8CCll80NTAx
Не забывайте оставлять свои идеи для следующих видео в комментариях,
большинство из них реализовывается на канале. Также подписывайтесь
на канал, так как именно у нас публикуется отборный материал, который позволит
вам изучать программирование и другие технологии в разы быстрее.
@dmitrys5289 2 года назад ⁺¹²
Столько всяких тонкостей так подробно и без воды, спасибо!
@zproger 2 года назад
Рад что понравилось :)
@dimapetrov9627 4 года назад ⁺¹⁵
Спасибо за видео, всё понятно и без воды)
@zproger 4 года назад ⁺¹
Рад что вам понравилось
@Тагир_Нигматуллин 3 года назад ⁺²⁵
Отличный курс, подача информации на запредельном уровне!
@zproger 3 года назад
Спасибо!
@ANABOLIC_007 Год назад ⁺²
Ооо, как же по кайфу было записать первый спарсенный html код в html файлик, после кучи написания базового теоретического кода из курса pythontutor. Я не думал, что будет так легко. Благодара!
@Михаил-е6р9э 5 месяцев назад
хах у меня также)
@______373 2 года назад ⁺⁴
mission accomplished
respect+
like+
subscribe+
правильное решение использовать линукс для python (не каждый линукс будет походить). Python на минте гораздо лучше работает чем на винде. Кстати да и само видео вроде неплохо. Кстати быстро тему начал, в многих видео (даже популярных) три часа говорят и две строчки кода объяснили.
@zproger 2 года назад
Крутой коммент, спасибо :)
По-поводу линукс согласен, очень удобно работать
@acidandrey 2 года назад ⁺¹
Просто супер. Спасибо большое. Достаточно наглядно все разжевано!!!
@zproger 2 года назад
Спасибо за поддержку :)
@евгенартемьев-н8у 2 года назад ⁺¹
Большое спасибо. Хоть вы обьеснили понятным языком
@zproger 2 года назад
Рад что помогло
@aleksey2408 3 года назад ⁺²
Спасибо за полезную информацию !!!
@zproger 3 года назад
Рад помочь :)
@ktoya2131 4 года назад ⁺⁵
Я очень скупой на лайки, но это видео заслуживает 100000000000 лайков я считаю
@zproger 4 года назад
Спасибо за поддержку, буду стараться :)
@stanislavbuzovskij8435 3 года назад ⁺²
блин, крутой парень =) СПАСИБО!!!!
@zproger 3 года назад
Благодарю :)
@mykolavarvarchuk937 3 года назад ⁺¹
Спасибо за отлично поданную инфу!
@zproger 3 года назад
Пожалуйста :)
@identitynotestablished9133 3 месяца назад
чел, это прям круто
@IrishaChervyak 3 года назад ⁺²
Может я чего-то не понимаю, но при выгрузке в HTML-файл ответа с сайта там НЕ тоже самое, что в ответе в браузере. Ведь ответом в браузере по тому же полю User-agent является сам браузер, но python-запросом и выгрузкой в файл мы получаем, что User-agent является python-request
К тому же цель - распарсить страницу этого сайта, как оно там есть, но мы не получаем ни версии браузера, ни плагинов и прочей информации на момент обращения к GET-запросу данного сайта - это же не парсинг)
Тут либо пример плохой, либо я даже не знаю. Поправьте, пожалуйста, если где-то ошибаюсь
@zproger 3 года назад ⁺¹
Цель была показать принцип работы запросов, а не собрать данные, так как это мы делаем в следующих видео.
@IrishaChervyak 3 года назад
@@zproger Поняла Вас, видимо немного поторопилась с итогами)
@Naberegn 6 месяцев назад ⁺¹
А где про POST запрос???
@Joy_Mama 4 месяца назад
Подскажите как вы vs code на минте завели?
@kerimtim 2 года назад ⁺¹
Почему-то или мне кажется что для работы с библиотекой request все пользуюся Linux-ом?
@zproger 2 года назад
Можно пользоваться где угодно =)
@александерломоносов Год назад
круто и меня мучает вопрос как музята на фоне называется?))))))))
@fahrenheit1863 Год назад
Мой первый файл получился с абраказябрами вместо кириллицы. Я так и не понял почему у меня все записалось в utf-16, попробовал второй раз и все уже в utf-8.
@izgnanikull 3 года назад ⁺¹
Помогите, пожалуйста. Делаю всё как указано, но в итоге получаю AttributeError: partially initialized module 'requests' has no attribute 'get' (most likely due to a circular import)
@zproger 3 года назад
Не могу помочь, так как не вижу код
@Himito31 2 года назад
возможно у тебя файл имеет название как библиотека.
@TERROr4ek Год назад
Помогите, при парсе сайта выдаёт непонятные символы типо иврита хотя кодинг стоит utf-8 и сайт русский
@plit_kam9322 2 года назад
Отличный контен, подскажите пожалуйста что за тема у вашего редактора. Мне понравился зелёный цвет у методов.
@zproger 2 года назад
Благодарю, это Dracula
@gameworld9522 8 месяцев назад
@@zproger Darcula*)
@mem_v_kruzhochke Год назад
Я вот не понимаю, есть встроенный терминал в ВС код, зачем использовать сторонний и где его вообще брать? Я искал курс с нуля, чтобы узнать эти основы. Ответьте, знающие люди, пожалуйста
@sergiybustrov8831 11 месяцев назад
Так удобнее, лично я также использую. Дело привычки.
@sfsrussia1431 Месяц назад
не могу найти свой запрос во вкладке сеть
@chooze2999 4 года назад ⁺²
так-с. когда 2 часть выйдет?)
@zproger 4 года назад ⁺¹
Всего их будет 6 штук, вторая часть 15 августа, далее 19, и так каждые 4 дня :)
@chooze2999 4 года назад
@@zproger понял. Буду ждать с нетерпением.
@obsi1019 Год назад
а что делать если нажимаешь иследовать елемент а там все на англ и подругому как у тебя?
@sigmalame_4207 2 года назад ⁺¹
что делать когда на гет запрос в терменале пишет: 429 Too Many Requests
@zproger 2 года назад
Too Many Requests - Переводится как "слишком много запросов".
В итоге нужно думать, как сайт идентифицирует, что все запросы идут
от одного клиента, это могут быть: заголовки, IP адрес, фингерпринты
@carrion5236 11 месяцев назад
а если хочу получить json ?
а не байт или html
@Sliwcom 2 года назад ⁺²
ку, а что за операционка?
@zproger 2 года назад ⁺¹
Linux Mint
@Sliwcom 2 года назад
Спс
@rexonayt0 2 года назад
Я единственный который благодаря информации выкачиваю html страницы?😂
@AnnaSheshvak Год назад
как сделать такой же красивый ВС код как у тебя ?
@Hanovski14 Год назад
status_code не работает или не существует
что делать ?
@Do_The_Flop Год назад
Случайно не помнишь, находил ли решение этой ошибки? Полгода прошло всё-таки
@maniacpy 9 месяцев назад
Ошибка в вашем коде связана с тем, что вы пытаетесь получить статус код и текстовое содержимое ответа неправильным способом. Метод requests.get не возвращает status_code и text непосредственно из объекта ответа.
@CatLida 3 года назад ⁺¹
Ммм, Linux. Люблю его, какой дистр у тебя?
@zproger 3 года назад
Linux Mint :)
@irwe3514 2 года назад ⁺¹
Что такое парсинг?
@zproger 2 года назад
сбор данных
@NONAME-ko5zn 3 года назад
Как сделать чтобы сервер принимал наши изменённые запросы?? Например взломать какую то игру на функцию привилегии
@zproger 3 года назад ⁺¹
Взломать игру таким способом достаточно трудно, так как помимо значений которые передаются на сервер, ещё и генерируются временные токены которые этому значению соответствуют, если они не будут иметь между собой связь, сервер просто проигнорирует запрос. Кроме того запрос ещё проходит дополнительную фильтрацию, не скажу что это сделать невозможно, но необходимо очень хорошо понимать то, как устроена фильтрация текущего сервера и проверка значений на валидность.
@NONAME-ko5zn 3 года назад
@@zproger можешь об этом снимать видео?
@zproger 3 года назад
Не могу, это слишком сложная тема
@NONAME-ko5zn 3 года назад
@@zproger значит не знаешь
@KadenDev 2 года назад
@@NONAME-ko5zn не знает, и что. Он хакер по твоему? Да и тебе не обязан
@Dirncol Год назад ⁺¹
Чувак ты что хакр?
@zproger Год назад
да, только никому не говори 😆
@justasemza6945 8 месяцев назад ⁺³
Не добавляй музыку в видео с объяснением плиззззззз,очень отвлекает!😢
@yuritchyuri5342 Год назад
А поч такое изображение ужасное,ничего не разобрать!!
@deniskuznetcov3193 2 года назад ⁺¹
@ZProger [ IT ] вписал код, в Пайчарме пишет : Process finished with exit code 0
прогоняю через СВкод пишет: ModuleNotFoundError: No module named 'requests'
@zproger 2 года назад
Нужно установить модуль requests
@CryptoMathematica 2 года назад
line 248, in __init__
raise FeatureNotFound(
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?
При установке xmlx выдает: Defaulting to user installation because normal site-packages is not writeable
Requirement already satisfied: lxml in c:
@3nay3 Месяц назад
А на какой проге писать код? Типа просто питон или пайчарм?
@zproger Месяц назад
Где угодно, главное чтобы удобно было :)
@b_b.podcast 3 года назад
Отличный курс, подача информации на запредельном уровне!
@zproger 3 года назад ⁺¹
Огромное спасибо за поддержку
@Konstantin_Fit_Train 9 месяцев назад
Очень интересно, но не понятно)
Всё что Вы делаете у меня НЕ получается)

Следующие

Автовоспроизведение

Parsing sites PYTHON - # 2 BEAUTIFUL SOUP, FAKE-USERAGENT