ПАРСЕР новостей с VCRU на PYTHON | Requests | Bs4
HTML-код
- Опубликовано: 21 дек 2023
- В этом видео мы создадим парсер для новостей с сайта vc.ru. Использовать для этого мы будем язык программирования пайтон и баблиотеки requests для того, чтобы отправлять запросы на сайт и BeautifulSoup из bs4, чтобы обрабатывать html код.
👨💻 Подписывайся на наш телеграм канал! 👨💻
🖇 t.me/pythonhub001 🖇
👨💻 И вступай в чат 👨💻
🖇 t.me/pythonhub_chat 🖇
😳 Полезные ссылки 😳
Requests:
pypi.org/project/requests/
Bs4:
pypi.org/project/beautifulsoup4/
#python #parsing #парсинг #пайтон #beautifulsoup #requests
👨💻 Подписывайся на наш телеграм канал! 👨💻
🖇 t.me/pythonhub001 🖇
👨💻 И вступай в чат 👨💻
🖇 t.me/pythonhub_chat 🖇
5:34 в bsке есть уже давно топ метод select и select_one, можно писать css селектор, что гораздо быстрее, и легче понять. Советую
не знал. надеюсь, что почитаю. спасибо
По результатам видно, что парится не ссылка на статью, а первая попавшаяся в тексте ссылка. Чтобы спарсить нужный тег, лучше в каждом элементе массива articles найти ссылку с уникальным классом "content-link" и вывести её.
воу, возможно я и вправду не заметил. спасибо за замечание!
Привет, хорошая подача, было бы не плохо если бы ты показал как данный парсер с ботом соединить а бот публиковал на канал телеграм плюс бота закинуть на сервер и всё это чудо работало в автоматическом режиме
привет, спасибо. возможно сделаю что-то подобное в дальнейшем
5:42 почему бы не обратиться к "article" .find и так же див с классом 'content-title'???
хм
Когда парсишь, чтобы тебя не забанили, 1 раз запрос делаешь, сохраняешь его в html файл на пк, работаешь, затем просто убираешь это, от кучи проблем избавит так же, проверено!
идея норм, но для такого мини проекта нет смысла.да и запросов тут не много
6:37 степень вложения, ты явно хочешь моей см3рт1
ты слишком ответственно подходишь. это же творчество
супер
спасибо!
Подскажи что за тема в пичарме у тебя установлена?
обычный pycharm с обновленным интерфейсом просто
@@shcoder001 пасиб
мой коммент опять ушёл в спам, чекни
та нет