ПАРСЕР новостей с VCRU на PYTHON | Requests | Bs4

Поделиться
HTML-код
  • Опубликовано: 21 дек 2023
  • В этом видео мы создадим парсер для новостей с сайта vc.ru. Использовать для этого мы будем язык программирования пайтон и баблиотеки requests для того, чтобы отправлять запросы на сайт и BeautifulSoup из bs4, чтобы обрабатывать html код.
    👨‍💻 Подписывайся на наш телеграм канал! 👨‍💻
    🖇 t.me/pythonhub001 🖇
    👨‍💻 И вступай в чат 👨‍💻
    🖇 t.me/pythonhub_chat 🖇
    😳 Полезные ссылки 😳
    Requests:
    pypi.org/project/requests/
    Bs4:
    pypi.org/project/beautifulsoup4/
    #python #parsing #парсинг #пайтон #beautifulsoup #requests

Комментарии • 20

  • @shcoder001
    @shcoder001  5 месяцев назад +1

    👨‍💻 Подписывайся на наш телеграм канал! 👨‍💻
    🖇 t.me/pythonhub001 🖇
    👨‍💻 И вступай в чат 👨‍💻
    🖇 t.me/pythonhub_chat 🖇

  • @ThePirateHistory
    @ThePirateHistory 4 месяца назад +2

    5:34 в bsке есть уже давно топ метод select и select_one, можно писать css селектор, что гораздо быстрее, и легче понять. Советую

    • @shcoder001
      @shcoder001  4 месяца назад

      не знал. надеюсь, что почитаю. спасибо

  • @27FeetUnder
    @27FeetUnder 5 месяцев назад +2

    По результатам видно, что парится не ссылка на статью, а первая попавшаяся в тексте ссылка. Чтобы спарсить нужный тег, лучше в каждом элементе массива articles найти ссылку с уникальным классом "content-link" и вывести её.

    • @shcoder001
      @shcoder001  5 месяцев назад

      воу, возможно я и вправду не заметил. спасибо за замечание!

  • @hooligan8
    @hooligan8 2 месяца назад +1

    Привет, хорошая подача, было бы не плохо если бы ты показал как данный парсер с ботом соединить а бот публиковал на канал телеграм плюс бота закинуть на сервер и всё это чудо работало в автоматическом режиме

    • @shcoder001
      @shcoder001  2 месяца назад

      привет, спасибо. возможно сделаю что-то подобное в дальнейшем

  • @ThePirateHistory
    @ThePirateHistory 4 месяца назад +1

    5:42 почему бы не обратиться к "article" .find и так же див с классом 'content-title'???

  • @ThePirateHistory
    @ThePirateHistory 4 месяца назад +1

    Когда парсишь, чтобы тебя не забанили, 1 раз запрос делаешь, сохраняешь его в html файл на пк, работаешь, затем просто убираешь это, от кучи проблем избавит так же, проверено!

    • @shcoder001
      @shcoder001  4 месяца назад

      идея норм, но для такого мини проекта нет смысла.да и запросов тут не много

  • @ThePirateHistory
    @ThePirateHistory 4 месяца назад +1

    6:37 степень вложения, ты явно хочешь моей см3рт1

    • @shcoder001
      @shcoder001  4 месяца назад

      ты слишком ответственно подходишь. это же творчество

  • @Dendrar
    @Dendrar 5 месяцев назад +1

    супер

  • @Xgen111
    @Xgen111 5 месяцев назад +1

    Подскажи что за тема в пичарме у тебя установлена?

    • @shcoder001
      @shcoder001  5 месяцев назад

      обычный pycharm с обновленным интерфейсом просто

    • @Xgen111
      @Xgen111 5 месяцев назад

      @@shcoder001 пасиб

  • @ThePirateHistory
    @ThePirateHistory 4 месяца назад +1

    мой коммент опять ушёл в спам, чекни