Python парсинг динамических страниц сайтов с JavaScript Ajax

Поделиться
HTML-код
  • Опубликовано: 28 сен 2024

Комментарии • 73

  • @aquabogira
    @aquabogira 10 месяцев назад +4

    Python Hub Studio,
    Ваши простые и понятные объяснения СЛОЖНЫХ ВОПРОСОВ делают обучение настоящим удовольствием.
    Благодарю за возможность воспользоваться вашим ПРОФЕССИОНАЛИЗМОМ!
    Спасибо за ценные уроки и поддержку!

  • @ДанилЕфимов-г9п
    @ДанилЕфимов-г9п Год назад +6

    Еще одна огромная благодарность вам. Очень благодарен вам за ваш труд. Бриллиант в океане туториалов! 💎

  • @Vladislav_Maliuk
    @Vladislav_Maliuk Год назад +8

    Спасибо за урок! Как всегда информативно и доступным языком👍

  • @raketa12
    @raketa12 Год назад +5

    это чудо. ролик по requests появился через день, после того как я начал изучать эту библиотеку. вчера я столкнулся проблемами в практике по парсингу, и тут это видео! лайк

  • @limonello1964
    @limonello1964 Месяц назад

    огромное спасибо благодаря знанию что хчр это инъекция быстро выполнил свою задачу

  • @alikhanguluzada9576
    @alikhanguluzada9576 Год назад +2

    Спасибо большое!

  • @fsoky
    @fsoky Год назад

    Полезная информация, спасибо ;3

  • @mylife-ej8et
    @mylife-ej8et Год назад +2

    Хороший видос

  • @aishuu848
    @aishuu848 Год назад +3

    А что делать если на сайте не обновляется page в ссылке?

  • @trotskijandrew
    @trotskijandrew Год назад

    Спасибо ! Много подчерпунул

  • @АрсланОчиров-щ5д
    @АрсланОчиров-щ5д Год назад +3

    Лайк и благодарность по умолчанию 👍

  • @LifterAndy
    @LifterAndy Год назад +1

    Спасибо!

  • @mak32
    @mak32 Год назад +1

    Разберите пожалуйста обновлённый selenium

  • @DmitryMartynov-w8s
    @DmitryMartynov-w8s 10 месяцев назад +1

    Здравствуйте. Не могли бы Вы подсказать, почему Chrome не видит "ajaxdetail/" и прочие такие файлы, в чем может быть проблема?

    • @PythonHubStudio
      @PythonHubStudio  10 месяцев назад

      Все браузеры это видят, только может называться вкладка по другому xhr, fetch, ajax, и тд

    • @franek-82
      @franek-82 10 месяцев назад

      @@PythonHubStudio У меня тоже в браузере не отображается ajaxdetail/. На вкладке xhr/fetch вместо него стоит: ?sentry_key=547...., у которого статус 200 и POST-запрос, а не GET. На вкладке "Ответ/отклик" - пустой словарь. Можете подсказать почему так?

    • @franek-82
      @franek-82 10 месяцев назад

      Разобрался в чём дело. Надо было кликнуть на другую страницу ("Mimicking Ajax requests") и уже там смотреть html-код.

  • @BelllLabs
    @BelllLabs Год назад

    Здравствуйте, автор канала! Спасибо за контент! Какие источники информации (книги, ютуб.каналы, сайты) по Питону можете посоветовать новичку и вообще что нужно знать начинающему фрилансеру?

  • @ЮраКуличенко-ф1н

    Добрый день!
    подскажите пожалуйста, как собрать информацию с сайта вайберриз а именно на каком месте находиться мой товар по различным запросам, возможно ли научиться этому с помощью PYTHON?

  • @man_with-no_name
    @man_with-no_name Год назад

    Можно к вам куда-нибудь лично обратиться по вопросу парсинга?

  • @bill8126
    @bill8126 Год назад

    Привет, расскажи почему используешь Интернет Експлорер ? В чем плюсы ?

  • @ivan_lapitski
    @ivan_lapitski Год назад

    подскажите пожалуйста, как распарсить сайт Майкрософта? нужно распарсить карточки с играми, а способ с видоса не работает, никак разобраться не моуг (((

  • @badgearlogo
    @badgearlogo 5 дней назад

    А можно через питон спарсить запросом, если подгружает скриптом js и ответ я получаю jsonом

  • @luispakvard5681
    @luispakvard5681 Год назад +1

    А помните вы видео записали как сделать Питон флешку а я написал скрипт который парсит мой гитхаб и выводит список менюшку с питон скриптами когда выбираете оно скачивает и запускает я так могу прийти в офис и напоназапускать своих скриптов на любом компе где пайтон не установлен ну и скрипт который ищет питон скрипты на моей флешке и запускает в виртуальном окружении venv

  • @CrazyDark
    @CrazyDark Год назад

    Будет ли видео по JS и React ?

  • @alexandrx6449
    @alexandrx6449 Год назад

    Спасибо за видео!
    Подскажите пожалуйста есть ли сейчас возможность парсить avito? что только не использовал, ответ всегда 403 при попытке установить соединение на стартовой странице

    • @ДжонСмит-ч5ь
      @ДжонСмит-ч5ь Год назад

      неделю назад написал его на Selenium отлично работает, но для моего случая нужна была авторизация в начале по смс для получения большего числа данных

  • @MrBooomsik
    @MrBooomsik 11 месяцев назад

    Добрый день, а geekjob возможно спарсить? Не будет ролика как это сделать?

    • @PythonHubStudio
      @PythonHubStudio  11 месяцев назад

      Ролика не будет как этот ресурс парсить, парсинг на канале есть только в качестве тренинга для начинающих, чтоб была практика по python и понимание в запросах. Это не благодарное дело(парсинг), поэтому хоть и можно спарсить любой сайт и попытаться на этом заработать, как это делать обходя блокировки выпускать видео не буду. Это никому не нужно, это не то чем нужно себя занять в программировании.

  • @metanlife9476
    @metanlife9476 Год назад

    Можешь сделать видео что нужно знать для data science для устройство на работу)

  • @ismailagasiev
    @ismailagasiev Год назад

    Привет! Как можно задонатить тебе из России?

  • @АркадийНалимов-р1э
    @АркадийНалимов-р1э Месяц назад

    Под каждым видео такие эмоциональные комменты... Сектанты прям 😂 хоть 1 конструктивная критика автора есть где??

  • @ЕгорГуторов-р7я
    @ЕгорГуторов-р7я Год назад

    Всем привет!
    Кто знает, как обойти вот это?
    Ваш браузер не смог пройтипроверку.Для доступа к веб-ресурсу включите в настройках вашего веб-браузера поддержку JavaScript или воспользуйтесь другим веб-браузером, который поддерживает JavaScript.

    • @firstandlast4435
      @firstandlast4435 Год назад +1

      Попробуй с помощью selenium загружать страницу, и потом уже сохранять ее и отправллять в bs4.
      Это может быть не очень хороший совет потому как я сам только учусь, но если я правильно понял твою проблему, то selenium поможет

    • @ЕгорГуторов-р7я
      @ЕгорГуторов-р7я Год назад

      @@firstandlast4435 Спасибо за комментарий!
      Да, я как раз и использовал selenium. Но , увидев данный ролик, подумал, что смогу справляться с задачей скроллинга на сайте и без selenium.
      Протестировал через requests, но сервер не пускает меня, потому что, как понял, не прохожу проверку на "человечность".

    • @firstandlast4435
      @firstandlast4435 Год назад

      @@ЕгорГуторов-р7я мне по сообщению показалось что сайт проверяет не на человечеость а на совместимость с яваскрипт, так как использует его для отображения контента. Это логичная проверка и я думаю что отнюдь нередкая

    • @firstandlast4435
      @firstandlast4435 Год назад

      @@ЕгорГуторов-р7я просто насколько я знаю когда то не все браузеры поддерживали яваскрипт. Хотя сейчас все популярные браузеры это делают

    • @ЕгорГуторов-р7я
      @ЕгорГуторов-р7я Год назад

      @@firstandlast4435
      Попробую через selenium зайти и в метод get отправлять запросы имитирующие скроллинг. Но почему-то у меня устоявшийся в голове принцип, что селениум чисто для имитации действий пользователя, и что он не может в запросы API.

  • @Cyr173
    @Cyr173 Год назад +1

    задержка time.random излишняя.

    • @ДжонСмит-ч5ь
      @ДжонСмит-ч5ь Год назад

      вообще не понял зачем она? для обхода антипарсиноговой блокировки?

  • @stradys
    @stradys Год назад +2

    Спасибо за видео! Понятно объясняете, приятно смотреть. Сделайте также пожалуйста урок с использованием Selenium для динамических сайтов. Думаю многим пригодится.

  • @oleg3141
    @oleg3141 Год назад +2

    Спасибо!! Отличный урок.

  • @negonifas
    @negonifas Год назад +2

    Спасибо тебе добрый человек

  • @fanteam5179
    @fanteam5179 7 месяцев назад

    Что делать если обрезали доступ к этой ссылке. Когда захожу по по подобной ссылке из url-запроса то мне пишет: 403 Forbidden
    nginx/1.18.0. Но на сайте можно открыть нужную мне информацию по нажатию кнопки и появится модальное окно, (которое не видно в элементе без нажатия этой кнопки). Можно ли как-то с помощью requests нажать на эту кнопку чтобы потом взять элементы из этого модального окна?

  • @Tak0ri
    @Tak0ri 7 месяцев назад

    Пробовал потренироваться парсить защищенные сайты. Пока не получается вытащить json простым get запросом. Хотя если в браузере на странице посмотреть в инспекторе где XHR там все JSON, которые через API получаются можно найти. Вариант только через selenium? Или может есть какой путь более быстрый?

  • @giftingif7667
    @giftingif7667 10 месяцев назад

    На 14 минуте вы сказали про код 200 и код 300 с копеечкой и про перенаправление. А если на сайте есть перенаправление и 304 код, то как тогда быть? И если не xhr, а fetch запрос и ещё есть graphql. Будут ли видео про парсинг ещё у вас?

  • @ЮрійМММ
    @ЮрійМММ Год назад +1

    Респект

  • @alexlogan4678
    @alexlogan4678 Год назад

    Хм, а как отработал print(response['title'])? в питоне возвращает ошибку формируется список а не словарь "TypeError: list indices must be integers or slices, not str". Через цикл For работает. for item in response:
    print(item['title'])

  • @reddmon7213
    @reddmon7213 9 месяцев назад

    давай видео как парсить сайты с каптчей запросами(без селениума) пожалуйста

  • @ГюставЭйфель-б3б

    ошибка TypeError: 'str' object is not callable

  • @АндрейМиронов-в3с
    @АндрейМиронов-в3с 5 месяцев назад

    Нашёл, что искал. Спсибо, Python Hub Studio!

  • @birdwatcher_channel
    @birdwatcher_channel Год назад

    Видео очень понравилось. лайк не забыли поставить)

  • @nickalt2585
    @nickalt2585 2 месяца назад

    Оч крутой разбор, спасибо!

  • @aleksejborovinskij1155
    @aleksejborovinskij1155 Год назад

    Спасибище! Однозначно в закладки видео.

  • @usyf14
    @usyf14 Год назад

    Уважаемый автор, я прошел ваш семичасовой курс по Python и хочу поблагодарить вас за проделанную работу, но в моей стране нет функций спасибо. Как бы я смог отправить вам денег?

  • @iprahka
    @iprahka Год назад

    Супер полезный видос

  • @igorratnik2357
    @igorratnik2357 Год назад

    Спасибо, все четенько, по делу и без лишней воды!

  • @eugenex8892
    @eugenex8892 Год назад

    Как это без обновления страницы? Страница-же обновилась... Ты имеешь ввиду БЕЗ ЗАГРУЗКИ/ПЕРЕЗАГРУЗКИ страницы....

  • @Вадим-ф9ч9ш
    @Вадим-ф9ч9ш 7 месяцев назад

    Пол года назад, начал учить Пайтон язык, по вашим Видео урокам
    И...? Я стал маленьким программистом)
    Я успешно сдал свой первый заказ на фрилансе и продолжаю дальше учится!)
    Но остается много тумана и неясностей
    В частности, если web разработка не зашла, а именно frontend (backend ещё норм), куда ещё можно посмотреть? На чем ещё можно зарабатывать?
    За аналитиков данных , или машинное обучение вы что-то знаете? Там интересно?)

    • @PythonHubStudio
      @PythonHubStudio  7 месяцев назад +1

      Я так понимаю автоматизация, вроде парсинга и ботов в портфолио тоже есть... Аналитика и ML очень хорошая тема, но не особо для фриланса с нуля, так как уровень ответственности с точки зрения заказчика намного выше, и разнородность требований/задач больше, а значит количество заказов на старте которые вы сможете взять меньше. Это если про фриланс. А так, то направление максимально перспективное.

  • @MadinaAbaeva-b4w
    @MadinaAbaeva-b4w Год назад

    Здравствуйте, у меня есть 30 тыс ссылок и мне нужно из каждой ссылки собрать - артикул, описание и картинку. Заметила, что сайт не любит большое количество запросов. Есть ли способ обойти эту защиту используя прокси или что-то другое. Хотела купить прокси, но это дорого

    • @imeyk
      @imeyk Год назад

      Выставить задержку? И есть бесплатные прокси.

    • @alexbritwa9873
      @alexbritwa9873 Год назад

      33 рубля в месяц вовсе не дорого

  • @back_to_life0
    @back_to_life0 10 месяцев назад

    Это не парсинг динамических страниц
    А парсинг страниц которые присылают json

    • @PythonHubStudio
      @PythonHubStudio  10 месяцев назад

      В этом видео парсинг по ajax запросам, которые сайт отрисовывает динамически(без перезагрузки) по средствам JavaScript - json и фрагменты разметки.

    • @back_to_life0
      @back_to_life0 10 месяцев назад

      @@PythonHubStudio сайт ничего не отрисовывает, рендерит драйвер.... поэтому как я и сказал это не то, я искал как без этого ссаного хром драйвера + селениум который жрет кучу ресурсов получать уже отрендеренные страницы