Парсинг динамических сайтов | selenium python

Поделиться
HTML-код
  • Опубликовано: 10 фев 2025

Комментарии • 69

  • @ssstrolll
    @ssstrolll 7 месяцев назад +14

    Чтоб ты жил долго и счастливо. Обалденно обьясняешь.

  • @marla2043
    @marla2043 7 месяцев назад +4

    Обожаю ваш канал и конкретные примеры на задачах. Спасибо что снимаете видео!

  • @qtoxaq
    @qtoxaq 4 месяца назад +1

    2 дня мучился с решением проблемы, а тут все понятно объяснили, спасибо большое!

  • @ЕвгенийГрищенко-я4к
    @ЕвгенийГрищенко-я4к 9 месяцев назад +2

    Большое спасибо. Ваши видео очень приятно и познавательно смотреть) Вы как будто читаете мои мысли, как только мне что то нужно вы выпускаете на эту тему видео)

  • @mrbush1872
    @mrbush1872 3 месяца назад +1

    Большое спасибо за очень полезный контент ! Здоровья и успехов ! Отличный преподаватель !

  • @notproudman
    @notproudman 6 месяцев назад +1

    Вперше на вашому каналі, дуже круті відео, дуже сильно допомогли! Дякую за якісний контент!

  • @gorwar3613
    @gorwar3613 5 месяцев назад +2

    Крутейший человек, очень доходчиво объясняете.

  • @torvic2024
    @torvic2024 9 месяцев назад +6

    Здравствуйте! Спасибо за видео! С версии 4.6 (если не путаю) Selenium обзавелся Selenium Manager, который сам управляет драйверами браузера автоматически.

    • @kulichevskiy
      @kulichevskiy  9 месяцев назад

      о, надо посмотреть
      это прям упростит процесс

    • @TheModerus
      @TheModerus 9 месяцев назад +2

      В новых версия качать драйвер ненужно, абсолютно точно.

  • @blastblast9897
    @blastblast9897 7 месяцев назад +3

    Очень круто, спасибо)

  • @Scavibor
    @Scavibor Месяц назад

    Грамотная речь. Хорошая подача. Спасибо)

  • @МаксимШереметьев-с6б
    @МаксимШереметьев-с6б 4 месяца назад +1

    Очень полезное видео. Спасибо.

  • @enjoyenjoy6527
    @enjoyenjoy6527 5 месяцев назад +1

    Спасибо тебе. Спасибо большое...)

  • @wellplayttv
    @wellplayttv 3 месяца назад +1

    Спасибо!
    Лайк, подписка)

  • @Oreshec
    @Oreshec 4 месяца назад +1

    Благодарю

  • @СашаАлександр-е4м
    @СашаАлександр-е4м 26 дней назад

    37:36 Типичная реакция, когда написал какую-то хрень, но она необъяснимым образом работает.

  • @СемейныйархивДашульки
    @СемейныйархивДашульки 4 месяца назад +1

    контент разжован очень понятно. класс.

  • @НеистоваяРыбалка
    @НеистоваяРыбалка День назад

    Хочу переселиться в пайтон, но пока вижу нюансик. В последнее время только парсингом занимаюсь и бывают данные которые умещаются в десятки тысяч строк. С 1 окна это крайне долго, возможно есть варианты как открыть скажем 10 окон и брать данные с 10-ти массивов из ссылок. в 4 браузерах в 4 раза быстрее получалось чем у других, но только через расширения для хром на js

  • @Zloi-ut3ug
    @Zloi-ut3ug 17 дней назад

    Selenium последних версиях драйвера вроде как не требуют🎉

  • @The_Establishment
    @The_Establishment 9 месяцев назад +1

    Спасибо за интересные видео

  • @rbang6773
    @rbang6773 4 дня назад

    Здравствуйте, а можете сказать, возможно ли спарсить данные из кабинета, для входа в который необходим смс-код? Теоретически, вход в кабинет в браузере всегда выполнен, и сессия не сбрасывается, но это, вроде как, значения не имеет...

  • @zvolev
    @zvolev 5 месяцев назад

    Обалденные видео - доберусь до компа и заведу учетку в детском мире 😅. На самом деле хочу залезть в свою учетку в WB и вытащить от туда информации в тг-бота. У них есть официальные api но не для этого раздела... кто нибудь работал с WB? - есть инфа что могут учетку заблокировать если подключаться неофициальный способом - есть у кого опыт работы с WB?

    • @kulichevskiy
      @kulichevskiy  5 месяцев назад +1

      Возможно, но маловероятно. Блокируют, когда парсинг мешает работать - либо грузит серверы, либо использует какие-то нежелательные фичи

  • @danidi1
    @danidi1 8 месяцев назад +1

    Хотелось бы видио о сборке веб драйвера из расширений крипто про и браузера chromium gost, для авторизации на сайте гос закупок

  • @КоролеваЗамков
    @КоролеваЗамков 2 месяца назад

    Подскажите пожалуйста. Можно ли с помощью selenium парсить сайты, где стоит защита qrator? dns например?

  • @asemkrsk
    @asemkrsk 4 месяца назад +3

    Спасибо! Познавательно, как называется плагин который делит код по комментариям?

    • @afkDog
      @afkDog 2 месяца назад

      Это не плагин, это Jupiter NoteBook

  • @zvolev
    @zvolev 5 месяцев назад

    И, к стати спасибо за такое видео

  • @StanislavSiberia
    @StanislavSiberia 4 месяца назад

    Алексей, что за компилятор у вас стоит или настройка (26 минута видео), которая ошибки прям коде показывает?

  • @da-artstudio
    @da-artstudio 8 месяцев назад

    добрый день. Спасибо за видео. По поводу Selenium, сейчас вроде уже не нужно устанавливать драйвера. я не устанавливала и всё работает.

    • @kulichevskiy
      @kulichevskiy  8 месяцев назад +1

      Ага, они это в одном из недавних апдейтов добавили, кажется. Красота!

  • @MrSunTrope
    @MrSunTrope 8 месяцев назад

    Поджбонькали, пару раз скидыжнули и готово😊

  • @Сергей-у5з6п
    @Сергей-у5з6п 9 месяцев назад

    зачётное видео

  • @Valdemar93
    @Valdemar93 2 месяца назад

    подскажите, возможно ли сделать так чтобы забирать с сайта новые статьи, закидывать их в openAI и размещать в ТГ канале ? получилось только разместить названия статей, а тексты вообще ни в какую не может

  • @R2D2022
    @R2D2022 6 месяцев назад

    очень интересное и познаватальное видео, спасибо. А подскажите пожалуйста, как вы сделали, чтобы выполнять код не весь а в этих блоках пошагово?

    • @egornekr
      @egornekr 6 месяцев назад +1

      тут создается не файл .py , а jupiter notebook. Такое можно быстро в google colab делать

    • @R2D2022
      @R2D2022 6 месяцев назад

      @@egornekr понял, спасибо

  • @alexsmitt2140
    @alexsmitt2140 6 месяцев назад

    вопросик. В документации же написано: Selenium Manager - это новый инструмент, который помогает создать рабочую среду для запуска Selenium « из коробки». Для чего вы ставите отдельно драйвер браузера и заморачиваетесь с версиями?

    • @ПавелПрохоров-е9ц
      @ПавелПрохоров-е9ц 5 месяцев назад

      Раньше надо было отдельно путь прописывать , потом селениум обновился и стало все из коробки браться )

    • @gerapodsolnuh
      @gerapodsolnuh 5 месяцев назад

      а он про него не в курсе....а если бы читал комменты...

    • @NikolaiKuthnetsov-m9v
      @NikolaiKuthnetsov-m9v 3 месяца назад

      Здесь много багов. Зачем библиотека, когда можно просто импортировать данные файла секретного😂

  • @sergeysakara4842
    @sergeysakara4842 8 месяцев назад +1

    По-моему тут должно быть тысячи 2 лайков

  • @bespalove4882
    @bespalove4882 8 месяцев назад +2

    Добрый день!
    Подскажите, на какой должности можно работать с такими знаниями?

    • @triada777
      @triada777 6 месяцев назад +4

      Офисным шнырем

  • @АлександрБухтояров-ф9м
    @АлександрБухтояров-ф9м 7 месяцев назад

    Вроде бы драйвера уже давно идут в комплекте с Селениумом и не нужно устанавливать их отдельно

  • @kotzimaru
    @kotzimaru 6 месяцев назад

    Я понял как спарсить динамический сайт через добавление chromedriver но как это все засунуть в телеграмм бота и захостить на любом хостинге? Дайте материалы или сделайте видео

    • @CyberVampss
      @CyberVampss 6 месяцев назад

      Хромдрайвер под линунс, в коде программы делаешь условие, если винда, запускать екзешник, если линукс или сервера, то линуксовский драйвер. Бота запихиваешь прямо в код, токен + вывод сообщений на свой чат айди.

  • @Chinaoptretail
    @Chinaoptretail 6 месяцев назад

    Как называется среда в который вы пишите ?

  • @eddvornichenko
    @eddvornichenko 8 месяцев назад

    Подскажите пожалуйста, если на сайте несколько страниц, с которого надо спарсить данные. Как лучше это сделать?

    • @kulichevskiy
      @kulichevskiy  8 месяцев назад

      Если адреса страниц известны, можно просто в цикле их перебрать. Если нет, то можно их спарсить с текущей страницы, а потом в цикле перебрать.
      В общем, парсеры так и работают:
      1. найди и сохрани все ссылки на страничке
      2. перейди по каждой ссылке, найди на этих страничках все ссылки и пройди по ним
      3. повторяй, пока ссылки не закончатся

    • @Эрик-ш1ы
      @Эрик-ш1ы 7 месяцев назад

      ​​@kulichevskiy А если у меня около 500 ссылок,ведущие на динамический сайт, по которым нужно перейти и спарсить, есть ли что-то быстрее селениума?

  • @pip_install7496
    @pip_install7496 7 месяцев назад +2

    Вот и минусы использования не официальной документации. Они могут попросту не обновляться и в итоге ты получаешь не актуальную информацию

  • @SergeyLuchin
    @SergeyLuchin 9 месяцев назад

    Как в Vscode запускать по блокам код?

    • @kulichevskiy
      @kulichevskiy  9 месяцев назад

      Это просто Jupyter Notebook (jupyter.org/). Формат файла такой. Обычно люди с ними в браузере работают, но я их в VS Code открываю.

    • @hellpingpeople
      @hellpingpeople 8 месяцев назад

      @@kulichevskiy Есть ли у Вас видео с тюнингом VS Code? Настройка различных линтеров, например

    • @kulichevskiy
      @kulichevskiy  8 месяцев назад

      @@hellpingpeople неа, но надо бы сделать, наверное

  • @fgenich
    @fgenich 8 месяцев назад

    Алексей, почему не Pycharm?)

    • @kulichevskiy
      @kulichevskiy  8 месяцев назад

      Да чет не зашел :)

    • @marla2043
      @marla2043 7 месяцев назад

      А еще Pycharm отказался от пользователей из России , почему-то недавно а не в 2022. Поэтому с тем что не Pycharm, удачно угадано

    • @yuriyzav
      @yuriyzav Месяц назад

      @@kulichevskiyчто за расширение такое, которое позволяет запускать код блоками по очереди?

  • @ИраклийПобедный
    @ИраклийПобедный 3 месяца назад

    Смысл от видео?
    Можно просто доку почитать, автор сам не понимает за парсинг ничего.

  • @bossbossov4037
    @bossbossov4037 2 месяца назад

    У меня, почему-то, вылетает что chrome, что firefox. Запускаю код, потом открывается либо chrome либо firefox как приложение прогружает страницу и закрывается! не могу понять в чем может быть дело! Версия chromedriver и версия браузер отличаются только в конце, на одну цифру, т.е. cromedriver ver: 131.0.6778.69 а у браузера: 131.0.6778.70 ! но где-то видел, что главное, чтобы совпадали первые цифры