Зарабатываем на OZON | Парсинг товаров с помощью Python

Поделиться
HTML-код
  • Опубликовано: 24 дек 2024

Комментарии • 200

  • @sergdef1
    @sergdef1 3 месяца назад +15

    Мне всегда интересно продолжение. Ваши уроки помогают решить некоторые мои задачки по парсенгу. Вот и сейчас я смог применить ваш пример в своем коде. Спасибо за огромный труд!!!

  • @PolyuhovSA
    @PolyuhovSA 3 месяца назад +17

    Человечище, спасибо!! Очень ждал данную тематику! Спасибо что ты так здорово подаешь инфу!

    • @PythonToday
      @PythonToday  3 месяца назад +3

      Большое спасибо за поддержку!

  • @IvanTarazevich
    @IvanTarazevich 3 месяца назад +4

    Благодарю, очень хороший ролик. Много твоих видео помогли мне в работе с написанием кода на python. Крепкого здоровья и ждем как всегда новых роликов уважаемый!

  • @s_time3344
    @s_time3344 3 месяца назад +5

    вот прям недавно вспоминал про твои старые видосы про парсинг и тож думал про озон, а тут видос целый, спасибо!

  • @deus7204
    @deus7204 3 месяца назад +2

    Всегда с удовольствием смотрю твои ролики, очень интересно, а главное понятно объясняешь. Спасибо тебе за труд!

  • @Zer-st6qv
    @Zer-st6qv 3 месяца назад +6

    Большое спасибо за твой труд и что делишься своим опытом. Будь здоров!

  • @sergeysergeev2180
    @sergeysergeev2180 3 месяца назад +2

    Ждём продолжения. И успехов в делах!

  • @TywuzhereSkina
    @TywuzhereSkina 3 месяца назад +11

    Умный человек это делал. Мне до его навыков далеко... Благодарю за видео и за вашу работу!

  • @dmitriykonopinskiy3793
    @dmitriykonopinskiy3793 2 месяца назад +2

    идеи для видео
    1) виды блокировок вас сервером при парсинге
    2) как парсить на домашнем пк, чтобы не быть забаненым?
    3) как бюджетно парсить с сервера? как выбрать сервер, позволяющий парсить (конторы которых парсят будут жаловаться)
    4) где взять халявные прокси и как этим пользоваться

    • @DreamingDolphing
      @DreamingDolphing 2 месяца назад

      На ютубе есть канал конторы, которая зарабатывает исключительно на парсинге. Они говорят, что если нужно качество и стабильность результата, то всегда обратятся к ним, а не левому фрилансеру, который не знает как использовать прокси и выделенный сервер.

  • @СергейВасильев-и5п9к
    @СергейВасильев-и5п9к 3 месяца назад

    Огромное спасибо сенсей, благодаря тебе научился парсить!

  • @nurikona
    @nurikona 3 месяца назад

    Конечно ждем продолжения видео про Парсинг🤠

  • @noname52rus
    @noname52rus 3 месяца назад

    благодарю за труд и что помогаешь в ознакомлении с питоном

  • @ИльяБояринцев-т2з
    @ИльяБояринцев-т2з 3 месяца назад

    Очень интересное видео! Конечно же жду продолжение!))

  • @BITWAZACHEKUSHKU
    @BITWAZACHEKUSHKU 2 месяца назад

    Вместо того чтобы искать товары и затем руками выставлять фильтры, можно использовать Selenium, чтобы автоматически щёлкать на нужные фильтры, как это делает обычный пользователь
    Для нахождения нужных элементов фильтра можно использовать соответствующий XPath, class или id элемента, чтобы Selenium мог их найти

  • @isok.atyrau
    @isok.atyrau 3 месяца назад

    Продолжайте, как раз нужная тема!

  • @peretz542
    @peretz542 3 месяца назад +6

    Подскажи пожалуйста, почему сайт при проверке на бота не банит тебя и не подсовывает капчу? это из-за библиотеки undetected chromedriver?

  • @ВасилийЕршов-ы4з
    @ВасилийЕршов-ы4з 2 месяца назад

    Круто, жду продолжения!=))

  • @chentsov_ov
    @chentsov_ov 3 месяца назад

    Как в тему это видео!! Как раз хотел решить задачу по парсингу отзывов с определенной карточки, у меня упорно через селениум не выходило)

  • @yagohush7414
    @yagohush7414 3 месяца назад

    спасибо! тема конечно интересна! ждем продолжения!

  • @tolyachernov7849
    @tolyachernov7849 3 месяца назад

    Хочу и жду продолжения!)

  • @ICastTheBan
    @ICastTheBan 2 месяца назад +7

    Зачем вы используете селениум для озона, если у них есть api?

    • @Jeyw1n
      @Jeyw1n Месяц назад +1

      Ссылку на апи пожалуйста. Нашел только АПИ для селлеров.

  • @etri
    @etri 3 месяца назад +5

    А зачем парить артикул из страницы, если его можно из url-товара гораздо проще достать?

  • @fatoldman340
    @fatoldman340 3 месяца назад +1

    Как вариант развития, параллельно парсить несколько вкладок, чтобы снизить время работы

    • @rebuilderowner78673
      @rebuilderowner78673 3 месяца назад +3

      И улететь в бан по ip за частые запросы)

  • @vadimchecherin5295
    @vadimchecherin5295 3 месяца назад +3

    ждем продолжение)

    • @PythonToday
      @PythonToday  3 месяца назад +2

      Спасибо за интерес!

  • @lalalf4535
    @lalalf4535 3 месяца назад

    Для product_name можно попробовать использовать метод get_text(strip=True). Для параметра сортировки можно использовать либу urllib и с помощью нее сразу передавать название товара и порядок сортировки

  • @leolim146
    @leolim146 3 месяца назад

    Отличный урок👍🏻

  • @_test_test
    @_test_test 2 месяца назад

    я бы предложил искать толькл через xpath локаторы. например лучше искать ссылки не просто через указание клаасса в аттрибутах, а еще и передать, что это должен быть тег "а". избавит от лишних данных и мусора

  • @gaben_aTan
    @gaben_aTan 3 месяца назад

    Автор начал использовать рефакторинг 👍👍👍👍

  • @Redings_
    @Redings_ 3 месяца назад

    Прошу обновить плейлист по парсингу! По requests ещё более-менее, а вот по selenium очень сильно устарела информация.

  • @dmitriysavinov9906
    @dmitriysavinov9906 3 месяца назад

    Спасибо за интересное видео!

  • @ДенисАфросин-ы5д
    @ДенисАфросин-ы5д 3 месяца назад

    Круто, очень интересно 👍

  • @koteanonim1810
    @koteanonim1810 2 месяца назад

    Поздравляю , вы написали самый медленный парсер.

    • @nikolaydd6219
      @nikolaydd6219 2 месяца назад

      Можно написать на Delphi (или C++), с многопоточностью и прокси. Кому надо - тот додумается)

  • @TBRAK78
    @TBRAK78 Месяц назад

    Рекомендую попросить налоговую, хорошее развлечение :) хотя у них есть API но стоит оно неадекватно

  • @konstantin1111
    @konstantin1111 3 месяца назад

    Очень круто, спасибо! Асинхронная версия будет?

  • @ИванИванов-б8у4и
    @ИванИванов-б8у4и 3 месяца назад +8

    А для каких конкретных целей нужен данный тип парсинга?

    • @АртёмИвасечкин
      @АртёмИвасечкин 3 месяца назад +3

      Скидки искать на определённый товар. Можно отстук в телегу сделать, когда найдёт.

    • @darktmdarkness6952
      @darktmdarkness6952 2 месяца назад +1

      какой именно тип парсинга? Не очень понятно, что вы имеете ввиду.
      Если забирать данные о первых 10 товарах из выдачи озон? То там все просто - это нужно сейлерам ( продавцам ), что бы понимать есть ли в выдаче их товары, или о том, какие товары в топе выдачи и с какой ценной, или ориентироваться на их цену, выставляя свою и т.д.

    • @faltudo
      @faltudo Месяц назад

      @@darktmdarkness6952 у продавцов ОЗОН в личном кабинете есть возможность проверять на какой позиции их товар

  • @leogsa1
    @leogsa1 3 месяца назад

    Ребята, спасибо за ваше видео. Очень интересное.
    Есть пару замечаний, тем более, вы сами попросили - кто знает - помогайте, оставляйте коменты.

    • @leogsa1
      @leogsa1 3 месяца назад

      Первое: вам надо добавить в пакеты setuptools. Ну и заодно добавить его в команду пип инсталл
      начиная с python 3.12 distutils удалили из стандартной библиотеки и у пользователей будет вылетать ошибка
      Module Not Found Error No module named distutils

    • @leogsa1
      @leogsa1 3 месяца назад

      вобщем, я вам 3 пул реквеста добавил на гитхабе. тут постить код бесполезно. они сносят его за секунду.

    • @leogsa1
      @leogsa1 3 месяца назад

      Четвертое: вы весь проект делаете в venv. А пользователям про это ничего не сказали. Там всего 2 команды для этого, но некоторые могут запутаться.
      Пятое, оно же последнее: вы бы в конце показали пользователям, как убрать появление браузера и как перевести его в полностью невидимый режим (headless). Окно браузера с самодвигающейся мышкой - для тестов очень даже неплохо и часто нужно. Но для реальной работы - скрипт должен в фоне там шуршать незаметно, а пользователь сидит за компом и занимается своими делами. А в этом варианте пользователь будет сидеть и грустно смотреть на занятый скриптом комп. Смысл ему от такой автоматизации?
      Но даже несмотря на всё вышеперечисленное - видео, повторюсь, полезное. Многим новичкам и не только - зайдет на ура.
      И мне зашло )
      Спасибо. Жду новых видео про парсинг.

  • @evgeny3489
    @evgeny3489 2 месяца назад

    каждый раз когда слышу средствАми"", кажеться, чсто сейчас будут говорить про смену финансового номера и заблокированные карты))))) А так хорошее видео))

  • @cryptohyde
    @cryptohyde 3 месяца назад +1

    стесняюсь спросить ...а сколько времени понадобилось чтобы стянуть 10 товаров? Не меньше минуты... Минута! бро! на 10 карточек! а ресов селениум при этом жранул не хило так

  • @ilyasminik
    @ilyasminik 3 месяца назад +3

    Для чего это может пригодиться?

    • @leitonk23
      @leitonk23 2 месяца назад

      Ага, вот и я посмотрел тоже и сижу такой
      🗿

    • @Chel1k7
      @Chel1k7 2 месяца назад

      @@leitonk23 если тебе это не надо, то не значит, что никому не надо)

  • @mychanel1999
    @mychanel1999 2 месяца назад

    Недавно смотрел видео где схожую задачу на мегамаркете решали через реверс апи запросов, то есть скрипт опирался на api, почему делается именно через GUI скрипты?

  • @maximusmax2442
    @maximusmax2442 3 месяца назад

    Спасибо очень полезно!

  • @igora6367
    @igora6367 2 месяца назад +5

    Непонятно, в чем заработок?

  • @СергоИваныч-к2ш
    @СергоИваныч-к2ш 3 месяца назад

    Лучше курс по анализу данных на степике за 3 рубля 😊

  • @salavatkhidiyatullin2643
    @salavatkhidiyatullin2643 3 месяца назад +33

    Я, честно, не понимаю, почему, при существовании такой удобной библиотеки, как Playwright, люди продолжают использовать Selenium.

    • @PythonToday
      @PythonToday  3 месяца назад +14

      Как минимум потому, что озон блокирует последний месяц Playwright, во всякой случае мои парсеры. Вы пробовали сами?

    • @gaben_aTan
      @gaben_aTan 3 месяца назад +6

      Я даже и не знал о такой библиотеке, селениум надежен и проверен временем 👍

    • @exdevil3832
      @exdevil3832 3 месяца назад

      Думал как раз пересмотреть свой код на playwright

    • @vlatto6383
      @vlatto6383 3 месяца назад +4

      Дружище, как я тебя понимаю.
      Использовать до сих пор селениум, это быть позорником в it

    • @vlatto6383
      @vlatto6383 3 месяца назад

      Обойти подобные блокировки не составляет особого труда. Слава богу fingerprint с этим помогает

  • @RunBull
    @RunBull Месяц назад

    у меня как то странно работает, запускаю 1 раз находит 10 ссылок, запускаю 2 раз находит 8 ссылок, 3 раз 12 ссылок и каждый раз по разному

  • @perehov
    @perehov 2 месяца назад

    У меня уже пол года - год как не работает undetected_chromedriver. Выдает ошибку, у всех все впорядке с ним? Без него не могу запустить хром со своим профилем и расширениями, что создает проблему при парсинге. 1) Подскажите у всех ли работает эта библиотека? 2) может есть другой способ запустить хром драйвер чтобы открывался хром с моим профилем и установленными активными расширениями хром

  • @markandsvwonick4950
    @markandsvwonick4950 10 дней назад

    почему когда открываю файл с данными там просто скобочки

  • @rand_name6734
    @rand_name6734 3 месяца назад

    Пару лет назад, когда начал интересоваться Пайтоном, начал писать парсер комментариев с озона для одной своей идейки, но пока писал необходимость отпала. Так и не дописал((

  • @blackout1819
    @blackout1819 3 месяца назад

    У меня другой вопрос. Как питон может быть связано с пентестом?

  • @Coverast
    @Coverast 3 месяца назад +1

    Скажи фразу с которой понятно что ты айтишник:
    скрайпер перегрузил мой самый быстрый ноут.

  • @loversoul8206
    @loversoul8206 3 месяца назад

    Я совершенно ничего не понимаю в веб, объясните, почему используются полные версии страниц, а не их html? Можно ли с такой программой фоном работать, чтобы несколько скриптов одновременно работали?

    • @_test_test
      @_test_test 2 месяца назад

      не понял про полную версию страниц. есть несколько вариантов рендеринга информации на странице: client-side и server-side. в случае сервер сайд рендеринга страница подностью формируется и наполняется данными на стороне сервера и когда клиент делает запрос на страницу, то получает ее полностью, включая все данные. в случае клиенского рендеринга, на сервере формируется шаблон страницы с базовой структурой, после этого отправляется этот полу пустой шаблон и пачка джава скрипт файлов. когда юзер запрашивает страницу, то получает и шаблон и начинают выполняться скрипты по загрузке данных. если при парсинге делать только гет запрос на html, то в случае клиент сайд рендеринга получишь страницу без данных. для этого и используется селениум, который запускает отдельную версию браузера, чтобы тот все отрендерил и уже после рендера достал данные. фоном можно, зависит от ресурсов железа, на котором запускается скрипт. каждый инстанс браузера жрет допустим 300мб. вообще хз зачем я это пишу, когда любые вопросы можно задать чату жпт. больше не буду)

  • @bloodyrevenge2324
    @bloodyrevenge2324 3 месяца назад

    Очень хороший код

  • @davidhartman8698
    @davidhartman8698 3 месяца назад

    Проблема такой реализации - тебя настигнет капча, неприменно.
    Я бы на твоем месте как минимум парсил каждый отдельный товар, загрузив страницу через requests. А вообще по красоте было бы действительно разобраться в том как формируется поисковая строка (можно ручками открыть сразу несколько результатов поиска и посмотреть что общего у этих запросовв ссылке)

  • @AlexeyRiched
    @AlexeyRiched 2 месяца назад

    у меня такая ошибка при запуске TypeError: Binary Location Must be a String, видимо не видит где хром установлен

    • @AlexeyRiched
      @AlexeyRiched 2 месяца назад

      эту победил а вот эту не могу UnboundLocalError: cannot access local variable 'products_urls' where it is not associated with a value

  • @alkash3301
    @alkash3301 2 месяца назад

    наверно глупая проблема, но все же. пробую написать кое что с помощью selenium и chrome, но при запуске кода он ничего не делает, т.е. не открывается браузер, ничего. с настройкой selenium это вроде не связано, т.к. драйвер есть, путь до него указан верно и все остальное правильно. может кто знает в чем проблема, пробовал искать в инете, ничего не помогло

  • @ПодлыенарезкиЕгора
    @ПодлыенарезкиЕгора 3 месяца назад +5

    Не представляешь как ты вовремя. У меня через пару дней будет тестовое задания для устройства на работу парсер для маркетплейсов. А тут ты с роликом. Я голову ломал как работать с динамично изменяющимися тегами и класами

    • @Raizen-r3y
      @Raizen-r3y 3 месяца назад +2

      нейросети просто существуют

    • @PythonToday
      @PythonToday  3 месяца назад +5

      Знаете нейросети которые решают такие задачи?)

    • @jacobguitarrero5233
      @jacobguitarrero5233 3 месяца назад +2

      Я просил Llama 3.1 написать парсер
      Сделала, но косячно как-то
      Пришлось в ютубе искать
      И ваше видео как вовремя)

    • @chentsov_ov
      @chentsov_ov 3 месяца назад

      @@PythonToday ChatGPT не смог собрать отзывы)

    • @rebuilderowner78673
      @rebuilderowner78673 3 месяца назад

      Вот так всегда, пишешь проги и знаешь как это делается - нет клиентов, а тут у чела уже есть работа почти а он хз с какого края подойти...

  • @Jon_Britva
    @Jon_Britva 3 месяца назад

    У меня не работает Undetect_chromedriver, может из-за версии пайтона 3.12? P.S. За скрипт скроллинга отдельный респект.

  • @olerak
    @olerak 3 месяца назад +1

    Подскажите, пожалуйста, кому может понадобится этот парсер на пайтоне?

    • @_test_test
      @_test_test 2 месяца назад

      тому, кто готов за это платить

  • @Sav_moto
    @Sav_moto 3 месяца назад

    Почему в json файл? А можно в обычный вордовский док. записать данные?

    • @ricardo-user
      @ricardo-user 3 месяца назад +1

      потому что работать в дальнейшем удобнее либо с json либо с xls файлом, в большинстве случаев данные идут дальше для вывода где-то в дашборде или анализе цен, например. Тут больше от задачи, можно и в ворд и картинкой

    • @_test_test
      @_test_test 2 месяца назад

      да хоть в мп3 лол

  • @abracadabra5491
    @abracadabra5491 3 месяца назад

    Подобная регулярка разве не сработает? r"\s*"
    Или r"\b\[w+ !?.,]\b" с добавлением нужных символов. По факту должен найти слова с пробелом и остальными символами, от пробела до пробела

  • @narig89
    @narig89 3 месяца назад

    А есть парсер Яндекс маркета?

  • @SwenOwn
    @SwenOwn 3 месяца назад +3

    Python знаю, как написать парсер - знаю, не знаю главного - нахрена? 😅 Хоть не в тему программирования, но как на этом можно заработать?

    • @billybonka5153
      @billybonka5153 3 месяца назад

      Вот мне тоже это интересно. Гуру программирования, подскажите, как вы зарабатываете на этом?

    • @iscanderkov9656
      @iscanderkov9656 3 месяца назад

      Тоже теряюсь в догадках. У меня одно объяснение, что парсить озон это просто как пример. Больше чем для курсовых работ студентам или для тестирования при приеме на работу я не нахожу в этом пользы.

    • @Vanga-LDPR-aka-ZHIRINOVSKY
      @Vanga-LDPR-aka-ZHIRINOVSKY 3 месяца назад

      Действительно, зачем это всё нужно? Если хочу что-то купить подешевле то есть фильтры, если продать то теги.

    • @SeoLemma
      @SeoLemma 3 месяца назад

      Например одни продавцы мониторят цены других продавцов, что бы вовремя скорректировать свои )

    • @iscanderkov9656
      @iscanderkov9656 3 месяца назад

      @@SeoLemma это можно штатными фильтрами делать

  • @vinsetdelta
    @vinsetdelta 3 месяца назад

    Можете подсказать как можно сделать на vscode такой же терминал как у автора

    • @krone_
      @krone_ 3 месяца назад +1

      У автора тоже vscode))
      Ты же можешь любой терминал поставить и настроить его дефолтным
      Скорее всего это кастомизированный zsh

  • @tokosotomimo14
    @tokosotomimo14 2 месяца назад

    ozon отдает json прямо в html странице, нужно просто указать куки и хедерсы. зачем для этого использовать драйвер?

    • @RunBull
      @RunBull Месяц назад

      можно по подробнее ?

  • @DreamingDolphing
    @DreamingDolphing 2 месяца назад

    Numpy произносится "нам-пай".

  • @ДаняирТоломушев
    @ДаняирТоломушев 3 месяца назад

    а где ты получаешь заказы ?

  • @serj-nf7ll
    @serj-nf7ll 3 месяца назад

    Не проще api заюзать?

  • @Электрочайник
    @Электрочайник 2 месяца назад

    Почему все программисты делают ударения не там, где нужно? Меня давно интересует этот вопрос. Они все говорят "стрОку", вместо "строкУ". А в этом видео автор пошел дальше. Вместо "удобной средЫ" у него "удобная срЕда"

  • @andreifes1702
    @andreifes1702 3 месяца назад

    Братан я за тебя

  • @JonathanSulivan666
    @JonathanSulivan666 3 месяца назад

    На коком языке написано приложение озон для андроида ? Кто знает?

  • @ЯрославСмирнов-р7о
    @ЯрославСмирнов-р7о 3 месяца назад +1

    не совсем понимаю, какой смысл парсить озон(и другие маркетплейсы), если на один и тот же товар для нескольких аккаунтов цифры будут различаться?

    • @МишокЧинил
      @МишокЧинил 3 месяца назад

      это почему?

    • @ЯрославСмирнов-р7о
      @ЯрославСмирнов-р7о 3 месяца назад

      @@МишокЧинил я не совсем понимаю, на какой вопрос нужно дать ответ.
      Почему маркетплейсы так делают или почему нет смысла парсить 100 разных ценников на один и тот же товар?

    • @darktmdarkness6952
      @darktmdarkness6952 2 месяца назад

      аналитика продавца, судя по тому что тут требуется именно выда из поисковой строки, и первые десять, ценик нужен что бы сопаставить со своим, если такие товары у продавца есть.

  • @davidola1814
    @davidola1814 3 месяца назад

    Я конешно не знаю но как меня учили работать с селениумом ты все обворачивпешь в трай экзепт и в файнали пишишь драйвер клос

    • @davidola1814
      @davidola1814 3 месяца назад

      Может автор создаст дс серв кстати?

  • @MegaReenat
    @MegaReenat 3 месяца назад

    Как устранить оишбку?
    ModuleNotFoundError: No module named 'distutils'

    • @Matvei_Cherepanov
      @Matvei_Cherepanov 3 месяца назад +1

      тоже столкнулся с такой ошибкой. Она возникает, потому что в Python 3.10 и выше данную библиотеку удалили из стандартных библиотек. Попробуй обновить или установить setuptools мне помогло.

    • @scitech_enthusiast
      @scitech_enthusiast 2 месяца назад

      А установить её никак самостоятельно?

    • @Matvei_Cherepanov
      @Matvei_Cherepanov 2 месяца назад

      Она входит в setuptools, поэтому достаточно просто установить/обновить setuptools.

  • @dydai
    @dydai 3 месяца назад

    Друг, у тебя в описании написано "пупулярный"

    • @yagohush7414
      @yagohush7414 3 месяца назад +1

      все правильно. "популярный" - от "попа", "пупулярный" - от "пуп".

    • @rebuilderowner78673
      @rebuilderowner78673 3 месяца назад

      ​@@yagohush7414😂

  • @disclip5219
    @disclip5219 3 месяца назад

    Привет, можешь помочь нам? Разработать автоподнятие на сайте Фарпост( доска объявлений). Как можно с вами связаться через соц. Сети?

    • @soundze
      @soundze 2 месяца назад

      Напишите мне, помогу

  • @funhistory-x8x
    @funhistory-x8x 26 дней назад

    Боже. Я думал почему у меня завершался сам по себе скрипт на селениуме, когда я автоматизировал отработку проект. Работал в авг около 4 часов в худшем случае и падал, а автор говорит, что у него с ожиданием от селениума тоже падает. ХМ

  • @blackout1819
    @blackout1819 3 месяца назад

    Последнее условие можно не писать. И так будет работать

  • @filmmoments5133
    @filmmoments5133 2 месяца назад

    здесь RPA очень бы пригодился

  • @andreifes1702
    @andreifes1702 3 месяца назад +1

    Зачем это все ? Когда есть гпт !

  • @YaBatya1337
    @YaBatya1337 3 месяца назад

    Чет медленно, а что можно использовать для более быстрого парсинга?

    • @ricardo-user
      @ricardo-user 3 месяца назад

      предполагаю - многопоточность

  • @Otgonbayarin
    @Otgonbayarin 3 месяца назад

    Не пойму для чего вообще нужны парсеры, если на самом сайте существует поиск товаров и то, что нужно можно быстро найти?

    • @vimp1
      @vimp1 3 месяца назад

      Чтобы можно было создать таблицу с инфой по товарам, с чем дальше можно работать, формируя свое предложение

  • @AlexeyRiched
    @AlexeyRiched 2 месяца назад

    мне нужен такой же только для яндекс маркет

  • @mcalexson
    @mcalexson 2 месяца назад

    лайк если орнул с юзера "kali"

  • @MrKim-pt2vm
    @MrKim-pt2vm 3 месяца назад

    Как отзывы выттягивать?

    • @СергейШульга-ю5ю
      @СергейШульга-ю5ю 3 месяца назад

      Так же само.

    • @Markus0
      @Markus0 3 месяца назад

      ​@@СергейШульга-ю5ю Есть "так же", есть "то же самоЕ". А то, что вы все в одно смешали - это ужас

    • @MrKim-pt2vm
      @MrKim-pt2vm 3 месяца назад

      @@СергейШульга-ю5ю дай ссылку на свой github с кодом

    • @MrKim-pt2vm
      @MrKim-pt2vm 3 месяца назад

      ​@@СергейШульга-ю5юне получилось

  • @defuz9766
    @defuz9766 2 месяца назад

    Что такое парсинг?

  • @andreifes1702
    @andreifes1702 3 месяца назад +1

    После 2 ой минуты я устал ржать и ушел

  • @_test_test
    @_test_test 2 месяца назад

    мне не хватило в начале контекста, почему не забрать данные по апи

    • @darktmdarkness6952
      @darktmdarkness6952 2 месяца назад

      потому что в браузерном апи, тебя блокнут по tls-fingerprint, и обычному фингерпринту.
      топовые парсеры озонов и прочих, работают с мобильным апи, но как писать такие парсеры, никто никогда не раскажет, ибо это и есть самый прибыльный хлеб разработчиков.

    • @easychanel787
      @easychanel787 2 месяца назад

      @@darktmdarkness6952а в чем проблема? Вытащить из андроид приложения апи?

  • @leogsa1
    @leogsa1 3 месяца назад

    Вы серьезно? я вам оставил развернутый комент про 5 ошибок в вашем скрипте и вы его сразу снесли?
    Вы ж сами просите - "помогите. исправьте. напишите в коментах"

    • @PythonToday
      @PythonToday  3 месяца назад

      Комменты не удаляю, у ютуба ведь свой фильтр. Видимо что-то не понравилось :/

    • @leogsa1
      @leogsa1 3 месяца назад

      @@PythonToday может быть. там были куски с кодом - может вирусом посчитал...
      попробую тогда еще раз )

    • @leogsa1
      @leogsa1 3 месяца назад

      @@PythonToday не, это нереально. я уже полчаса сижу пытаюсь это отправить - оно сразу моментально удаляется. я уже и цитаты кода максимально заменил и сократил - всё равно. Ну ил ладно. Странно. Под видео о коде нельзя писать код... Вот это они перегнули с защитой.

    • @leogsa1
      @leogsa1 3 месяца назад

      @@PythonToday Я вам 3 пул реквеста на гитхабе отправил. посмотрите, что я имел в виду.

    • @evilLincoln
      @evilLincoln 3 месяца назад

      Вроде Ютуб трет комменты где хеш есть похожий на id видео Ютуба. По крайней мере сам это замечал

  • @user-bu3hzj734e4r
    @user-bu3hzj734e4r 3 месяца назад +1

    Почему в видео, как заработать миллион, рекламируют курсы за 1т.р.? Хотя, о чем это я.. 😅

    • @tudupidupu
      @tudupidupu 2 месяца назад

      Диверсификация

  • @Bodhi-c3v
    @Bodhi-c3v 3 месяца назад

    Комментарий под видео

  • @HastaLM1987
    @HastaLM1987 2 месяца назад

    Цена до скидки не имеет значения, там ставится цифра от болды лиж бы была выше цены для покупателя. Тупо маркетинг. Говорю как продавец на ОЗОН )))
    Все данные можно было собрать на странице товаров, цена, название, рейтинг, кол-во отзывов и не подгружать отдельно каждый товар.
    Ваши уроки всегда интересны и познавательны, смотрю уже несколько лет.

  • @rofl6233
    @rofl6233 3 месяца назад +1

    А для чего вообще нужно парсить маркетплейс? Может кто рассказать в чём тут заработок? 🙄

    • @darktmdarkness6952
      @darktmdarkness6952 2 месяца назад

      чей заработок? Если автора, - то в выполнении заказа по написанию скрипта для парсинга. ЕСли заказчика, то скорее всего он продавец, и ему нужно вытягивать информацию для каких-то своих целей. В ручную он тратит на это кучу времени, проще автоматизировать. И да топовые и быстрые парсеры макретплейсов стоят дофига и пользуются достаточно большим спросом.

  • @alexsmitt2140
    @alexsmitt2140 3 месяца назад +2

    озон, как и яндекс, а теперь как и вайлдериз - подконтрольные государству площадки и заработать там не удастся, т.к. где государство наложило свою руку - там будет деградация. Почему спустя годы, автор всё так и остался на уровне парсеров страниц в интернете? Где мотивирующие ролики по обходу блокировок, создание чего-то уникального....у вас же и так уже куча роликов про парсеры и боты вк...пора расти дальше, а не питаться постоянно молоком. дизлайк.

    • @rebuilderowner78673
      @rebuilderowner78673 3 месяца назад +1

      Не хочется токсичить но соглашусь, парсеры это не так то и уровень программирования, собирать инфу... Ну такое. Вот создать сервис какой то полезный, объяснить простыми словами, вот дело

  • @Ира-е7ю
    @Ира-е7ю 6 дней назад

    все изучите на курсе яндекса, но работу не найдете))

  • @Studio-d4g3g5
    @Studio-d4g3g5 3 месяца назад +2

    Бесполезный парсер, быстро перестанет работать потому что озон часто меняет структуру и названия html элементов, + очень медленный

    • @NHL4
      @NHL4 3 месяца назад

      Подскажите, пожалуйста, а как это можно исправить? Писал парсер для сайта "зоозавр" такая же проблема была, что названия элементов часто менялись, чуть ли не каждый день

    • @rebuilderowner78673
      @rebuilderowner78673 3 месяца назад

      ​@@NHL4по элементу в массиве а не по имени его вызывать и все

    • @_test_test
      @_test_test 2 месяца назад

      аттрибуты динамичные - это да, но вот структура то та же самая) можно использовать xpath и идти по индексам вглубь

  • @johnconnor632
    @johnconnor632 3 месяца назад

    А с приложения api не даёт?

    • @johnconnor632
      @johnconnor632 3 месяца назад

      Чекнул. Там apk, над поковырять, разобрать генерации заголовков

    • @_test_test
      @_test_test 2 месяца назад

      кстати не понял прикола, что многие парсеры маскируются под запросы с моб приложения. единственное что приходит на ум - там нет куки и проще авторизация

    • @johnconnor632
      @johnconnor632 2 месяца назад

      @@_test_test в 90% случаев там открытое API, т.е данные получаешь в JSON. Если не отдает данные, запускаешь frid'у, обходишь ssl pinning и получаешь желанный доступ к api

  • @Планынадень-и1ж
    @Планынадень-и1ж 2 месяца назад +1

    На озоне столько роботов...и выкупают кучу всего...плохо что магазин не борется против роботов..им плевать..

    • @Toki-
      @Toki- 2 месяца назад

      Если плкупают - хорошо, остальное плевать. Я б также глаза закрыл на это, выгодно ж)

  • @Сергей-у6ю6ф
    @Сергей-у6ю6ф 2 месяца назад

    зачем нам это нужно не подскажите?
    парсинг товаров

  • @quickliker
    @quickliker 3 месяца назад

    Вместо print лучше используй logging
    Разницы почти никакой, но это хороший тон, и показывает твой профессионализм

  • @MrQuazar
    @MrQuazar 3 месяца назад

    Нельзя так скачать библиотеку, запустить скрипт пойти попить чайку, а по приходу обнаружить: что взял все виды импотек, продал всю недвижку, и задонатил все бабки ВСУ и оформил заказ на прекурсы на свой домашний адрес? 😂