SCRAPY - парсинг на PYTHON

Поделиться
HTML-код
  • Опубликовано: 26 дек 2024

Комментарии • 78

  • @Daniel-mp7bv
    @Daniel-mp7bv Год назад +12

    Музон из космических рейнджеров топчик! Спасибо за ролик!

    • @шмяка
      @шмяка 28 дней назад +1

      Тоже зашёл в комменты написать это.))) Как раз недавно перепроходил.)

  • @ruslansayfullin6194
    @ruslansayfullin6194 Год назад +11

    Треугольнику лайк не глядя.

  • @egorm8952
    @egorm8952 Год назад +2

    Треугольник, привет! Лайк сейчас, но видео посмотрю после работы))

  • @DrW1ne
    @DrW1ne Год назад +3

    не знал что есть такой фреймворк , КРУТО

  • @dannicroosser5869
    @dannicroosser5869 Год назад +4

    Чесно , вчера пересматривал ролик с селеум и думал уже использовать , телепатия не как иначе😂

  • @aleksandrdemidov6058
    @aleksandrdemidov6058 Год назад +3

    а как насчет с сайтами-приложениями на js?

  • @decentar9712
    @decentar9712 Год назад +1

    За музло из готики лайк не глядя!

  • @mak32
    @mak32 Год назад +2

    Красавчик, 👍 за группу инэкстремо из старого лагеря 😂

  • @Amigun_yo
    @Amigun_yo Год назад +2

    Вместо XPath в scrapy можно использовать CSS. Это намного удобнее) Также, scrapy легко комбинируется с selenium, что может упростить парсинг некоторых сайтов

    • @МаксКар-н2ц
      @МаксКар-н2ц Год назад +1

      Легко комбинируется? А Подробнее можно?

  • @АртемП-ъ9ь
    @АртемП-ъ9ь 3 месяца назад

    Музыка из готики))) Обожаю)

  • @ctf59
    @ctf59 Год назад +2

    Попробую выразить мысль....)
    Т.е если паук уйдет по ссылкам далеко(например на 10М) в глубь ресурса и далее остановиться по X/Y причине, он автоматом 'поднимется' до самой верхней(в самое начало) возьмет следующую ссылку и пойдет дальше? Т.е Он тупо не остановится пока не обойдет все дерево целиком?

    • @nikolyayakimenko6986
      @nikolyayakimenko6986 10 месяцев назад

      там цикл внутри цикла, если шаришь пайтон то сразу поймешь но по сути да

  • @instalooker
    @instalooker Год назад +1

    Кто-то от лола тащится, Камилла на обоине

  • @jerryscrooge
    @jerryscrooge Год назад +1

    Камилла 😍

  • @mkuznetsoff
    @mkuznetsoff Год назад +8

    Привет, треугольник! Хотел бы спросить у тебя, планируется ролик о создании собственной электронной почты? Конечно, с chatgpt и прочими это сделать не составляет особого труда, но хотелось бы послушать тебя)

    • @cyber_engine
      @cyber_engine Год назад

      сервак почты на сокетах то?)))

    • @БогданЯвич
      @БогданЯвич Год назад +1

      Сам по себе никакой не программист, но потратил 3 дня, что б запустить свой почтовый сервер, настроить домен и подобную чепуху, а все ради того что б наебать ейрбиэнби на 50 баксов

  • @ATa1ent
    @ATa1ent 4 месяца назад

    А как можно спарсить контакты любых YT каналов?

  • @ПищащийГолландец
    @ПищащийГолландец Год назад +3

    Да, хороший фреймворк, давно использую. Но для парсинга уже есть более мощные штуки с фейк юзер агентами, прокси и прочими плюшками.
    Годные видосы👍

    • @Eric_Cartman357
      @Eric_Cartman357 Год назад +1

      Скинь ссылки плз

    • @ГенрихКраус-ч7г
      @ГенрихКраус-ч7г Год назад +1

      И мне если можно, спасибо

    • @verh010m2
      @verh010m2 Год назад

      raise NotImplementedError

    • @ПищащийГолландец
      @ПищащийГолландец Год назад

      @@verh010m2 ссылку дать не могу, ибо подобные штуки используют спецслужбы. Но кто знает где искать, тот использует🤐

    • @Eric_Cartman357
      @Eric_Cartman357 Год назад

      @@ПищащийГолландец А где искать?

  • @urbanbionics
    @urbanbionics Год назад +3

    *antibot system like this video*

  • @dmytrob7336
    @dmytrob7336 Год назад +4

    Надо копать дальше, парсинг через Selenium

    • @ToNNaG
      @ToNNaG Год назад

      Seleniumbase имхо поинтереснее

  • @Дмитрий-е9р5т
    @Дмитрий-е9р5т 4 месяца назад

    Зашёл чтобы пет-проект сделать, а по факту в рейнджеров пошёл играть

  • @Anonim-im6ln
    @Anonim-im6ln Год назад

    О, пробував цей фреймворк:) Гарне відео:)👍

  • @Hi-gjgruncdun
    @Hi-gjgruncdun 11 месяцев назад

    А как написать паука с учетом пагинации, чтобы условное имя и прайс собирались не только с первой страницы?

  • @Павел-ь8ш9ь
    @Павел-ь8ш9ь Год назад +1

    А как у него обстоят дела с обходом защиты?

  • @Vinchek
    @Vinchek 7 месяцев назад

    Привет. Случилось такое что парсер почему то дублирует товары с страницы. Я так вижу что это не редкие случаи. Парсю с помощью Web Scraper, может кто знает в чём проблема?

  • @Handri_
    @Handri_ Год назад

    А как можно спросить таблицу с сайта, но проблема в том, что таблица грузиться после перехода по ссылке. Пытался использовать selenium и ждать появления таблицы, но он парсит только заголовок таблицы, как я понимаю, потому он подгрущился первым, а остальное тело нет

    • @Black_Triangle
      @Black_Triangle  Год назад +1

      Дайте команду на прокрутку страницы вниз после ее загрузки.

    • @ToNNaG
      @ToNNaG Год назад

      import time, sleep (5) ??? И попробуй seleniumbase, меньше кода писать

  • @densaface
    @densaface Год назад +1

    здорово, а нельзя ли на сервере vps ubuntu делать не только парсинг, но и совершать действия через гет и пост запросы с имитацией на нажатие кнопок на гугл-коллаборации? очень нужно для работы. В любом случае спасибо большое за труд, вложенный в это видео!

    • @montecristo31
      @montecristo31 Год назад

      selenium?

    • @densaface
      @densaface Год назад

      @@montecristo31 чтобы войти в гугл колаборацию, нужно залогиниться под гугл аккаунтом, а в селениуме он не пускает

    • @narcomann1646
      @narcomann1646 Год назад

      @@densaface selenium-stelthe

    • @Рисенко-э1з
      @Рисенко-э1з Год назад

      playwright

    • @densaface
      @densaface Год назад

      @@Рисенко-э1з спасибо, интересная штука, буду пробовать

  • @lesharom2405
    @lesharom2405 Год назад +1

    Полезная штука.

  • @ОлегИванов-я2ж5и
    @ОлегИванов-я2ж5и Год назад

    Почему нету ни слова про программу Scrapy GUI?

    • @Tosha.V
      @Tosha.V Год назад

      потому что только хардкор)

  • @Hayz3301
    @Hayz3301 Год назад

    Здоров, треугольный!

  • @pinggay3234
    @pinggay3234 Год назад +2

    Ролик, конечно интересный, но я слушал музыку из Космических Рейнджеров на заднем плане

  • @BasR
    @BasR Год назад +1

    лучше быть депутатом госдумы не нужно ничего знать и получать от 400К или для девушек женой(гражданской) президента

  • @userfromworld
    @userfromworld Год назад

    Вчера первый раз использовал, супер либа

  • @x_a1r_x
    @x_a1r_x Год назад

    Офк круто, но надо понимать, что scrapy только на linux-подобных системах

  • @Данила-з5л
    @Данила-з5л Год назад

    Наконец то чтото кроме chat gpt и его свободных аналогов

  • @negonifas
    @negonifas Год назад

    Класс, ни чего нового конечно. Но музыка из рейджеров.. А-х-х-х-х-х-х-х-х-х

  • @haxidenti6001
    @haxidenti6001 Год назад

    Парсинг чего? Сайтов? тю

  • @rabbitg0r
    @rabbitg0r Год назад

    space rangers 4ever

  • @FoxRedmiNote
    @FoxRedmiNote Год назад +1

    Замечательно 👍

  • @leonidussaks
    @leonidussaks Год назад +1

    zero hour gang

  • @МаксимКарелин-и8в

    Спасибо

  • @Лекс-ъ4я
    @Лекс-ъ4я Год назад +1

    Готика лайк

  • @Павел-ь8ш9ь
    @Павел-ь8ш9ь Год назад

    Прервью топ

  • @VladMair
    @VladMair Год назад

  • @7778-d2i
    @7778-d2i Год назад

    👍🏻

  • @konstantinstalnoy9584
    @konstantinstalnoy9584 Год назад +1

    Как это возможно 3 просмотра и уже 10 лайков😅

  • @ПррИии-щ3г
    @ПррИии-щ3г Год назад

    Да он святой, чёрт возьми 🎉🎉🎉😊

  • @c4llv07e
    @c4llv07e Год назад +1

    Я не понимаю python разработчиков - вот зачем тут наследование класса? Для работы скраппера надо изменить всего один параметр и одну функцию, неужели нельзя было сделать обычную функцию, которая принимает функцию парсинга и список ссылок? Почему каждая вторая библиотека говорит "смотри как я могу" и лезет в интерналы питона. Надоело.

    • @narcomann1646
      @narcomann1646 Год назад

      хз, я такую муть только на скрапи видел

    • @c4llv07e
      @c4llv07e Год назад

      @@narcomann1646 да тот же стандартный unittest, который даже про декораторы не знает и ищет функции по окончанию названия.

    • @hehe2390
      @hehe2390 Год назад

      Scrapy является полноценным фреймворком, по типу Django, то есть можно создать проект командой "scrapy startproject" - с готовой файловой структурой, конфигурацией и с инструментами для отладки.
      А по поводу изменить только один параметр и одну функцию - на деле далеко не так, показанный в видео пример ну прям очень простой.
      К примеру чтобы спарсить какой нибудь сайт с товарами, тебе будет необходимо написать как минимум 3 фукнции:
      1. Функция которая парсит все ссылки на категории товаров.
      2. Фукнция которая парсит все страницы каждой категории и получает ссылку на каждый товар.
      3. Функция которая парсит все характеристики, описание и другие подробности товаров.
      И каждая функция вызывается из предыдущей в качестве аргумента(колбэк функция).

    • @c4llv07e
      @c4llv07e Год назад

      @@hehe2390 Ну и в итоге у тебя получается одна функция, которая работает как мост между scrapy и двумя другими, которые являются обыкновенными функциями.
      Да и в конце концов, это просто очень странный паттерн. Ни в одном другом языке код не исполняется сам по себе только потому, что он был наследован от другого кода.
      Можно ведь просто сделать функцию, которая будет принимать наш класс, это куда логичнее и удобнее.

    • @hehe2390
      @hehe2390 Год назад

      Ааа, не помню что там в видео, но парсер запускает объект CrawlerProcess, у которого есть метод crawl, который принимает аргументом наш спайдер, это все происходит автоматически, когда мы пишем scrapy crawl. Если я правильно понял, ты думал, что парсер запускается без передачи класса куда либо?@@c4llv07e

  • @garytopor8005
    @garytopor8005 Год назад

    Можешь показать способ, как пересылать посты из телеграмм канала в телеграмм канал ?

  • @galkin_anton
    @galkin_anton 9 месяцев назад

    что насчет robots.txt