Парсим сайт с помощью NodeJS, Cheerio

Поделиться
HTML-код
  • Опубликовано: 29 июн 2020
  • В этом видео мы рассмотрим библиотеку Node.js, Cheerio, которая является jQuery-подобным инструментом для сервера, используемого в веб-парсинге.
    ⭐️Подпишись и поделись видео с друзьями!
    / @balkoev
    ⭐️ Ссылки
    Github: github.com/balkoev/cheerio-js...
    ⭐️ Мои соц. сети
    Инстаграм: / adam_balkoev
    Вконтакте: adam_balkoev

Комментарии • 33

  • @user-sx6cg1qi3z
    @user-sx6cg1qi3z 3 года назад +18

    Он: Получить детей от первого встречного элемента...
    Я: Да. 🗿

  • @user-be8yk8wi4x
    @user-be8yk8wi4x 4 года назад +5

    С возвращением 👍🏻✨

  • @SanT_OG
    @SanT_OG 10 месяцев назад +1

    Адам, ты лучший

  • @tigranovakyan4913
    @tigranovakyan4913 3 года назад +1

    Обнимаю крепко крепко бро!!! объясняешь супер!!

  • @sierraww2
    @sierraww2 2 года назад +1

    Спасибо! Всё круто объяснил) Мне с завода всё понятно)))

  • @Artema2334
    @Artema2334 3 года назад

    Видео суперское, огромное спасибо

  • @Vlad6817
    @Vlad6817 3 года назад

    Бро, спасибо за контент!!!!

  • @khizirabdeev9236
    @khizirabdeev9236 Год назад

    Адам ты лучший

  • @youdotaalex1229
    @youdotaalex1229 2 года назад

    Добрый день! Подскажите, как сохранить полученные данные не в файл.txt, а например в массив?

  • @DagestanShop
    @DagestanShop 2 года назад

    какая разница между cheerio и puppeteer ?

  • @user-qe9pd1yk3k
    @user-qe9pd1yk3k 3 года назад

    в видео не описывается сбор ссылок на все карточки и парсинг уже с внутренних страниц информацию, ознакомительный урок

  • @DreamingDolphing
    @DreamingDolphing 3 года назад +2

    Cheerio в идеале должен работать в связке с Puppeteer, чтобы получать динамические страницы.

    • @balkoev
      @balkoev  3 года назад

      Динамические страницы не приходилось парсить, но возьму на заметку)

  • @ineye
    @ineye 3 года назад

    Привет я парсил со стима данные(тоже убил много времени) . Там нужно НЕ по кнопке переходить на след страницу пагинации, а менять url что бы перейти на след страницу. Воот

  • @user-co5bn7hl1r
    @user-co5bn7hl1r 3 года назад

    Привет! Сделал все как рассказывается в уроке, работает. Спасибо. А что делать если кодировка таргетовой страницы win1251 и результат получается абракадабра?

    • @balkoev
      @balkoev  3 года назад

      Привет. Я бы попробовал перекодировать в utf8. qna.habr.com/q/353548

  • @Ruslantuber
    @Ruslantuber 2 года назад +1

    Почти 100% сайтов динамические. Поэтому такой подход не сработает почти на 100% сайтов. Плюс у многих сайтов защита от параметров через кукис. Как здесь работать с кукис?

  • @Vasilii_Shtyrov
    @Vasilii_Shtyrov 2 года назад

    Как сохранять изображения?

  • @noname-ql5ik
    @noname-ql5ik 3 года назад +1

    0 дизлайков, поздравляю!

  • @user-ig7li7ww5x
    @user-ig7li7ww5x Год назад

    Добрый день. Подскажите почему пишет ReferenceError: $ is not defined

    • @balkoev
      @balkoev  Год назад

      Убедись, что переменная $ существует

  • @denial3874
    @denial3874 2 года назад +1

    Как стать программистом: сделайте, пожалуйста, видео про модуль async

  • @hasyoo7551
    @hasyoo7551 3 года назад

    Добрый вечер, не могли бы Вы помочь?
    Я посмотрел Ваше видео "Парсим сайт с помощью NodeJS, Cheerio", и у меня одна проблема, у меня есть сайт, но на нем нет страниц, то есть это просто одностраничный сайт, как его можно парсить?
    По уроку Вы делаете цикл, который перебирает страницы, но у меня их нет, и как можно сделать парсинг?

    • @user-qe9pd1yk3k
      @user-qe9pd1yk3k 3 года назад

      друг, убрать цикл и спарсить данные с одной страницы. А вообще нахера парсить одностраничник, если только на нем не дофига данных

    • @hasyoo7551
      @hasyoo7551 3 года назад

      @@user-qe9pd1yk3k Привет, да уже давно разобрался)))))

    • @igrovojimpotent
      @igrovojimpotent 2 года назад

      @@hasyoo7551 привет, а ты информацию с сайта парсил на свой сайт?

  • @Illya.Landar
    @Illya.Landar Год назад

    *30 строчек кода за час*

    • @balkoev
      @balkoev  Год назад +1

      29 строчек за 46:12 минут

    • @Illya.Landar
      @Illya.Landar Год назад

      @@balkoev )))

    • @Illya.Landar
      @Illya.Landar Год назад

      @Как стать программистом 46:11 😆

    • @TheLittleMaksik
      @TheLittleMaksik Год назад

      И что???

    • @olstan125
      @olstan125 Год назад

      @@balkoev якщо бути точним, то код написаний за 29:17 хвилин)

  • @user-fx3op1ch6o
    @user-fx3op1ch6o 10 месяцев назад +1

    Адам, ты лучший