Парсинг сайта в эксель

Поделиться
HTML-код
  • Опубликовано: 19 окт 2020
  • Третий способ парсинга сайтов в эксель.
    Ранее мы рассматривали два различных способа парсинга:
    Первый способ парсинга - выгрузить и разобрать простынь текста в HTML при помощи VBA. Мы выкачиваем километраж между городами в таблицу Excel. Ссылка на этот парсер здесь: • Парсинг сайтов в Excel...
    Второй способ - это загрузка таблиц из интернета при помощи надстройки PowerQuery. С помощью этой надстройки мы выкачивали в таблицу данные по продажам новых автомобилей в России по годам. Вот ссылка на это видео: • Данные с сайта в эксел...
    И третий способ, показанный в этом видео - это использование древнего способа загрузки данных при помощи Excel, который с нами еще года эдак с 2003, а может и раньше.
    В этот раз выкачиваем контактные данные управляющих компаний Москвы.
    Хочется еще?
    Вот мой телеграмм канал: t.me/TrueExcel
    Контакт для связи: t.me/Pavel_Taranukha
    realxls
    dzen.ru/real_excel
    vc.ru/u/2288927-realnyy-eksel
    Да и просто подписывайтесь - люблю, когда растут цифры ;-)

Комментарии • 98

  • @NNN-vd7lh
    @NNN-vd7lh 2 года назад +5

    Лайк чисто за фразу "как правильно? хрен его знает, посмотрим как можно" )))

  • @maxony79
    @maxony79 3 года назад +14

    реальный человек , реальный эксель , добыл парсинг. На самом деле , спасибо , все очень здорово , приятная подача информации.

  • @natos5710
    @natos5710 7 месяцев назад

    Огромное спасибо за это видео. До вашего урока никогда парсингом не занималась. Была первая попытка. Благодаря вам сделала. Правда не с первого раза, но справилась)

  • @FedoskinYuriy
    @FedoskinYuriy 4 месяца назад +1

    Ну, реально восторг! Все парсят на питонах-шматонах, на крайняк через ПХП и прочие высокоуровневные ЯПы с ООП, а тут обычный Ёксель с Вижуалбэйсиком! Благодарю от души! 100500 лайков и мотивация почитать про VB побольше, ибо знания простого функционального программирования в Паскале, Фортране и Фоксбейсе позволят спокойно повторить ваш парсер. 😃🤘👍💪🙏

    • @Pavel_Taranukha
      @Pavel_Taranukha  4 месяца назад +1

      Это только для мелких задачек и когда другого ничего под рукой нет.
      Для серьезного промышленного парсинга это не подойдет конечно))

    • @FedoskinYuriy
      @FedoskinYuriy 3 месяца назад

      @@Pavel_Taranukha Понятное дело. Но, во-первых, Ёксель жив и Бейсик тоже! :)) И во-вторых, понятен алгоритм, который можно сработать как вручную, так и на кодить. А это - самое главное! ;)

  • @siberian_medwed
    @siberian_medwed 2 года назад +4

    Очень прикольно. Но все таки это как молотком забивать саморезы, предварительно вытаскивая их из ленты, и смазывая оливковым маслом...

  • @user-ko4le8pl5d
    @user-ko4le8pl5d 2 года назад +1

    Спасибо , очень круто 👍

  • @user-gm1ws2cv4q
    @user-gm1ws2cv4q 3 года назад

    Подписался. Всё доступно и по делу.

  • @Tommy7417
    @Tommy7417 2 года назад

    Спасибо, Вам! всегда в видео понятно и доступно показано, и можна применть в жизни, а не только в теориии.

  • @lipartem
    @lipartem 3 года назад +1

    Спасибо! Молодец.

  • @user-ck9bm2kz4p
    @user-ck9bm2kz4p 2 года назад +1

    Павел - вы просто бог Екселя: Индекс; Поискоз, фильтра и немного VBA = парсер любого проекта! Вы сделали мой месяц!

    • @Pavel_Taranukha
      @Pavel_Taranukha  2 года назад

      Ахах)))
      Ну не любого.
      Когда данных много - лучше питончика изучить)

  • @user-mf5pw1xw7r
    @user-mf5pw1xw7r 2 года назад +1

    Супер 👍🏻

  • @MAX-pw3vn
    @MAX-pw3vn 3 года назад +1

    В начале ролика после слов "хрен его знает как, но давай опробуем", я подписался!!!!

    • @Pavel_Taranukha
      @Pavel_Taranukha  3 года назад +2

      Вы тоже считаете, что это показывает экспертность? А маркетологи со мной спорят))

    • @MAX-pw3vn
      @MAX-pw3vn 3 года назад

      @@Pavel_Taranukha нет, как раз это и есть высший пилотаж. Эксель знать на все 100% физически не возможно, кто так говорит - значил брехун. Профессионал всегда скажет понятия не имею как, но сделаем... у меня 1С -ник такой, какие задачи ему не ставь, понятия не имеет как делать, но через сутки готово )))))

    • @georgyvartanov4603
      @georgyvartanov4603 3 года назад

      @@MAX-pw3vn где он - 1С ? я ему поставлю задачу.

    • @SV-13
      @SV-13 3 года назад +2

      Чем отличается опытный погромист от обычного?
      На вопрос, можно ли решить эту задачу, обычный отвечает, что ему надо подумать.
      А опытный говорит, что конечно, возможно, просто он пока не знает, как именно )))

    • @MAX-pw3vn
      @MAX-pw3vn 3 года назад

      @@SV-13 полностью согласен

  • @online-ocenka
    @online-ocenka 3 года назад

    спасибо все по делу

  • @user-eb3ec8rg6w
    @user-eb3ec8rg6w 2 года назад

    Обалдеть!

  • @antonpupkin483
    @antonpupkin483 3 года назад

    все отлично рассказал,показал.хотелось бы развернуто и по нескольким примерам,но тогда своя голова вообще перестает думать.

    • @antonpupkin483
      @antonpupkin483 3 года назад

      И вопрос есть: как исправили ошибку на 15:57, у меня не получилось,отправил другому человеку-то же самое,не работает и исправить не получилось.В интернетах пишут-это начинается после использования CTRL+Pause Break в больших файлах и повторное прожатие поможет,не помогло

    • @Pavel_Taranukha
      @Pavel_Taranukha  3 года назад +1

      Так там просто заменена прямая ссылка на лист обращением к selection.

  • @McMaruhin
    @McMaruhin 2 года назад +1

    777 лайков))) так не охото портить цифру)

  • @VladimirKuznetsov
    @VladimirKuznetsov 2 года назад

    Даже не подозревал, что Excel так умеет. Спасибо за ролик. Однако парсить питончиком получается быстрее.

    • @Pavel_Taranukha
      @Pavel_Taranukha  2 года назад +1

      Согласен. Экселька для простеньких выгрузок.

  • @dmitriy2502
    @dmitriy2502 2 года назад

    Здравствуйте! При парсинге страницы в навигаторе power query выходит список таблиц? далее нужно выбрать нужную таблицу и нажать Преобразовать данные. Вопрос, можно ли сделать так: На странице excel в первой ячейке указать ссылку на нужную страницу в интернете чтобы запрос брал данные из нее (ЭТО РЕАЛИЗОВАНО), далее ниже во второй ячейке указать имя таблицы, например Москва, нужно чтобы навигатор фильтровал список таблиц по этой ячейке, а дальше все как обычно забирал отфильтрованную таблицу в преобразование данных, возможно ли такое?

  • @user-wk4pw6uv4w
    @user-wk4pw6uv4w 3 года назад +2

    Добрый день! Как было Вами сказано: "Видосы не зря...". Спасибо, все доступно, "живые" кейсы. Сошлюсь на Вашу реплику про интерес к комментариям - вопросам. Я не "думаю" на уровне формул Excel, макросов VBA, запросов Power Query, но очень хочу работать с данными как и Вы, хотя-бы на 17%. Так вот, поставил перед собой задачу, примерно знаю куда копать, но нет практики... В общем сейчас задача такая, есть сайт, разработчики внедрили EDI, опубликовали API. Казалось бы, собирай данные, кто мешает... Но, как говорил, опыта маловато. Не могли бы Вы "запилить" видос о том, как забирать данные с сайта, работая в Excel используя API?

    • @Pavel_Taranukha
      @Pavel_Taranukha  3 года назад +1

      Ну что делать... про вайлдбериз апи расскажу, раз вы своих апишек не даете)

  • @ogohtv
    @ogohtv 2 года назад +1

    Это коментарый от сердца

  • @archinewtontv1104
    @archinewtontv1104 2 года назад

    круто)

  • @sbersvet
    @sbersvet 3 года назад +1

    Подпись и лайк! Очень нужно парсить свойства товара из карточек для создания таблицы загрузки на сайт через битрикс. Сайты производителей, выгрузки с сайта не дают, лень им заниматься этим... 🤦‍♂️

    • @Pavel_Taranukha
      @Pavel_Taranukha  3 года назад

      Какие странные производители. Многие сейчас напротив 99% работы за продавца делают. Вон хоть поставщиков озона и вайлдберриз взять...

    • @andreislashikov9618
      @andreislashikov9618 2 года назад +1

      На кворке за 500р купи парсер

  • @shalkarzhumakhanov3638
    @shalkarzhumakhanov3638 Год назад

    Super 🙏🏽

  • @Gvalt10
    @Gvalt10 3 года назад +1

    Классная подача! А можна на примере Инстаграмма сделать? Чтобы по логинам аккаунтов узнавать информацию о профиле (Количество подписок, подписчиков и публикаций)?

    • @Pavel_Taranukha
      @Pavel_Taranukha  3 года назад

      Так вроде телеграмм боты это все умеют

    • @Gvalt10
      @Gvalt10 3 года назад

      @@Pavel_Taranukha не нашел такого) если есть такой дайте знать как его найти)

  • @dmitrythinker396
    @dmitrythinker396 3 года назад +2

    Как из парсинга сделать отправку сообщений в телеграмбота

  • @MegaAlex1331
    @MegaAlex1331 2 года назад

    Здравствуйте!
    Подскажите как спарсировать комменты с ответами под роликом ютуба.
    Спасибо

  • @justlook9057
    @justlook9057 2 года назад

    Крутые видео

    • @Pavel_Taranukha
      @Pavel_Taranukha  2 года назад

      Спасибо. Делюсь наработками чтобы и самому не забыть))

  • @jacksparow5289
    @jacksparow5289 3 года назад

    Здравствуйте! Спасибо за уроки. Подскажите пожалуйста возможно ли импортировать данные с локальных сайтов.
    Пример : Есть небольшая внутренняя сеть и несколько сетевых принтеров с локальными веб сайтами (пример https:\\10.10.10.125) . Где есть информация о состоянии расходных материалов % расхода тонера.
    Можно ли вытащить данные в общую exel страницу где будет общая информация о тонере каждого принтера . Через Power Query не видит таблицы.

    • @Pavel_Taranukha
      @Pavel_Taranukha  3 года назад

      Здравствуйте. Не открывается ваш айпишник(

    • @jacksparow5289
      @jacksparow5289 3 года назад

      @@Pavel_Taranukha ип внутри сети, через интернет не доступен :( написал я его как пример (что не совсем обычная веб страница)

    • @Pavel_Taranukha
      @Pavel_Taranukha  3 года назад

      Ищите итшников, которые публикуют эту страницу и забирайте данные либо с вебсервиса, либо из СУБД учетной системы, которая является поставщиком данных для внутреннего вебсервиса.
      Парсинг он больше от безысходности, когда вы не можете получить данные другим способом. В вашем случае - есть повод найти контакт с интересными итэшниками, которые смогут быть полезны и в других начинаниях )

    • @Pavel_Taranukha
      @Pavel_Taranukha  3 года назад +1

      Тьфу ты... какие еще вебсервисы, что я несу. Принтеры же у вас!) Попробуйте подход к парсингу где про поиск расстояний между городами. Должно вам подойти. Суть в том чтобы считать хтмл в память и из текста вытащить нужную инфу. На канале посмотрите.

  • @crimesceneinvestigator2370
    @crimesceneinvestigator2370 3 года назад +1

    МУЖИК, ты реальный мужик! А есть ли способ экселем (другого не осилю) получать данные с динамическим контентом??, где дивы примерно такого плана: и при просмотре чистого кода страницы он не отображается. т.е. они могут генерироваться во время просмотра страницы.

    • @Pavel_Taranukha
      @Pavel_Taranukha  3 года назад

      Нужно пробовать. Здесь на канале лежит уже три способа парсинга. Может какой и подойдет.

  • @SmithJoneJr
    @SmithJoneJr 2 года назад +3

    Было бы весьма желательно, чтобы кто-нибудь из "гуру" описал алгоритм распределения строк внутри ячейки по столбцам. В стандартной функции Excel нет возможности ввести в поле "своего разделителя" возврат каретки

    • @Pavel_Taranukha
      @Pavel_Taranukha  2 года назад

      Ну раз так уж желательно - держите...
      ruclips.net/video/oF5m_xAabW4/видео.html

    • @Pavel_Taranukha
      @Pavel_Taranukha  9 месяцев назад

      альт + ентер

  • @Tommy7417
    @Tommy7417 Год назад

    А если на сайте нужна авторизация? Можно реализовать?

  • @user-wp7yq7kb2n
    @user-wp7yq7kb2n 3 года назад

    Я только начинаю изучать эту тему и ваш пример помог создать парсер. Но пока делала, на сайте обновилась информация и при запуске парсера выскакивает сообщение, что не может найти объект в колонке номер. Как в этом случае поступать, перед запуском обновить саму базу номеров или как-то в макросе это можно прописать? В макросах не сильна.

    • @Pavel_Taranukha
      @Pavel_Taranukha  3 года назад

      Из всех вариантов всегда выбирайте тот, который работает)
      У меня обычно работает вариант сделать блок, который перестал работать заново.
      Это помогает или вспомнить старое или найти новые подходы.
      В любом случае - кроме пользы никакого вреда.

    • @user-wp7yq7kb2n
      @user-wp7yq7kb2n 3 года назад

      @@Pavel_Taranukha Я нашла решение, просто в макросе изменяю номер строки с какой надо начать парсинг, работает)))

  • @user-jw1if1lg4u
    @user-jw1if1lg4u 3 года назад

    😷👍

  • @user-mf8br1vq3j
    @user-mf8br1vq3j 2 года назад

    Пожалуйста сделайте видео как работать с спортивной статистикой (Футбол) в Excel.

    • @Pavel_Taranukha
      @Pavel_Taranukha  2 года назад

      Совершенно не разбираюсь в командных видах спорта.

  • @AleksandraChebotova
    @AleksandraChebotova 2 года назад

    Добрый день! подскажите, а как найти данные-из интернета. нет такой иконки в Данные

    • @odmitv
      @odmitv 2 года назад

      У вас возможно старая версия excel

  • @povalyaev
    @povalyaev 2 года назад

    Добрый день! Как можно обойти Cloudflare Email Protection ? Вместо email выгружает [email protected] :(
    UPD. Сохранил и закрыл файл, открыл заново, запустил скрипт и почты подтянулись, обошлась блокировка!
    Спасибо вам огромное, сэкономили мне кучу времени!

  • @Rusia-16
    @Rusia-16 Год назад

    Все это не прокатит с сайтом wildberries. Он не выводит все теги и ссылок в коде страницы тоже нет.

  • @user-zm6lf6lx9l
    @user-zm6lf6lx9l 9 месяцев назад

    😮

  • @maxony79
    @maxony79 3 года назад

    Напрямую с авито в эксель кто нибудь пробовал парсить?

  • @user-wc3mw6bu4n
    @user-wc3mw6bu4n 2 года назад

    ...попробуйте загрузить Тарифы ЖКХ в Москве на текущий год.

  • @user-zt4xi5kj7j
    @user-zt4xi5kj7j 3 года назад

    Здравствуйте, как с вами можно связаться ?

  • @vadimzolotukhin1773
    @vadimzolotukhin1773 2 года назад

    Easy)

  • @odmitv
    @odmitv 2 года назад

    Попробуйте чрз Power query, это быстрее и проще. ИМхо

  • @ogohtv
    @ogohtv 2 года назад

    Пожалуйста сделайте видео о том КАК ПАРСИТЬ НОМЕРА ТЕЛЕФОНОВ ПО ОПРЕДЕЛЕНЫЕ КАТЕГОРИИ В АВИТО

    • @silicon_man8998
      @silicon_man8998 2 года назад +1

      Parsing через python

    • @Pavel_Taranukha
      @Pavel_Taranukha  2 года назад

      Да. Если не помогает эксель, может помочь нечто другое)

    • @ogohtv
      @ogohtv 2 года назад

      @@Pavel_Taranukha я реально пользуюсь вашими идеями на работе спасибо вам за всё

    • @Pavel_Taranukha
      @Pavel_Taranukha  2 года назад

      Пожалуйста. Но в случае парсинга больших данных лучше действительно посмотреть на питон. Такие библиотеки, как requests например.
      Тот-же повер квери иной раз такие неожиданные сюрпризы подкидывает, что аж кишки шевелятся)

  • @user-dg2yk2ol4l
    @user-dg2yk2ol4l 3 года назад

    ))) " я особо не силен в этом"..... нуну)))

  • @ledakol3027
    @ledakol3027 2 года назад

    Парсер стоит 1000-2000 рублей ) включите в расходы ) Эксель нехрена не быстро

  • @smyrnovroman5893
    @smyrnovroman5893 3 года назад

    Нифига се

    • @Pavel_Taranukha
      @Pavel_Taranukha  3 года назад

      Сам в шоке. Случайно получилось)

  • @figaro2440
    @figaro2440 Год назад

    эксель для этого не предназначен, куча же редакторов для кодинга, работать с json в экселе это глупость.

    • @Pavel_Taranukha
      @Pavel_Taranukha  Год назад

      Интересно для кучи чего предназначена глупость...

    • @figaro2440
      @figaro2440 Год назад

      @@Pavel_Taranukha Вы решаете проблему, но решаете ее с использованием костылей и инструментов которые для этого не предназначены. Микроскопом действительно можно забивать гвозди, но вроде как в свободном доступе бесплатно куча молотков на любой вкус, но это видимо не ваш путь...

    • @Pavel_Taranukha
      @Pavel_Taranukha  Год назад

      Опять эти гвозди, микроскопы, молотки. Иногда просто некогда искать молоток и разбираться с какой стороны у него ручка)
      Эксперты по специальным молоткам обычно живут в своем молоточном мире и их молотки могут забивать гвозди только в специально построенном для их молотка цеху)

    • @figaro2440
      @figaro2440 Год назад

      @@Pavel_Taranukha Лучше день потерять, потом за 5 минут долететь)

    • @Pavel_Taranukha
      @Pavel_Taranukha  Год назад

      Да иной раз овчинка настолько выделки не стоит, что и 30 минут жалко)
      Понятно, что если парсить какой-то вайлдберриз или авито - эксель не подойдет.
      Но когда нужно табличку с сайта впитать с ценами - так и зачем все эти питоны с их прекрасными библиотеками курить)
      Всегда же упираемся в целесообразность и соотношение приобретенного результата к затраченным усилиям.
      А это не всегда глупость.

  • @Bozon_Higgsa
    @Bozon_Higgsa 2 года назад

    ...

  • @liliyali285
    @liliyali285 4 месяца назад

    как вытащить номера телефонов компаний у меня все в одну кучу сделалось совсем в одну ужас

  • @1975nacgul
    @1975nacgul 7 месяцев назад

    парсинг через жопу называется.