№411 - ~800 млн. рублей на парсинге открытых данных и анализа СМИ. Завидуем вместе :)

Поделиться
HTML-код
  • Опубликовано: 31 май 2024
  • Еще больше и чаще пишу в канал t.me/bezsmuzi - подписывайтесь.
    За короткое время трижды обсуждал проекты связанные с анализом СМИ. На мой взгляд - просто крутейшая тема, которая будет востребована еще очень долго. Поделился опытом и потребностями потенциальных заказчиков.
    00:00:00 Парсинг открытых данных
    • Идея использования парсинга для анализа упоминаний брендов и технологий в открытых источниках.
    • Крупные компании готовы платить миллионы рублей за такую информацию.
    00:05:31 Бизнес на парсинге
    • Выручка компании "Бренд Аналитикс" составляет 800 млн рублей.
    • Парсинг 60 000 источников, посещаемость сайта 400 000 в месяц.
    • Рынок парсинга гораздо больше, чем для одной компании.
    00:08:10 Преимущества парсинга
    • Подписка на информацию, регулярная оплата.
    • Обработка больших данных и анализ информации.
    • Сложно повторить другим компаниям, но возможно.
    • Множество источников информации: телеграм-каналы, СМИ, твиттер.
    00:10:48 Бизнес на основе подписки
    • Автор обсуждает возможность работы на международном уровне, используя сервис, зарегистрированный в Киргизии.
    • Он также упоминает о необходимости маркетинга для продвижения сервиса, но не знает, как это сделать.
    00:11:45 Развитие команды и подход к работе
    • Автор волнуется о том, как начать развивать эту идею и какую команду выделить для этого.
    • Он считает, что это может быть перспективным направлением, но их подход заключается в том, чтобы сначала получить заказ, а затем постепенно развивать его.
    Наши проекты:
    Защита от скликивания рекламы clickfraud.ru
    Мониторинг цен конкурентов xmldatafeed.com/
    Разработка мобильных приложений notissimus.com/
    Мне можно писать вопросы здесь: t.me/maximkulgin

Комментарии • 64

  • @user-yy7cx8mw5y
    @user-yy7cx8mw5y 3 месяца назад +18

    .... Про возможность создания подобного сервиса, года 4-5 назад, отправлял вам вопрос. Вы коротко, иронично ответили: - зачем? Ведь есть Яндекс и Гугл))).

    • @V0ST0K
      @V0ST0K 3 месяца назад +1

      У Интерфакса уже тогда был скан.

    • @V0ST0K
      @V0ST0K 3 месяца назад +1

      У Интерфакса уже тогда был скан.

  • @evgenyfisenko
    @evgenyfisenko 3 месяца назад +5

    обложка играет роль 100%, быстрее замечаю ваши ролики. бабки потрачены не зря! Ролик не смотрел, зашел коммент написать :)

    • @MaximKulgin
      @MaximKulgin  3 месяца назад +1

      Спасибо 😉

    • @maximsheleh9603
      @maximsheleh9603 3 месяца назад

      полностью противоположная ситуация... превью отталкивает, ролик зашел

    • @evgenyfisenko
      @evgenyfisenko 3 месяца назад

      @@maximsheleh9603 а почему? Поделитесь, пожалуйста! Очень нужно мнение

  • @MagicMightNew
    @MagicMightNew 3 месяца назад +1

    Ура, снова про BA. Почему-то каждый раз радуюсь)

  • @LapshinLAB
    @LapshinLAB 3 месяца назад

    а Telegram API дают на каналах? для парсинга, я что-то не понимаю может

  • @alexfilus
    @alexfilus 3 месяца назад +5

    Интересное видео, но можно HDR отключить? Яркость глаза режет.

  • @slavjansky
    @slavjansky 3 месяца назад +4

    Обложка топ😮

    • @MaximKulgin
      @MaximKulgin  3 месяца назад

      спасибо

    • @chukgeck07
      @chukgeck07 3 месяца назад

      Ога, уже несколько роликов втирает нам про свои миллионные прибыли а собрать небольшой продакшн для роликов и видеомонтажа не может. Спустя несколько лет таких рассказов, дождались нормальной превьюшки. ))

    • @slavjansky
      @slavjansky 3 месяца назад

      @@chukgeck07 за красивой картинкой вам к трансформаторам

  • @azimutjava
    @azimutjava 3 месяца назад +6

    Капец там серверов надо

  • @rauflll
    @rauflll 3 месяца назад +3

    Как будто поговорил с наставником по бизнесу, спасибо.

  • @sliniz
    @sliniz 3 месяца назад

    Да, есть система аваланче. Который занимается Андрей Масалович

  • @brs77
    @brs77 3 месяца назад +1

    Твиттер через Selenium парсил недавно.

  • @user-uj5ol5fm1u
    @user-uj5ol5fm1u 2 месяца назад

    Продвигать такой проект можно только путем оптимизации тематических страниц по ключевым запросам. создавая кластеризацию.

  • @turbobroker
    @turbobroker 3 месяца назад +2

    Что может быть проще, чем спарсить фейсбук) час работы максимум... твиттер так вообще халява. А контакт просто на сдачу. Что-то можно и через апи, конечно, но вряд ли везде. Ашманов чем-то подобным занимается, он в каких-то из интервью говорил, сколько всего они за день парсят. У них это называется "управление репутацией". Это миллионы и миллионы данных в день. Под это дело надо десятки, а то и сотни тысяч аккаунтов. Тысячи проксей. Куки, сессии, и вот это вот всё. Это ещё не храним и запросы не делаем. И десяток тесл А100 до кучи, для начала.

    • @gontnetwork8851
      @gontnetwork8851 3 месяца назад

      1000 антидетект аккаунтов. Легко.

    • @turbobroker
      @turbobroker 3 месяца назад

      @@gontnetwork8851а сто тысяч?

  • @AlbertCartel
    @AlbertCartel 3 месяца назад +1

    Про маркетинг подобного сервиса интересно было бы послушать

    • @MaximKulgin
      @MaximKulgin  3 месяца назад +1

      пока идей нет

    • @Master_SheeFoo
      @Master_SheeFoo 3 месяца назад

      Особенно когда говорит: та на это нужно всего три человека, и через минуту уже рассуждает о крупной компании - да они могут выделить кучу людей, но на кой эти затраты нужны... Так таки 3 человека, или кучу людей нужно чтоб запилить проект? В общем история перспективы успешного успеха понятна.

  • @user-xb7pr2ut7k
    @user-xb7pr2ut7k 3 месяца назад +1

    Медиалогия же лет 15 назад такой сервис еще сделала.

  • @nursultansultanov1838
    @nursultansultanov1838 3 месяца назад

    Кэмбридж аналитик слышали про такую компанию

  • @user-zd8ex8ys8g
    @user-zd8ex8ys8g 3 месяца назад

    Да, интересно что такие костыли выростают до таких обортов, это к тому что как со сквозной аналитикой мп. Маркет плейс за день может развернуть всю свою аналитику и прибить рынок сторонних сервисов. Так и тут у Яндекса все это под капотом есть, то же видимо скоро для брендов сделает.

  • @DAHUME
    @DAHUME 3 месяца назад +1

    4:27 Вопрос в другом зачем им это нужно?

  • @surkiz
    @surkiz 3 месяца назад

    Практически реинкарнация нашего Яндекс.Советника спустя 10 лет :)
    Макс, когда дойдете до этапа метчинга товаров между площадками - напиши мне, у нас лучшая ML команда по метчингу товаров, и не только в РФ. 🕶

  • @LapshinLAB
    @LapshinLAB 3 месяца назад

    твитер даёт API для парсинга

  • @jimbolim888
    @jimbolim888 3 месяца назад +1

    от ролика к роли ставки повышаются)) ждем "1 триллион в год на парсинге лендингов )))"

  • @digertdoment4326
    @digertdoment4326 3 месяца назад +1

    Когнитивный диссонанс большая богатая фирма где работают тысячи лучших программистов закажет у маленькой команды студентов и самоучек😂

  • @vabolshakov
    @vabolshakov 3 месяца назад +1

    Делали такой сервис ещё в 2018-2019 году

    • @MaximKulgin
      @MaximKulgin  3 месяца назад

      Закрыли?

    • @vabolshakov
      @vabolshakov 3 месяца назад

      @@MaximKulgin piiq media, у них несколько продуктов, этот PIIQ Intel.

  • @abrachammitchell7856
    @abrachammitchell7856 3 месяца назад +2

    На хостинг будет просто уйма денег уходить. На этот бесконечный парсинг

  • @LapshinLAB
    @LapshinLAB 3 месяца назад

    для этой задачи нужен 1 человек, который программирует на гпт чате

  • @digertdoment4326
    @digertdoment4326 3 месяца назад

    И да у гугла есть агенты просто менеджеры нефтяных очень ленивые не изучают гугл😅

    • @seorubl
      @seorubl 3 месяца назад +2

      Не все СМИ выдаются в Google News, часть заблокированы.

  • @domahes
    @domahes 3 месяца назад

    Язык жестов конечно... 😑

  • @spectehnika78
    @spectehnika78 3 месяца назад

    Глаз Бога сделайте для би ту би. Я готов платить 20-30к в год.

    • @MaximKulgin
      @MaximKulgin  3 месяца назад

      А расскажите детали - что это такое ? Как должно работать ?

    • @yalmeme
      @yalmeme 3 месяца назад +2

      @@MaximKulgin глаз бога дает инфу по людям, кучу личных данных. это не законно.

    • @kirillvlasov1131
      @kirillvlasov1131 3 месяца назад

      ​@@yalmemeверно, не законно. Но не ясно почему? - т к все берется из открытых источников

    • @yalmeme
      @yalmeme 3 месяца назад

      @@kirillvlasov1131 в том то и дело что глаз бога оперирует не только отрытыми источниками, но и базами типа ментовских и страховых - дает адреса, телефоны и тд, т.е. там по сути торговля приватными данными идет.

  • @skipper3355
    @skipper3355 3 месяца назад

    Могу сказать что ChatGPT более грамотно работает с "парсингом" открытых данных )

  • @bramduss
    @bramduss 3 месяца назад

    парсить регулярно твиттер практически нереально. аккаунты, через которых будет идти парсинг, будут быстро баниться.

    • @MaximKulgin
      @MaximKulgin  3 месяца назад +1

      там открытые данные же

    • @bramduss
      @bramduss 3 месяца назад

      @@MaximKulgin если вы заходите на сайт без входа в учетную запись, то вам твиттер не покажет все твиты интересующего вас аккаунта. Что-то останется закрытым. Т.е. не получится парсить актуальную информацию без учетки.

    • @yalmeme
      @yalmeme 3 месяца назад

      @@bramduss ну, у твиттера так-то есть апишка если мне память не изменяет.