№411 - ~800 млн. рублей на парсинге открытых данных и анализа СМИ. Завидуем вместе :)

Поделиться
HTML-код
  • Опубликовано: 30 окт 2024

Комментарии • 70

  • @МихаилДемин-б1щ
    @МихаилДемин-б1щ 8 месяцев назад +20

    .... Про возможность создания подобного сервиса, года 4-5 назад, отправлял вам вопрос. Вы коротко, иронично ответили: - зачем? Ведь есть Яндекс и Гугл))).

    • @V0ST0K
      @V0ST0K 8 месяцев назад +1

      У Интерфакса уже тогда был скан.

    • @V0ST0K
      @V0ST0K 8 месяцев назад +1

      У Интерфакса уже тогда был скан.

  • @zigicoin-o1o
    @zigicoin-o1o 2 месяца назад

    тут еще надо учитывать обратное влияние на рынок компаний, которые будут получать эти данные и будут предпринимать какие то действия, которые будут нарушать полученные ранее данные и так по кругу

  • @evgenyfisenko
    @evgenyfisenko 8 месяцев назад +5

    обложка играет роль 100%, быстрее замечаю ваши ролики. бабки потрачены не зря! Ролик не смотрел, зашел коммент написать :)

    • @MaximKulgin
      @MaximKulgin  8 месяцев назад +1

      Спасибо 😉

    • @maximsheleh9603
      @maximsheleh9603 8 месяцев назад

      полностью противоположная ситуация... превью отталкивает, ролик зашел

    • @evgenyfisenko
      @evgenyfisenko 8 месяцев назад

      @@maximsheleh9603 а почему? Поделитесь, пожалуйста! Очень нужно мнение

  • @MagicMightNew
    @MagicMightNew 8 месяцев назад +2

    Ура, снова про BA. Почему-то каждый раз радуюсь)

  • @rauflll
    @rauflll 8 месяцев назад +4

    Как будто поговорил с наставником по бизнесу, спасибо.

  • @DifferentDat
    @DifferentDat 5 месяцев назад +1

    Хех, я там работаю) Все на самом деле не все так просто. Архитектурный план гораздо глубже.

    • @MaximKulgin
      @MaximKulgin  5 месяцев назад

      конечно не просто. я даже сказал бы - сложно. крутые ребята

  • @slavjansky
    @slavjansky 8 месяцев назад +4

    Обложка топ😮

    • @MaximKulgin
      @MaximKulgin  8 месяцев назад

      спасибо

    • @chukgeck07
      @chukgeck07 8 месяцев назад

      Ога, уже несколько роликов втирает нам про свои миллионные прибыли а собрать небольшой продакшн для роликов и видеомонтажа не может. Спустя несколько лет таких рассказов, дождались нормальной превьюшки. ))

    • @slavjansky
      @slavjansky 8 месяцев назад

      @@chukgeck07 за красивой картинкой вам к трансформаторам

  • @surkiz
    @surkiz 8 месяцев назад +1

    Практически реинкарнация нашего Яндекс.Советника спустя 10 лет :)
    Макс, когда дойдете до этапа метчинга товаров между площадками - напиши мне, у нас лучшая ML команда по метчингу товаров, и не только в РФ. 🕶

  • @alexfilus
    @alexfilus 8 месяцев назад +5

    Интересное видео, но можно HDR отключить? Яркость глаза режет.

  • @ИванИванов-л7о2ы
    @ИванИванов-л7о2ы 8 месяцев назад +1

    Да, интересно что такие костыли выростают до таких обортов, это к тому что как со сквозной аналитикой мп. Маркет плейс за день может развернуть всю свою аналитику и прибить рынок сторонних сервисов. Так и тут у Яндекса все это под капотом есть, то же видимо скоро для брендов сделает.

  • @turbobroker
    @turbobroker 8 месяцев назад +2

    Что может быть проще, чем спарсить фейсбук) час работы максимум... твиттер так вообще халява. А контакт просто на сдачу. Что-то можно и через апи, конечно, но вряд ли везде. Ашманов чем-то подобным занимается, он в каких-то из интервью говорил, сколько всего они за день парсят. У них это называется "управление репутацией". Это миллионы и миллионы данных в день. Под это дело надо десятки, а то и сотни тысяч аккаунтов. Тысячи проксей. Куки, сессии, и вот это вот всё. Это ещё не храним и запросы не делаем. И десяток тесл А100 до кучи, для начала.

    • @gontnetwork8851
      @gontnetwork8851 8 месяцев назад

      1000 антидетект аккаунтов. Легко.

    • @turbobroker
      @turbobroker 8 месяцев назад

      @@gontnetwork8851а сто тысяч?

  • @AlbertCartel
    @AlbertCartel 8 месяцев назад +2

    Про маркетинг подобного сервиса интересно было бы послушать

    • @MaximKulgin
      @MaximKulgin  8 месяцев назад +1

      пока идей нет

    • @Master_SheeFoo
      @Master_SheeFoo 8 месяцев назад

      Особенно когда говорит: та на это нужно всего три человека, и через минуту уже рассуждает о крупной компании - да они могут выделить кучу людей, но на кой эти затраты нужны... Так таки 3 человека, или кучу людей нужно чтоб запилить проект? В общем история перспективы успешного успеха понятна.

  • @azimutjava
    @azimutjava 8 месяцев назад +7

    Капец там серверов надо

  • @brs77
    @brs77 8 месяцев назад +2

    Твиттер через Selenium парсил недавно.

    • @zigicoin-o1o
      @zigicoin-o1o 2 месяца назад +1

      а так вот кто виноват в блокировке )))

  • @jimbolim888
    @jimbolim888 8 месяцев назад +2

    от ролика к роли ставки повышаются)) ждем "1 триллион в год на парсинге лендингов )))"

  • @sliniz
    @sliniz 8 месяцев назад

    Да, есть система аваланче. Который занимается Андрей Масалович

  • @Эвенкийка24
    @Эвенкийка24 8 месяцев назад

    Продвигать такой проект можно только путем оптимизации тематических страниц по ключевым запросам. создавая кластеризацию.

  • @DAHUME
    @DAHUME 8 месяцев назад +1

    4:27 Вопрос в другом зачем им это нужно?

  • @Мойканал-э7п
    @Мойканал-э7п 8 месяцев назад +1

    Медиалогия же лет 15 назад такой сервис еще сделала.

  • @LapshinLAB
    @LapshinLAB 8 месяцев назад

    а Telegram API дают на каналах? для парсинга, я что-то не понимаю может

  • @digertdoment4326
    @digertdoment4326 8 месяцев назад +1

    Когнитивный диссонанс большая богатая фирма где работают тысячи лучших программистов закажет у маленькой команды студентов и самоучек😂

  • @vabolshakov
    @vabolshakov 8 месяцев назад +1

    Делали такой сервис ещё в 2018-2019 году

    • @MaximKulgin
      @MaximKulgin  8 месяцев назад

      Закрыли?

    • @vabolshakov
      @vabolshakov 8 месяцев назад

      @@MaximKulgin piiq media, у них несколько продуктов, этот PIIQ Intel.

  • @nursultansultanov1838
    @nursultansultanov1838 8 месяцев назад

    Кэмбридж аналитик слышали про такую компанию

  • @LapshinLAB
    @LapshinLAB 8 месяцев назад +1

    твитер даёт API для парсинга

    • @zigicoin-o1o
      @zigicoin-o1o 2 месяца назад +1

      с ограничением количества запросов?

  • @abrachammitchell7856
    @abrachammitchell7856 8 месяцев назад +2

    На хостинг будет просто уйма денег уходить. На этот бесконечный парсинг

  • @spectehnika78
    @spectehnika78 8 месяцев назад +1

    Глаз Бога сделайте для би ту би. Я готов платить 20-30к в год.

    • @MaximKulgin
      @MaximKulgin  8 месяцев назад

      А расскажите детали - что это такое ? Как должно работать ?

    • @yalmeme
      @yalmeme 8 месяцев назад +2

      @@MaximKulgin глаз бога дает инфу по людям, кучу личных данных. это не законно.

    • @kirillvlasov1131
      @kirillvlasov1131 8 месяцев назад +1

      ​@@yalmemeверно, не законно. Но не ясно почему? - т к все берется из открытых источников

    • @yalmeme
      @yalmeme 8 месяцев назад

      @@kirillvlasov1131 в том то и дело что глаз бога оперирует не только отрытыми источниками, но и базами типа ментовских и страховых - дает адреса, телефоны и тд, т.е. там по сути торговля приватными данными идет.

    • @zigicoin-o1o
      @zigicoin-o1o 2 месяца назад

      @@kirillvlasov1131 потому что как только ты начинаешь нагибать систему, система реагирует и нагибает тебя

  • @LapshinLAB
    @LapshinLAB 8 месяцев назад

    для этой задачи нужен 1 человек, который программирует на гпт чате

    • @zigicoin-o1o
      @zigicoin-o1o 2 месяца назад

      а как же тогда бабло отжимать у клиентов? Надо же им по ушам проехать , что сотни программистов работают и тысячи серверов ))))

  • @digertdoment4326
    @digertdoment4326 8 месяцев назад

    И да у гугла есть агенты просто менеджеры нефтяных очень ленивые не изучают гугл😅

    • @seorubl
      @seorubl 8 месяцев назад +2

      Не все СМИ выдаются в Google News, часть заблокированы.

  • @domahes
    @domahes 8 месяцев назад

    Язык жестов конечно... 😑

  • @skipper3355
    @skipper3355 8 месяцев назад +1

    Могу сказать что ChatGPT более грамотно работает с "парсингом" открытых данных )

  • @bramduss
    @bramduss 8 месяцев назад

    парсить регулярно твиттер практически нереально. аккаунты, через которых будет идти парсинг, будут быстро баниться.

    • @MaximKulgin
      @MaximKulgin  8 месяцев назад +1

      там открытые данные же

    • @bramduss
      @bramduss 8 месяцев назад

      @@MaximKulgin если вы заходите на сайт без входа в учетную запись, то вам твиттер не покажет все твиты интересующего вас аккаунта. Что-то останется закрытым. Т.е. не получится парсить актуальную информацию без учетки.

    • @yalmeme
      @yalmeme 8 месяцев назад

      @@bramduss ну, у твиттера так-то есть апишка если мне память не изменяет.

    • @zigicoin-o1o
      @zigicoin-o1o 2 месяца назад

      @@bramduss да откуда им знать, теоретикам )))