Linux: отказоустойчивый мониторинг Thanos + Prometheus

Поделиться
HTML-код
  • Опубликовано: 27 ноя 2024

Комментарии • 17

  • @kseniapihta
    @kseniapihta Месяц назад

    спасибо большое за объяснения!! самые понятные и голос приятный! жду еще видосиков по девопсу/сре и было бы круто побольше технических деталей😊может быть какие нибудь туториалы, хотела бы очень послушать про работу с продом и как инфра отказоустойчиво работает при большой нагрузке в реальности

    • @DigitalStudium
      @DigitalStudium  Месяц назад

      Спасибо за хороший отзыв! Подумаю, какие видео можно снять на тему инфры

  • @hoowoo7309
    @hoowoo7309 7 месяцев назад

    да очень круто обьясняешь много видосов посмотрел, спосибо огромное, продолжай в том же духе!

  • @AutomationCraft
    @AutomationCraft Год назад

    Супер!! комментарий в поддержку канала!

  • @kopevar53
    @kopevar53 Год назад

    Спасибо за контент! Будет интересно посмотреть на отказоустойчивый кластер VictoriaMetrics.

  • @9Ibis007
    @9Ibis007 11 месяцев назад

    Так же можно посмотреть в сторону Prometheus Federation + Thanos

  • @alexbrofman5935
    @alexbrofman5935 Год назад

    Реально очень круто, а самое главное качественно и доступно что очень важно!!
    Спасибо огромное за работу...
    Слушай а как ти смотриш на то чтоби дополнительно внедрить victoriametrics ?
    Если есть опыт реально было бы круто показать , такого контента точно ни у кого нету)))
    Еще раз спасибо

    • @DigitalStudium
      @DigitalStudium  Год назад

      Спасибо за столь хороший отзыв! К сожалению, у меня нет опыта работы с Victoria metrics, так что записать видео на эту тему смогу разве что только в перспективе

  • @Pavelbrov
    @Pavelbrov Год назад

    Спасибо, интересно! А почему решили отказоустойчивый сбор метрик сделать? Были преценденты или перфекционизм?)

    • @DigitalStudium
      @DigitalStudium  Год назад

      Прецеденты, конечно же, были. Простой мониторинга на несколько часов был когда применили неверный конфиг для Прометея, рестартовали (вместо релоада), и не проверили, работает или нет.
      Но однозначно это не единственный сценарий для простоя. Хотелось бы, отдавая дашборд коллегам, быть уверенным в том, что он точно работает)

    • @damirmanyapov
      @damirmanyapov Год назад

      А как от таких ошибок кластер спасет? @@DigitalStudium

    • @Аноним-м5ъ
      @Аноним-м5ъ Год назад

      ​@@damirmanyapovесли на одном Prometheus нет данных или он не работает, то thanos забирает с другого Prometheus.

    • @damirmanyapov
      @damirmanyapov Год назад

      Так в примере выше как я понял просто не заработал Prometheus @@Аноним-м5ъ

    • @Аноним-м5ъ
      @Аноним-м5ъ Год назад

      @@damirmanyapov да, но когда у тебя есть второй, то это никому не мешает. Ну вышел из строя один Прометей, ну и ладно. Второй его страхует. При этом вручную ничего переключать не надо, так как ваша графана смотрит на Танос.
      Если же у вас просто два Прометея, без Таноса, то графану нужно будет руками переключить на другой Прометей в случае неисправности первого.
      Если же у вас вообще один Прометей, то дело дрянь - есди он вышел из строя, то придётся его чинить, до момента починки графана будет пустой.

  • @АрсланГаджиев-ж5ж

    Здравствуйте. У вас супер канал . Могли бы вы сделать плейлист с нуля по линуксу для девопса необходимую базу и плейлист с нуля девопс ? Просто у вас прекрасная и понятная подача материала ( объясние) . Просто нахватает структурированного, пошагового материала для становления полноценного девопс инженера с нуля . Тем более вы в этом очень хорошо разбираетесь .
    Просто перелопатил весь ютуб в поисках обучения нет ничего стоящего , а у вас сосвсем другое . Очень надеюсь на обратную связь от вас .
    Спасибо за ранее

    • @DigitalStudium
      @DigitalStudium  Год назад +1

      Спасибо за хороший отзыв! К сожалению возможность записывать видео у меня появляется нечасто, но я попытаюсь сделать такой плэйлист.