Комментарии 13
>> prometheus -config.file “path/to/prometheus.yml”

эээ, я это делать не буду, даже не просите :)
Вот вы пишете, что «решили познакомиться с этим инструментом поближе» — и что из этого вышло? Используете уже где-то?

Я с Prometheus игрался несколько месяцев, он мне показался весьма перспективным (тегированные метрики + нормальный язык запросов + алерты), но pull-модель до сих пор смущает, поскольку приходится на серверах крутить по несколько сервисов, которые отдают метрики по HTTP. Ну и нет никаких возможностей по хранению старых данных с меньшей точностью, как в Graphite — только удалять можно. Так что дальше экспериментов дело не пошло.
С недавних пор перешли с Prometheus и Графитов на сторонний сервис по мониторингу — Datadog. Просто сконфигурировать (надо только агент установить одной командой), куча уже готовых интеграций, красивые графики, уведомления и т.п. Пользуем уже несколько месяцев, проблем пока никаких не было. Если кто-то подумывает о выборе сервиса для метрик, рекомендую.
А мы, наоборот, работаем над тем, чтобы слезть со стороннего сервиса и перейти на Prometheus.
Если не секрет, чем вас не устроил Prometheus? Почему в качестве стороннего сервиса выбрали именно DataDog?
Только ушли с Datadoga, с их моделью монетизации оказалось уж очень дорого, сейчас перешли на HostedGraphite (statsd,graphite,graphana), на первый взгляд сервис требует больших знаний и навыков, но более гибкий (про цену я умолчу).
Как я понял, Prometeus больше заточен на мониторинг и информирование в случае алярма, а InfluxDB на долгосрочное хранение данных.
Prometheus — система мониторинга + сбор и хранение данных + алерты.
InfluxDB — специализированная темпоральная (time series) база данных с возможностью кластеризации + шардинг, есть HTTP API, для Influx есть куча клиентских библиотек для разных языков, кстати Influx тоже использует LevelDB для хранения данных. В общем Influx для своих 3 лет от первого релиза очень неплохо развивается и имеет хорошие показатели. Лично я использую её в связке с CollectD и Grafana для сбора данных с кучки серверов.
к сожалению influx перенесла кластеризацию в закрытую ветку кода…
Сейчас активно изучаю Prometheus.
Про него узнал из серии статей о сравнении систем мониторинга для докер контейнеров. Возможно кому-то будет интересно.
http://rancher.com/comparing-monitoring-options-for-docker-deployments/
http://rancher.com/docker-monitoring-continued-prometheus-and-sysdig/
Автору спасибо за статью.
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.