Мониторинг связности в сети сервисов / Comments / Habr

woyager Sep 13 2012 at 22:45

Спасибо за интересную статью, пара замечаний.

1. Кто мониторит мониторинг? В Вашей табличке отсутствует время последней проверки — хост может валяться, а по табличке на нем все ОК.
2. Лаг в две минуты — при Вашем ярде запросов наверно многовато…
3. CMDB изменяется только вручную или может быть изменена по триггеру?

ik62 Sep 14 2012 at 10:39

1. Оно отсутствует в примере, а в реальности в таблице хранится время последнего апдейта полученного от контейнера, так что хосты, от которых давно ничего не получали, отслеживаются

2. Две минуты достаточно: запросов много в сумме, на каждый отдельный сервис приходится меньше, кроме того сервисы ведь дублированы. Ну отвалился один хост — nginx пойдёт на другой, но, конечно тут добавляются задержки и перераспределяется нагрузка, поэтому мы и мониторим такие проблемы.

3. CMDB это отдельная интересная история. Измениния туда вносятся и через визуальный редактор и из скриптов через REST. Да есть отключения сервисов через тригерры некоторых проверок, но мы этим пользуемся не очень широко.

woyager Sep 14 2012 at 22:20

Когда про CMDB будет статья? )

В таких системах интересна уже не только разработка, но и ухищрения по поддержанию в состоянии «живем».