Comments 3
Спасибо за интересную статью, пара замечаний.

1. Кто мониторит мониторинг? В Вашей табличке отсутствует время последней проверки — хост может валяться, а по табличке на нем все ОК.
2. Лаг в две минуты — при Вашем ярде запросов наверно многовато…
3. CMDB изменяется только вручную или может быть изменена по триггеру?
1. Оно отсутствует в примере, а в реальности в таблице хранится время последнего апдейта полученного от контейнера, так что хосты, от которых давно ничего не получали, отслеживаются

2. Две минуты достаточно: запросов много в сумме, на каждый отдельный сервис приходится меньше, кроме того сервисы ведь дублированы. Ну отвалился один хост — nginx пойдёт на другой, но, конечно тут добавляются задержки и перераспределяется нагрузка, поэтому мы и мониторим такие проблемы.

3. CMDB это отдельная интересная история. Измениния туда вносятся и через визуальный редактор и из скриптов через REST. Да есть отключения сервисов через тригерры некоторых проверок, но мы этим пользуемся не очень широко.
Когда про CMDB будет статья? )

В таких системах интересна уже не только разработка, но и ухищрения по поддержанию в состоянии «живем».
Only those users with full accounts are able to leave comments. Log in, please.
Information
Founded

1 January 2005

Location

США

Employees

51–100 employees

Registered

15 June 2012