Всем привет! Я Павел Логинов, руководитель группы облачный решений EdgeЦентр. Сегодня расскажу вам о нашем кастомном мониторинге гипервизоров: как мы его сделали, как он работает и какую пользу приносит нам и нашим клиентам.
У каждого из нас рано или поздно появляется задача о мониторинге гипервизоров на предмет их работы «изнутри». Нет? Странные вы какие-то.
А вот у нас в компании иногда возникали такие ситуации: на улице +20 градусов, но ощущается как +10. По нашим приборам всё хорошо. Но клиент нашего облака, который арендует у нас виртуальную машину, жалуется: сеть медленно работает, или диск, или процессор. Приходилось идти и разбираться, в чём дело. Это отнимало время. И клиенты были недовольны. К тому же объемы росли. На данный момент у нас 5 регионов с Openstack и больше 250 гипервизоров.
В какой-то момент мы решили, что дальше так жить нельзя. И сделали собственный мониторинг гипервизоров — систему, с помощью которой мы теперь узнаём о проблемах не от клиентов или L1, а (вот это достижение!) из алертов.