KatePetrukhina Jul 2 2019 at 15:32

Zabbix, временные ряды и TimescaleDB

14 min

35K

Zabbix corporate blogOpen source*System administration*Database Administration*

Translation

+18

Comments 15

rmonakhov Jul 2 2019 at 16:47

Вы тестируете исключительно с очисткой исторических данных housekeeper'ом либо ещё и Automatic Data Retention Policies самого TSDB (который входит в версию Enterprise)? Если пробовали последнее, то заметна ли разница в производительности?

KatePetrukhina Jul 3 2019 at 09:16

Очистка исторических данных производится хаускипером, версию Enterprise не тестировали.

binakot Jul 3 2019 at 09:40

Можно организовать удаление housekeeper'ом, но не через DELETE FROM, а именно через drop_chunk() самого TimescaleDB. Поэтому enterprise фича не особо и нужна, если housekeeper научится понимать дроп чанков из расширения. Можно добавить галочку в настройки, а в коде сделать if-else блок с DELETE FROM или drop_chunk() =)

KatePetrukhina Jul 3 2019 at 10:15

Да, у нас так и сделано — если работаем с TSDB, то housekeeper вызывает drop_chunks().

binakot Jul 3 2019 at 09:16

Отличная статья! Не зря общались на HL++ в Новосибирске на стенде :)

DRVTiny Jul 3 2019 at 11:54

У нас уже полтора месяца используется связка Zabbix+TimescaleDB на средних размеров инсталляции. Время запросов в таблицы history с использованием встроенных функций timescale увеличилась примерно на порядок. Скорость обычных запросов, которые использует и сам Zabbix — выросла, но несущественно (процентов на 30-50). Возможно, нужно что-то ещё тюнить
Я смотрел исходники Zabbix 4.2.1 — там все изменения, касающиеся timescale, сводятся к очистке исторических данных, хаускипингу. К сожалению, собственно select-запросы не учитывают использование tsdb, так что о каком-то существенном росте производительности в данном случае говорить не приходится. Надеюсь, что выборка из исторических таблиц будет учитывать tsdb в следующих версиях.

edo1h Jul 4 2019 at 20:45

Время запросов в таблицы history с использованием встроенных функций timescale увеличилась примерно на порядок

то есть стало хуже?

binakot Jul 4 2019 at 21:14

Я думаю, наоборот :)

banzayats Jul 6 2019 at 18:35

Время запросов в таблицы history с использованием встроенных функций timescale увеличилась примерно на порядок

Вот я тоже не понял. Запросы стали в 10 раз дольше выполняться?

KatePetrukhina Jul 8 2019 at 11:35

Падения производительности наши тесты точно не показывают, но, конечно, может быть по-всякому. Именно поэтому пока поддержка TSDB — экспериментальная. В 4.4 будут дополнительные оптимизации выборки из истории по рекомендациям инженеров TimescaleDB.

DRVTiny Jul 3 2019 at 19:54

Ещё есть замечание к статье: упор на производительность операций записи не очень понятен.
Если в системе мониторинга хотя бы 10% от количества items составляют triggers и calculated items — именно их расчёт становится «узким местом», поскольку требуется выборка исторических данных. И как раз здесь сочетание Zabbix+TimescaleDB не даёт тех существенных преимуществ, которые могло бы дать, если бы select'ы на получение исторических данных использовали встроенные функции TSDB.
Например:

SELECT time_bucket(180, clock) period,
       max(ho.host) HOST,
                    max(i.key_) item_key,
                    last(value, clock) item_value
FROM history h
INNER JOIN items i USING(itemid)
INNER JOIN hosts ho USING(hostid)
WHERE
  h.clock > (extract(epoch FROM now()) :: int - 300)
    AND
  i.key_ ~ '^(system|vm\.mem|vfs\.fs)\.'
GROUP BY ho.hostid,
         i.itemid,
         period
ORDER BY period DESC

KatePetrukhina Jul 8 2019 at 11:37

Есть замеры поновее, с триггерами, посмотрите презентацию здесь: www.highload.ru/siberia/2019/abstracts/5390
Если общественность проявит достаточный интерес, то расскажем об этом всём подробнее на конференции в августе в Москве.

evg_krsk Jul 3 2019 at 20:57

Мне одному кажется что графики nvps по полчаса каждый — маловато? Стандартный хаускипер запускается каждый час, а тут как?

binakot Jul 4 2019 at 21:15

Думаю, Zabbix стоит выложить на github эти бенчмарки, и все встанет на свои места.

KatePetrukhina Jul 8 2019 at 11:38

Конкретно в этих графиках хаускипер действительно не запускался, т.к. интересовала в первую очередь производительность TSDB. Есть уже выше упомянутые замеры на более протяжённых отрезках, там учитывается и работа хаускипера. Посмотрите эту презентацию: www.highload.ru/siberia/2019/abstracts/5390