n_bogdanov Sep 25 2020 at 09:21

Обзор операторов PostgreSQL для Kubernetes. Часть 1: наш выбор и опыт

11 min

28K

Флант corporate blogPostgreSQL*Database Administration*DevOps*Kubernetes*

Technotext 2021

+52

Comments 27

IvanVakhrushev Sep 25 2020 at 10:02

WAL-G бы и Одиссея туда

n_bogdanov Sep 25 2020 at 10:04

Ничто не мешает — github.com/zalando/spilo/blob/master/ENVIRONMENT.rst

AlexGluck Sep 26 2020 at 03:22

По одисею не увидел, можете ткнуть?

n_bogdanov Sep 26 2020 at 09:27

Хочу сразу извиниться, что не дал ранее развёрнутый ответ. Дело в том, что Zalando даже в своей документации советует использовать свою сборку Spilo, в дефолте чего-то может не быть, версии могут быть не те. Именно поэтому в операторе возможно настроить все используемые образа. Соответственно вы можете использовать вместо pgbouncer odyssey, просто сделайте образ, который бы имел сходный интерфейс и настраивался через переменные окружения. Я тоже смотрел в эту сторону и даже начинал писать скрипт конфигурации, просто пока никто из клиентов такое не попросил.

Возможность кастомизации — это еще одна из причин, по которой нас и подкупил этот оператор

Aleksi Sep 28 2020 at 16:17

StackGres же ещё:

n_bogdanov Sep 28 2020 at 16:38

Да, уже напомнили про него. Пока выглядит заметно более сложным в использовании, аналогично Crunchy Data PostgreSQL Operator.

Обязательно попробуем его и дополним статью.

kendepp Sep 30 2020 at 11:14

А есть сравнение производительности такого кластера в кубернетес с аналогичным на голой виртуалке?
Когда я игрался с zalando оператором у меня вышла разница чуть ли не в полтора раза по сравнению с дефолтным инстансом постгри. Вероятно я просто не смог нормально приготовить оператор...

n_bogdanov Sep 30 2020 at 11:15

У нас бы немного другая цель. А что вы понимаете под:

Когда я игрался с zalando оператором у меня вышла разница чуть ли не в полтора раза по сравнению с дефолтным инстансом постгри

Подразумевается производительность?

gecube Sep 30 2020 at 12:17

Я думаю, что тут два момента

нельзя сравнивать постгрес дефолтный и от цаландо. Надо сравнивать цаландо против кластерный постгрес с патрони
зависит от хранилки и настроек сети. Уверен, что потюнить постгрес в кубе, чтобы он работал побыстрее. Я уж не говорю, что под постгрес в кубе надо ОТДЕЛЬНЫЕ НОДЫ кучера

kendepp Oct 6 2020 at 14:02

я постарался упростить насколько мог —
и там и там по одной ноде
диск выдавал локальный.
ресурсы тоже одинаковые(в заландо реквестами выставлял)

по различиям:
zalano ставил внутри кластера openshift, соотвественно ОС — fcos, вместо докера — cri-o.
обычный инстанс был на centos7.

в итоге вышло
ВМ: 402 tps
zalando: 154 tps

есть мнение что проблема на самом деле как раз в лимитах куба, где то на хабре была статья, что лимит может вызывать тротлинг цпу даже когда до планки еще далеко. но в заландо я на тот момент не нашел как это отключить.
другой вариант — локальный диск отдавал контейнеру через local storage operator, и че он с ним там делает — большой вопрос. есть шанс, что была двойная запись.

gecube Oct 6 2020 at 14:04

Спасибо за уточнение. tps меняли из контейнера с постгресом или как-то по-другому (снаружи кластера)? Возможно, что дело в этом

kendepp Oct 6 2020 at 14:23

создавал третью вм и мерял поочередно.
при этом было подозрение на сеть, так что на самом деле для заландо делал два измерения:
через VIP (keepalive operator, прямо на сервис шифта вешал IP) — вышло 154 tps
через NodePort — вышло 145 tps

виртуальные диски располагались физически на одном ssd, полагаю, можно считать, что они были идентичны.

повторюсь, я не сильно шибко разбираюсь в постгре, вероятно я просто не умею его настраивать.

по keepalive operator у редхата: www.openshift.com/blog/self-hosted-load-balancer-for-openshift-an-operator-based-approach

gecube Oct 6 2020 at 14:25

попробуйте pgbench или что там у вас запустить прямо из контейнера с постгресом, чтобы исключить сеть. Это будет не очень честное сравнение, но по крайней мере — точно 'сырые' цифры. Или еще лучше — развернуть в опеншифте отдельный пг, не через цаландо и посмотреть его.

n_bogdanov Oct 6 2020 at 14:17

Ну лимиты могут повлиять. Но их можно задать сильно выше, чтобы покрывать все ядра VM. Ну и параметры запуска pgbench интересно увидеть.

kendepp Oct 6 2020 at 14:25

emoxam Sep 21 2022 at 10:35

Какого кучера?

"Уверен, что потюнить постгрес в кубе, чтобы он работал побыстрее. " Уверен в чём? Не понял.

n_bogdanov Sep 22 2022 at 21:40

Кубера же. У Георга сработал Т9.

gecube Oct 4 2020 at 22:17

Ещё такая штука обнаружилась
https://www.openshift.com/blog/how-to-deploy-and-manage-postgresql-on-openshift-using-the-robin-operator

Это не оператор, который ставит постгрес, но интерес сам подход со снапшотами на уровне хранения.

dnbstd Oct 7 2020 at 16:30

А KubeDB не рассматривали вроде много баз помимо Postgres умеет.

n_bogdanov Oct 8 2020 at 04:09

И его глянем

JuriM Mar 18 2022 at 11:11

Percona тоже свой оператор выпустила, на базе crunchy data
https://www.percona.com/software/percona-kubernetes-operators

JuriM Mar 18 2022 at 00:37

Интересует какой из операторов умеет zero-downtime failover (скорее всего это будет pgbouncer), когда при переключении мастера клиентские соединения не сбрасываются, а перенаправляются на новый мастер

AlexGluck Mar 18 2022 at 08:42

Как мне казалось в операторах доступны разнообразные пулеры (Odyssey, pgpool, pgbouncer), которые и удерживают соединения клиентов.

n_bogdanov Mar 18 2022 at 09:09

На самом деле не всё радужно - у того же stackgres pgbouncer является частью пода с postgres.Ну и про приложения, которые требуют сессии забывать не надо.

По факту ZereDowntime для transaction-mode ready приложений даст Zalando, Stolon, Crunchydata. Причём у Stolon свой прокси, который еще и нагрузку балансировать умеет. Stackgres не даст такого из коробки. А KubeDB я уже не помню где pgbounser держит.

JuriM Mar 18 2022 at 13:26

Я правильно понимаю что zero downtime это действительно zero downtime, то есть клиентские соединения не сбрасываются и не требуют повторного реконнекта? Мне коллега сообщил что отказались от кранчидейта именно по этой причине (это было правда несколько лет назад, может чтото поменялось)

n_bogdanov Mar 18 2022 at 13:32

Везде есть оговорки.

Приложение должно работать в транзакционном режиме, должна быть синхронная или реплика с минимальным отставанием. Если эти условия выполняются - то ошибки будут только по тем запросам, которые были к упавшей реплике или мастеру.

Остальные же коннекты, которые были в idle состоянии ничего не почувствуют.

JuriM Mar 18 2022 at 11:08

Совершенно верно, но например тот-же pgbouncer сам это не будет делать, нужен или какой-то скрипт, который дергает pause/resume или чтото типа stolon-pgbouncer https://github.com/gocardless/stolon-pgbouncer