Как стать автором
Обновить

Комментарии 16

Что же тогда прилегли когда Яндекс упал недавно?
Идеальных систем не бывает. Падение крупного игрока очень сильно увеличило рост нагрузки. Из того инцидента было сделано очень много выводов, все они были реализованы уже.

зарегистрировался чтобы оставить коммент


более отвратительной назойливой рекламы не придумали?

Все чтения идут в Тарантул вместо Мускула? Или какой-то определённый сервис?
И зачем оставлять Redis Cluster тогда?

Не все. Идут только те запросы, у которых очень высокий troughput. Например из распределения заказов или проверка авторизации.

На редис много что завязано из легаси. Переписывать все дорого. Решили пойти путем обеспечения отказоустойчивости и масштабируемости того, что есть. Тарантул в основном на новый функционал завязан.
Пилотно смотрели. У нас для этих целей NewRelic. Но, кажется, pprof удобнее, хотя возможно это дело привычки.

Все программы, программы… Расскажите про железо? Сколько Xeon Platinum, как выбирали платформу под 2Tb RAM, как объездили пол Москвы в 21 вечера, в поисках замены вылетевшей qSFP и вот всё такое.

А для orchestrator есть готовые конфиги для переключения на новый мастер? Насколько я помню в офф репе голяк, типа пишите сами сценарий failover

Готовых конфигураций мы не нашли. Делали все сами. Уже написана статья, как мы это делали в подробностях. В течении недели-двух опубликуем.

Отлично, спасибо, буду ждать. Если выложите скрипты переключения, то будет вообще супер!

Будет статья на эту тему. В целом все зависит от механизма переключения, поэтому и готового решения нет. Оркестратор предназначен для обнаружения проблем с кластером и запуска пользовательских механизмов восстановления топологии.

А почему не стали использовать master-master кластер, типа MariaDB Galera Cluster или Percona XtraDB Cluster?
Если кратко, то от мастер-мастера есть смысл только в случае геораспределенного кластера. И слишком много проблем. Одна из основных — кадровая, специалистов которые действительно глубоко понимают данную технологию на рынке мало. Вторая проблема — кластера медленнее работают. Кажется, что полусинхронная репликация + автоматический фейловер решают все наши проблемы.

Вы упоминаете, что переписывать тяжело и поэтому останетесь на Легаси. Из личного опыта рекомендую не бояться этого. Как правило, "не так страшен черт, как его малюют". А поддержка неудачных или устаревших решений будет вас все сильнее тяготить.


Расскажите, пожалуйста, о вашем стеке используемых решений. Например, как делаете логирование (кибана, грейлог или свое решение)?

Зарегистрируйтесь на Хабре , чтобы оставить комментарий