AlexSerbul 25 июн 2012 в 18:25

Опыт эксплуатации MySQL Master-Master — как пережить аварию датацентра

6 мин

80K

Блог компании Битрикс24Веб-разработка*

+60

Комментарии 70

adamant 25 июн 2012 в 18:39

Подобная конфигурация (Master-Master + переключение трафика) не только защищает от простоев во время аварий, но и очень помогает при проведении любых работ с базой (установка апдейтов, переконфигурирование и т.п.) — без даунтайма для клиентов.

deMone 25 июн 2012 в 18:44

А как быть, если часть данных не успела синхронизироваться со вторым дата-центром? Понятно, что когда связь восстановится, данные синхронизируются, но что делать с критически важными данными?

AlexSerbul 25 июн 2012 в 18:47

Увы, это реалии жизни :-(. При аварийном рестарте mysql также могут потеряться отдельные транзакции, а ext2/3/4 — иногда при резете могут угробить метаданные и не автоматически не восстановиться.
Если для ваш супермегакритична каждая транзакция, то поможет полусинхронная репликация.

deMone 25 июн 2012 в 18:48

Ну, собственно, так я и думал =)

AlexSerbul 25 июн 2012 в 18:52

Но по опыту часто хватает возможностей асинхронной репликации же. Поэтому она так распространена, на ее базе строят графы серверов, активно дорабатывают технологию. Значит полезна :-)

Psih 25 июн 2012 в 19:07

Про MySQL NDB Cluster враки. Мы его в боевых условиях для социальной сети 5 лет назад уже использовали. Конечно, тупо перекинуть таблицы ALTER TABLE `bla` ENGINE=NDB и ожидать чуда не получится (однако с тех пор судя по анонсам проблемы с JOIN и многие другие успешно решили). Но если применить здравый смысл, понимать что у вас сетевой кластер (смотрите коммент под спойлером), хорошо проверить свои запросы — то отличная штука, которая позволяет перемолоть очень большой поток запросов.
Конечно не каждый запрос можно легко перенести, некоторые вообще не переносятся, но учитывая что NDB это просто движок, то в одной базе могут сосуществовать как InnoDB таблицы, так и NDB таблицы. Они даже неплохо используются одновременно в пределах одного запроса, т.е. в приложениях не нужно специально что-то наворачивать. Всё что нужно, это использовать кластер там где надо (т.е. обращаться к NDB нодам), а где не надо — обращаться к обычному MySQL.

коммент про сетевой кластер и джоины

Запрос с десятком сложных джоинов (хватает и 1-2 джоинов, просто на массивные таблицы) по определению не может быстро работать в сетевой среде, ибо temporary таблицы — а значит данные нужно подтянуть с нод. Зато фокус с derived table, т.е. вложенными запросами, отлично сработал и позволил ускорить часть запросов даже по сравнению с InnoDB

AlexSerbul 25 июн 2012 в 19:14

Для редких кейсов он безусловно подходит. Ничего не имею против, просто предостерег что это не замена InnoDB, и стоит посмотреть на Галеру.

Psih 25 июн 2012 в 19:38

Насчёт редких кейсов я бы поспорил, он довольно много куда пойдёт. Проблема там скорее в другом — кластер это 5 и более машин, а такие мощности не так уж часто нужны, вот и применяют его редко. Но если проект приличных масштабов, то определённо есть смысл его использовать.

AlexSerbul 26 июн 2012 в 16:37

Спасибо за комменты. Вообще я в душе где-то уже начал хоронить NDB кластер если честно, может зря :-)

Psih 26 июн 2012 в 18:37

Очень зря. Даже тогда, лет 5 назад, он нас очень сильно удивил и позволил не заниматься разработкой собственных кеширующих сервисов, как это происходит почти с любой социалкой, которая вырастает в прибыльный проект. Начальное тестирование на живую показало возможности масштабирования во всей красе — было у нас там пару тяжелых мест, которые обычный MySQL (InnoDB, 2 x 4 Quad Core, 16 GB RAM при базе в 5 гигов, основательно отюнингованный под проект) мог обслужить в районе 50-60 rps на конкретной странице (мерили через JMeter и грузили живую систему, поэтому там по статистике SQL обслуживал порядка 3к запросов в секунду). Перенос нескольких критичных мест на NDB (ествественно с переделанными запросами, но логика кода 1 в 1 осталась — поменялся только SQL) за несколько минут дало разогнаться JMeter до 400 rps и росло по мере прогрева кластера.

Так что если вам приходится иметь дело с большими нагрузками на базу — очень стоит тестировать. И ведь он не только чтение масштабирует, но и запись. Если у вас поток данных входящий больше чем способна записать физическая машина — репликация вообще не поможет. Или read/write может быть таким, что репликация будет работать на пределе своих возможностей и грузить записью все ноды так, что сильно скажется на скорости чтения.

Я вот лично жалею что мне не приходится работать с NDB Cluster больше — нету таких проектов у меня, где применить. А хочется :)

sevka_fedoroff 25 июн 2012 в 19:07

Давно используем Mysql мастер-мастер. В принципе полет нормальный. Еще хотел бы напомнить о таких небезопасных функциях как например NOW() и RAND(). Советую не использовать их при репликации (это касается и обычной MASTER-SLAVE репликации). Хотя вот тут (http://dev.mysql.com/doc/refman/5.1/en/replication-features-functions.html) пишут, что вроде как они реплицируются корректно, но на практике результат может быть непредсказуем. У нас например репликация залипала на полчаса предположительно из-за этих функций.

Sov1et 26 июн 2012 в 16:00

row based replication

AlexSerbul 26 июн 2012 в 16:36

Я бы посоветовал mixed, в row-based может случиться коллапс с объемом траффика :-)

Sov1et 26 июн 2012 в 17:15

Я бв не советовал mixed. Так как там до сих пор баги.

mgyk 25 июн 2012 в 19:15

А можно подробнее про балансировщик? Используете что-то свое или mysql proxy?

AlexSerbul 25 июн 2012 в 19:19

Мы размещены в амазоне и перекидываем трафик между ДЦ веб-сервисом ELB. А в каждом ДЦ машины хотят в свою локальную шарду БД. Поэтому если запахло жареным, чик, трафик переходит в другой ДЦ — проветрилось, возвращается в первый ДЦ. Возможно также эффективно для этого заюзать Elastic IPs, у них время переключения меньше (tcp/ip все таки)

drunken 25 июн 2012 в 20:17

т.е., по сути, у вас нет master-master between regions?
в каждом регионе запущен свой application?

AlexSerbul 25 июн 2012 в 23:15

Идея такая — одна база данных в м-м между датацентрами, но, т.к. Active-Passive, то запись в нее идет ТОЛЬКО из одного датацентра. При переключении трафика запись переключается в другой датацентр. Таким образом мы можем на уровне балансировщиков http-трафика переключать домены между датацентрами.

Т.к. балансировщик амазона может переключать трафик только между датацентрами региона, мы работаем внутри региона. Но в принципе через DNS или амазоновский Route53 можно поднять конфигурацию между регионами/материками.

drunken 26 июн 2012 в 10:00

а, так вы под датацентрами подразумеваете AZ, а я сразу и не понял.
а я-то, было, подумал, что вы что-то новое придумали :)

AlexSerbul 26 июн 2012 в 11:10

Ничего в принципе нового, просто описал технологию, относительно которой вижу кучу заблуждений и разнотолкований.