Как стать автором
Обновить

Построение отказоустойчивого решения на базе Oracle RAC и архитектуры AccelStor Shared-Nothing

Время на прочтение 8 мин
Количество просмотров 3.1K
Всего голосов 8: ↑8 и ↓0 +8
Комментарии 5

Комментарии 5

Oracle ASM и самостоятельно может работать с двумя СХД дублируя данные. Обычно это используется в конфигурации Oracle RAC on Extended Distance Clusters, но можно и в условиях рядом стоящих шкафов.
Также хотелось бы узнать как предлагается решать проблему split-brain — потерю связи между шкафами, когда обе пары сервер-схд будут считать что это просто второй шкаф отключился и можно работать дальше.
На наш взгляд ситуация, при которой откажут ВСЕ линки между шкафами (по паре от каждого сервера, InfiniBand, Ethernet пульс массива), маловероятна. Это больше будет похоже на диверсию. Абсолютной защиты от подобных действий нет.
Решение проблемы split brain — обязательная составляющая кластерного решения. Без этого вообще нет смысла в кластере. И защита от этого есть — различные voting алгоритмы.
У Oracle RAC есть своя защита на основе кворумов. Что касается хранилища, то здесь на текущий момент защита строится на основе дублирования линков между нодами. Помимо этого в ближайшее время будут доступны агенты для хостов, которые будут выполнять роль арбитров.
>А вот с дублированием системы хранения все не так просто. Самый простой вариант – это репликация данных с основной СХД на резервную. Синхронная или асинхронная, в зависимости от возможностей СХД.

Самый простой вариант — это Oracle DataGuard, то есть Standby :)

>Но даже если имеется программная интеграция с приложением, в любом случае, при аварии на основной СХД, потребуется вмешательство администраторов в ручном режиме для того, чтобы переключить кластер на резервное хранилище.

Эти задачи в автоматическом режиме решают такие продукты, например, как IBM PowerHA или HP ServiceGuard.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий