Как стать автором
Обновить

Комментарии 37

А где дубляж стораджа?
Или надеетесь, что полка не сдохнет?
Сторадж сдублирован контроллерами (их два). Полка даже если и сдохнет (крайне редкий случай, наводнеия и пожары в применении к продакшн-системам я видел, отказа полки (вот именно полки) — нет), то при использовании вендорской Best Practices это не выбивает более 2 дисков в единой дисковой группе RAID, что вполне переживает без потери данных RAID-DP (RAID-6)/
Полка не сдохнет, wafl не устроит панику, всё будет просто офигенно, вы купите, главное.
И диски не мрут больше двух за раз на 40 штуках.
Больше 2 раз в RAID-группе, не забывайте. А так — если группы небольшие, то их может быть в результате довольно много.
На 48 дисках (две нарисованные на схеме полки) при значении размера группы по умолчанию это будет 3*2=6 дисков одновременно.
Все ж в итоге упирается в деньги. Нужна супер-супер надежность — есть Metrocluster.
Угу. Кто сказал, что эти 6 дисков будут из разных групп?
К сожалению, как раз это НЕ ТАК.
Распределение не равномерное.

Так же, как бэды не равномерно по диску распределяются — а «пятном».
По той же причине на CDROM данные равномерно размазывают, чтоб восстановление работало при царапинах, а не надеются, что царапина будет равномерно размазана по диску.
Да вы мне глаза открыли :)
Вы написали про «максимум» — я вас поправил, только и всего. Максимум — 6 на 48, при группе по умолчанию. При наличии саппорта 24х7 это знание довольно теоретическое.

Видите как, построить сторадж, устойчивый к прямому попаданию снаряда из гаубицы можно. Но встает вопрос экономической целесообразности получившегося. :)
Да главное, чтоб диски были не из одной партии, остальное мелочи
И потом как вы себе представляете «подряд»? В сторадже физически диски в группу назначаются как раз не подряд, а весьма в разнобой, так что даже если вы просто вынете из полки любых 3 подряд диска, они не будут в одной группе, тут все продумано :)
Это супер. Но SPOF присутствует, а решить его вы не сможете.

Бакапы полки как часто пишутся и куда?
В смысле? Что есть SPOF? Что значит «не сможете»?
Я конечно знаю что такое Singlе Point of Failure, мне непонятно что вы вкладываете в это понятие в данном случае.
У меня есть подозрение просто, что вы не вполне ясно представляете себе что такое NetApp, как он работает, и как в нем организуется дисковое пространство.
Какой у вас объём наработки такого решения уже в месяцах 24*7?
Я думаю, вы это Микротесту, а не лчно мне. Думаю они ответат, это в конкретном случае не моя система.
Нет, лично к вам.
Тогда снова не понимаю вопроса. В аналогичном сторадже за два года сбоев с потерей данных и unplanned downtime не было.
А рекавери планы у вас написаны только на те ситуации, которые были, или есть которые еще не случались?
А как же без рекавери планов :)
Вы задавайте конкретнее вопросы, будут получаться конкретнее ответы.
Я так понимаю, ответ «Есть планы на ситуации, которые еще не случались»?
да вот почему я и спрашиваю о планах.
• Сетевая инфраструктура:
— Catalyst 2960S 24 GigE;
— Nexus 5548;
— Cisco ASR1001.

L3 на чем из этого терминируете?
И под что задействованы каталисты?
Каталисты тут, я понимаю, для подключения внешних клиентов и тех, кому достаточно гигабита к стораджу.
Nexus — это внутренняя фабрика решения.
Вернее так: клиенты к приложениям — Catalyst, потом приложения на UCS, которые от себя ходят к стораджу по Nexus по «десятке». Сторадж как таковой, как я понимаю, не предоставляется, только сервисы на нем.
Каталисты тут, я понимаю, для подключения внешних клиентов и тех, кому достаточно гигабита к стораджу.

Если клиенты живут на UCS, то это не логично.
Nexus — это внутренняя фабрика решения.

N5K — это внешние свитчи, к которым подключаются корзинные фабрики. Они в целом могут делать L3, но… В общем, интересно узнать, решились ли микротесты на такое.
А в каком месте там упоминаются каталисты или точка приземления L3?
Ну так про то и речь, что это внешнее, по отношению к FlexPod оборудование.
Так про то и речь, что мне интересно, как это у них реализовано, а не в паверпоинте.
L3 на себя терминирует ASR1001
Каталисты используются для обвязки ASR с основным и резервным провайдером.
L3 на себя терминирует ASR1001

Их, надеюсь, более одного?

А так — неплохо. Экономичное и (при не самых больших объемах трафика) эффективное решение.
Каталисты в стеке, ASR – дублированы.
В нексусах также установлены модули L3. Используются для маршрутизации между VLAN-ами
Каталисты в стеке

А вот это очень печально, если стек всего один. Вы получаете единую точку отказа — control plane каталистов. Лично меня разные вариации на тему стеков подводили не раз и не два. Вы спасетесь лишь от самого простого и скучного вида аварии: «дернули питание на одном из свитчей». А «стек-мастер заглючил, но недостаточно сильно для автоматического фейловера» приведет к полной катастрофе.
В нексусах также установлены модули L3

Ну собственно про это я изначально и спрашивал.
Тоже не очень здорово. Теряете возможность обновлять софт на железке, не теряя ни единого пакета, ну и еще по мелочи. Скажем так, N5K на самом деле L2 свитчи. Первоклассные L2 свитчи. L3 функционал в них внедрен насильственно, он для них не родной.

С другой стороны на N7K ценник уже несколько иной…
Физически это надеюсь не в России находится? А то если раньше маски-шоу приходили к тебе и изымали сервера, теперь это может произойти по вине любого соседа по кластеру.
Можно подумать в Украине лучше. ;)
Причем тут Украина? У нас не лучше, как и во всем СНГ.
В таких системах обычно спец. службы приходят и переписывают нужные данные в рамках правового поля, а не изымают весь АПК.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий