degas 25 сен 2013 в 11:06

Уникальное решение IaaS от компании «Микротест»

6 мин

Блог компании «Медиа Грус»

Комментарии 37

datacompboy 25 сен 2013 в 11:24

А где дубляж стораджа?
Или надеетесь, что полка не сдохнет?

track 25 сен 2013 в 11:49

Сторадж сдублирован контроллерами (их два). Полка даже если и сдохнет (крайне редкий случай, наводнеия и пожары в применении к продакшн-системам я видел, отказа полки (вот именно полки) — нет), то при использовании вендорской Best Practices это не выбивает более 2 дисков в единой дисковой группе RAID, что вполне переживает без потери данных RAID-DP (RAID-6)/

-3

amarao 25 сен 2013 в 16:46

Полка не сдохнет, wafl не устроит панику, всё будет просто офигенно, вы купите, главное.

datacompboy 25 сен 2013 в 18:07

И диски не мрут больше двух за раз на 40 штуках.

track 25 сен 2013 в 18:59

Больше 2 раз в RAID-группе, не забывайте. А так — если группы небольшие, то их может быть в результате довольно много.
На 48 дисках (две нарисованные на схеме полки) при значении размера группы по умолчанию это будет 3*2=6 дисков одновременно.
Все ж в итоге упирается в деньги. Нужна супер-супер надежность — есть Metrocluster.

datacompboy 25 сен 2013 в 19:05

Угу. Кто сказал, что эти 6 дисков будут из разных групп?
К сожалению, как раз это НЕ ТАК.
Распределение не равномерное.

Так же, как бэды не равномерно по диску распределяются — а «пятном».
По той же причине на CDROM данные равномерно размазывают, чтоб восстановление работало при царапинах, а не надеются, что царапина будет равномерно размазана по диску.

track 25 сен 2013 в 19:09

Да вы мне глаза открыли :)
Вы написали про «максимум» — я вас поправил, только и всего. Максимум — 6 на 48, при группе по умолчанию. При наличии саппорта 24х7 это знание довольно теоретическое.

Видите как, построить сторадж, устойчивый к прямому попаданию снаряда из гаубицы можно. Но встает вопрос экономической целесообразности получившегося. :)

datacompboy 25 сен 2013 в 19:14

Да главное, чтоб диски были не из одной партии, остальное мелочи

track 25 сен 2013 в 19:22

И потом как вы себе представляете «подряд»? В сторадже физически диски в группу назначаются как раз не подряд, а весьма в разнобой, так что даже если вы просто вынете из полки любых 3 подряд диска, они не будут в одной группе, тут все продумано :)

datacompboy 25 сен 2013 в 19:29

Это супер. Но SPOF присутствует, а решить его вы не сможете.

Бакапы полки как часто пишутся и куда?

track 25 сен 2013 в 19:47

В смысле? Что есть SPOF? Что значит «не сможете»?

datacompboy 25 сен 2013 в 21:23

en.wikipedia.org/wiki/SPOF

track 25 сен 2013 в 21:32

Я конечно знаю что такое Singlе Point of Failure, мне непонятно что вы вкладываете в это понятие в данном случае.
У меня есть подозрение просто, что вы не вполне ясно представляете себе что такое NetApp, как он работает, и как в нем организуется дисковое пространство.

datacompboy 25 сен 2013 в 21:39

Какой у вас объём наработки такого решения уже в месяцах 24*7?

track 25 сен 2013 в 21:43

Я думаю, вы это Микротесту, а не лчно мне. Думаю они ответат, это в конкретном случае не моя система.

datacompboy 25 сен 2013 в 21:50

Нет, лично к вам.

track 25 сен 2013 в 21:53

Тогда снова не понимаю вопроса. В аналогичном сторадже за два года сбоев с потерей данных и unplanned downtime не было.

datacompboy 25 сен 2013 в 22:01

А рекавери планы у вас написаны только на те ситуации, которые были, или есть которые еще не случались?

track 25 сен 2013 в 22:13

А как же без рекавери планов :)
Вы задавайте конкретнее вопросы, будут получаться конкретнее ответы.

datacompboy 26 сен 2013 в 08:48

Я так понимаю, ответ «Есть планы на ситуации, которые еще не случались»?

track 27 сен 2013 в 10:55

К разговору, удачно на глаза попалось :)
blog.aboutnetapp.ru/archives/1144

datacompboy 27 сен 2013 в 15:01

да вот почему я и спрашиваю о планах.

JDima 25 сен 2013 в 14:12

• Сетевая инфраструктура:
— Catalyst 2960S 24 GigE;
— Nexus 5548;
— Cisco ASR1001.

L3 на чем из этого терминируете?
И под что задействованы каталисты?

track 25 сен 2013 в 16:28

Каталисты тут, я понимаю, для подключения внешних клиентов и тех, кому достаточно гигабита к стораджу.
Nexus — это внутренняя фабрика решения.
Вернее так: клиенты к приложениям — Catalyst, потом приложения на UCS, которые от себя ходят к стораджу по Nexus по «десятке». Сторадж как таковой, как я понимаю, не предоставляется, только сервисы на нем.

JDima 25 сен 2013 в 16:32

Каталисты тут, я понимаю, для подключения внешних клиентов и тех, кому достаточно гигабита к стораджу.

Если клиенты живут на UCS, то это не логично.

Nexus — это внутренняя фабрика решения.

N5K — это внешние свитчи, к которым подключаются корзинные фабрики. Они в целом могут делать L3, но… В общем, интересно узнать, решились ли микротесты на такое.

track 25 сен 2013 в 16:46

Да думаю все просто, это же NetApp/Cisco FlexPod, хорошо и детально описанная архитектура.
Например вот: www.netapp.com/us/media/tr-4036.pdf или www.netapp.com/us/media/tr-4058.pdf

JDima 25 сен 2013 в 16:49

А в каком месте там упоминаются каталисты или точка приземления L3?

track 25 сен 2013 в 17:49

Ну так про то и речь, что это внешнее, по отношению к FlexPod оборудование.

JDima 25 сен 2013 в 18:40

Так про то и речь, что мне интересно, как это у них реализовано, а не в паверпоинте.

degas 25 сен 2013 в 16:57

L3 на себя терминирует ASR1001
Каталисты используются для обвязки ASR с основным и резервным провайдером.

JDima 25 сен 2013 в 17:04

L3 на себя терминирует ASR1001

Их, надеюсь, более одного?

А так — неплохо. Экономичное и (при не самых больших объемах трафика) эффективное решение.

degas 25 сен 2013 в 21:02

Каталисты в стеке, ASR – дублированы.
В нексусах также установлены модули L3. Используются для маршрутизации между VLAN-ами

JDima 25 сен 2013 в 21:42

Каталисты в стеке

А вот это очень печально, если стек всего один. Вы получаете единую точку отказа — control plane каталистов. Лично меня разные вариации на тему стеков подводили не раз и не два. Вы спасетесь лишь от самого простого и скучного вида аварии: «дернули питание на одном из свитчей». А «стек-мастер заглючил, но недостаточно сильно для автоматического фейловера» приведет к полной катастрофе.

В нексусах также установлены модули L3

Ну собственно про это я изначально и спрашивал.
Тоже не очень здорово. Теряете возможность обновлять софт на железке, не теряя ни единого пакета, ну и еще по мелочи. Скажем так, N5K на самом деле L2 свитчи. Первоклассные L2 свитчи. L3 функционал в них внедрен насильственно, он для них не родной.

С другой стороны на N7K ценник уже несколько иной…

arkady 25 сен 2013 в 16:29

Физически это надеюсь не в России находится? А то если раньше маски-шоу приходили к тебе и изымали сервера, теперь это может произойти по вине любого соседа по кластеру.

track 25 сен 2013 в 16:44

Можно подумать в Украине лучше. ;)

arkady 25 сен 2013 в 23:50

Причем тут Украина? У нас не лучше, как и во всем СНГ.

degas 25 сен 2013 в 16:56

В таких системах обычно спец. службы приходят и переписывают нужные данные в рамках правового поля, а не изымают весь АПК.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий