24 November 2015

Зачем обновляться до Data ONTAP Cluster Mode?

SAN
Как я уже писал в своих предыдущих постах, Data ONTAP v8.3.x это один из наиболее значимых релизов операционной системы для систем хранения NetApp серии FAS.

В этой статье я приведу наиболее значимые, с моей точки зрения, новые функции систем хранения NetApp в самой последней версии Clustered Data ONTAP. По традиции приведу пример на автомобилях: Представьте у вас есть Тесла автомобиль, вы обновили прошивку и получили автопилот с автопаркингом бесплатно, хотя его там раньше не было. Правда приятно? Так вот самыми главными аргументами обновить вашу систему до Cluster-Mode является сохранение инвестиций и возможность получить самый современный функционал на старом железе:

  • Онлайн детекция (дедупликация) нулей на ходу, что может быть очень полезно в случае БД и провиженинга виртуальных машин.
  • Онлайн дедупликация для FlashPool (и AFF) систем, что позволит продлить срок службы SSD дисков. Функция доступна начиная с 8.3.2.
  • Если обновиться до VMWare vSphere 6, у вас будет поддержка vVOL как с NAS так и SAN
  • QoS — установка максимального порога операций ввода-вывода или Мб/с на файлы, луны, вальюмы и SVM.
  • Поддержка NFS4.1, которая также присутствует у VMware vSphere 6
  • Поддержка pNFS которая позволяет распаралеливать NFS и переключаться между путями от клиента к файловой шаре без её перемонтирования, поддерживается с RHEL 6.4 и выше.
  • Поддержка SMB (CIFS) 3.0 который работает с клиентами начиная с Win 8 и Win 2012
  • Поддержка закрытия файлов и сессий для SMB 3.0 из Data ONTAP
  • Поддержка SMB 3.0 Encription.
  • SMB Continuous Availability (SMB CA), предоставляет возможность переключения между путями и контроллерами хранилища без разрыва соединения, что очень важно для работы SQL/Hyper-V
  • ODX при работе с Microsoft SAN/NAS позволяет сгрузить рутинные задачи, типа забить блок данных определенным патерном, и позволяет не гонять лишних данных между хостом и хранилищем.
  • Онлайн миграция вольюмов по агрегатам, в том числе и на других нодах кластера
  • Онлайн миграция лунов по вольюмах, в том числе и по другим нодам кластера
  • Онлайн переключение агрегатов между нодами HA пары
  • Возможность объединять гетерогенные системы в один кластер. Таким образом апгрейд осуществляется без останова доступа к данным, благодаря такой возможности NetApp называет свой кластер Бессмертным. На момент обновления кластера, его ноды могут состоять из разных версий cDOT. Не могу упустить возможность и не упомянуть, что у большинства конкурентов если кластеризация вообще есть, то она во-первых весьма ограничена по числу нод, а во-торых все ноды кластера обязаны быть идентичными (гомогенный кластер).
  • ADP StoragePool — технология для более рационального распредиления SSD под кеш (гибридные агрегаты). К примеру у вас есть только 4 SSD, а вы хотите чтобы 2, 3 или четыре агрегата получали преимущество от кеширования на SSD.
  • ADP Root-Data Partitioning позволит отказаться от выделенных root агрегатов для систем FAS22XX/25XX/2600 и AFF8XXX/A200/A300/A700
  • Space Reclamation для SAN — возвращает удалённые блоки хранилищу. Напомню что без SCSI3 UNMAP деже если на вашем луне блоки данных удалялись, на тонком луне на самом хранилище эти блоки всё-равно были помечены как используемые и таки занимали дисковое пространство, а любой тонкий лун раньше мог только расти, так как ранее просто не было механизма обратной связи хранилища и хоста. Для поддержки Space Reclamation хосты должны быть ESXi 5.1 или выше, Win 2012 или выше, RHEL 6.2 или выше.
  • Adaptive compression — улучшает скорость чтения компрессированных данных.
  • Улучшения работы FlexClone для файлов и лунов. Появилась возможность задания политик удаления клонов файлов или лунов (будет полезно к примеру с vVOL).
  • Возможность аутентифицировать администраторов СХД при помощи Active Directory (лицензия CIFS не требуется).
  • Поддержка Kerberos 5: 128-bit AES и 256-bit AES шифрование, поддержка IPv6.
  • Поддержка SVM DR (на основе SnapMirror). Т.е. возможность отреплицировать всю SVM на резервный сайт. Важным моментом является возможность на этапе настройки отношений репликации заранее задать новые сетевые адреса (режим Identity discard), так как на резервной площадке, часто используются отличные от основной площадки диапазоны сетевых адресов. Функция Identity discard будет очень удобна не большим компаниям, которые не могут себе позволить оборудование и каналы связи, для того чтобы растянуть L2 домен с основной площадки на запасную. Для того чтобы клиенты переключились на новые сетевые адреса достаточно поменять записи DNS (что может быть легко авмоматизировано при момощи простого скрипта). Также поддерживается Identity preserve режим, когда все настройки LIF, volume, LUN сохраняются на удалённой площадке.
  • Возможность восстановления файла или луна из резервной копии SnapVault не восстанавливая весь вольюм.
  • Возможность интегрировать СХД с антивирусными системами для проверки файловых шар. Поддерживаются Computer Associates, McAfee, Sophos, Symantec, Trend Micro и Kaspersky.
  • Оптимизирована работа FlashPool/FlashCache. Позволяет кешировать компрессированные данные и большие блоки (ранее оба этих типа данных не попадали в кеш).






Сетевое подключение 7-Mode (вверху) и Cluster-Mode (внизу) для FAS2240-2.

Обновление FAS22XX


Во-первых обязательно необходимо наличие 10Gbit Mezzanine адаптера. Если у вас FC Mezzanine, его будет необходимо заенить на 10Gbit и перейти на iSCSI.

Во вторых будьте готовы пожертвовать один 10Gbit порт с каждого такого контроллера под нужды Cluster-Interconnect. Это обязательный минимум. Можно отдать один или два порта 10Gbit порта с контроллера, если под кластерный интерконнект выделен один порт 10Gbit, не пожадничайте отдать ещё один порт 1Gbit под те же нужды, хотя это уже не является обязательным требованием. Другими словами обновление может повлечь изменение дизайна вашего сетевого подключения.

Если у вас уже использовалась Active-Passive конфигурация, то вы сможете сэкономить 3-4 диска высвобожденные из под Root агрегат благодаря ADP Root-Data partitioning.

Почему есть смысл обновлять FAS22ХХ до cDOT

Вместо четырех портов 10Gbit с двух контроллеров в 7-Mode мы получим два 10Gbit порта в Cluster-Mode: по подному порту с контроллера, для подключения хостов.
Во-первых, отказоустойчивость такого решения не страдает потому-что LIF интерфейсы в случае отказа линка или контроллера переезжают вместе с IP и MAC адресами на второй контроллер в онлайне. Если это iSCSI, то со стороны хоста просто происходит переключение пути к хранилищу, на уровне драйвера мультипасинга (SAN LIF'ы не ездят, вместо этого работает мультипасинг).

Во-вторых, некоторые пользователи пробовали запускать синтетическую нагрузку и им не удалось нагрузить два из четырех линков более чем на 40% при 48x SAS 10k дисках, остальные два всё-равно простаивали. А в штатном режиме работы утилизация линков у того же пользователя не достигала 10%. Другой заказчик живёт на cDOT 8.3.1 и системой FAS2240 20x900 +4 SSD в конфигурации Active-Passive (т.е. по-сути используется только один 10Gbit линк, второй пассивно ожидает когда он понадобится в аварийном случае) и не наблюдает каких-либо отрицательных изменений в скорости доступа к хранилищу после перехода на Cluster-Mode, имея при этом всю свою, не малую, виртуальную инфраструктуру живущую на этом хранилище.

Посмотреть текущую нагрузку для Ethernet портов на 7-Mode
Нас больше всего интересует поле Bytes/second в разделе RECIVE и TRANSMIT:
system1> ifstat e1a

-- interface  e1a  (8 days, 20 hours, 10 minutes, 27 seconds) --

RECEIVE
Frames/second:   12921  | Bytes/second:    46621k | Errors/minute:       0
Discards/minute:     0  | Total frames:    11134k | Total bytes:     38471m 
Total errors:        0  | Total discards:      0  | Multi/broadcast:     0    
No buffers:          0  | Non-primary u/c:     0  | Bad UDP cksum        0
Good UDP cksum    2044  | Redo UDP cksum       0  | Bad TCP cksum        0
Good TCP cksum       0  | Redo TCP cksum       0  | Tag drop:            0 
Vlan tag drop:       0  | Vlan untag drop:     0  | Mac octets        9472k
UCast pkts:      72750k | MCast pkts:        187k | BCast pkts:      15181   
CRC errors:          0  | Bus overrun:         0  | Alignment errors:    0   
Long frames:         0  | Jabber:              0  | Pause frames:        0  
Runt frames:         0  | Symbol errors:       0  | Jumbo frames:    42959k 

TRANSMIT  
Frames/second:   12457  | Bytes/second:     2936k | Errors/minute:       0    
Discards/minute:     0  | Total frames:    10710k | Total bytes:      2528m
Total errors:        0  | Total discards:      0  | Multi/broadcast:   971   
Queue overflows:     0  | No buffers:          0  | Frame Queues:        0
Buffer coalesces:    0  | MTUs too big:        0  | HW UDP cksums:       0
HW TCP cksums:       0  | Mac octets:        110k | UCast pkts:          974 
MCast pkts           4  | BCast pkts:        967  | Bus underruns:       0
Pause fraMes:        0  | Jumbo frames:        0  

LINK_INFO  
Current state:       up | Up to downs:         1  | Speed:           10000m
Duplex:            full | Flowcontrol:       full


При обновлении вашей СХД с 7-Mode до Cluster-Mode с переносом данных на временную СХД и потом онлайн миграцией данных назад, можно воспользоваться подручными свичами.

Обновление систем 32XX и 6XXX


Обновление старших систем, как правило не приводит к каким-либо изменениям в подключении хранилища к сети так как в них либо есть 10Gbit порты для Cluster Interconnect на борту, либо их туда можно доставить в свободный PCI слот.

В системах 32ХХ на борту нет 10Gbit портов, но их можно доставить в свободный PCI разьём.

В системах 6XXX на борту уже есть 10Gbit и можно либо задействовать их либо нужно будет докупить 10Gbgit NIC есле свободных портов нет.

Выводы


Возможность обновить ваши старые СХД NetApp это способ сохранения инвестиций, даже с учётом того, что на FAS22XX системах теряется один 10Gbit порт с контроллера, «игра стоит свеч», благодаря широкому дополнительному функционалу. Для более старших систем конвертация, как правило, вообще не влечёт изменения подключения к сети. У многих других уважаемых вендоров, процесс обновления это, обычно, полная замена железа, в том числе и дисковых полок. NetApp в этом плане намного более гибче благодаря возможности обновлять старое железо самыми новыми прошивками и возможности подключения всех полок от своих старых СХД, а разграничения совместимости дисковых полок между классами Low/Mid/High-End попросту нет. Бессмертный кластер позволяет объединять разные модели и безостановочно его вертикально и горизонтально масштабировать, а также апдейтить и апгрейдить.

Сообщения по ошибкам в тексте прошу направлять в ЛС.
Замечания, дополнения и вопросы по статье напротив, прошу в комментарии.
Tags:Netappnetapp fasfascdotcdot 8updateCluster-ModeClustered ONTAP7-Mode Transitionnetapp dataontap 8.3
Hubs: SAN
+5
5.3k 19
Comments 31