Как стать автором
Обновить

Комментарии 30

Отвал полки во что выльется в этой системе?
Чем данная система лучше DataDomain?
Ничем. Особенно после недавнего выхода DD Boost over Fibre Channel. Но это всё-таки лучше, чем провальный VLS, так что сторонники HP могут порадоваться.
Интересно, хоть и не очень убедительно, и не лишено недостатков.
Например вы уже совершенно традиционно путаете и смешиваете архивное хранения с резервной копией. Если бы вы их не путали, то никогда бы не написали, что для бэкапа «общая неторопливость системы мало кого беспокоит.»
Я понимаю что есть компании где за день набегает ~512Тб ежедневных бекапов, но я не понимаю зачем нужна железка отдельная, если можно и так использовать обычную полку для дисков.
Да еще и ставится софт какой-то в промежутку между бекап системой и полкой.
Всё это круто, но вижу тут ряд минусов:
1. Зачем хранить бекапы бекапов на жесктих дисках с рейдом? Это дорого. Или полка умеет выключать диски с бекапами бекапов и в случае необходимости включать при доступе?
2. Т.е. база дедупликации у филиала и центра единая, раз туда передаются уже дедуплицированные данные?
3. WAN — ok, LAN — ok. FC?
* лента — 1.2 круб/тб. (http://www.wit.ru/equipment/sannas/hp-streamer.asp)
* винт — 1.5 круб/тб (http://key.ru/shop/devices/ustrojstva_hraneniya_i_chteniya_dannyh/hdd_ssd/vinchester_3_tb_wd_caviar_green/)
Согласен с автором.
Все это хорошо, но сколько жрет это электричества, сколько выделяет тепла… а это дополнительное питание, дополнительные кондиционеры…

Мы активно используем ленты, да — это, мягко говоря, не оперативно, но записав раз, можно убрать чемодан с лентами в сейф и забыть до завтра). Как вариант еще смотрим на BD (привет ЭЛАРу с его ценниками),

p.s. это совершенно не значит, что мы против полок) но они совсем для другого… Для работы, но не для хранения точно.
В спокойном состоянии очень мало, ну забили полку с дисками выключите её.
Ну я, например, разделяю хранение «Оперативных» копий, где важна скорость бэкапа/восстановления, на полку и «Долгосрочных» копий, где важна сохранность информации за длительные периоды, на ленту. Ленточки дополнительно можно убрать в несгораемый сейф, что весьма полезно для Disaster Recovery.
А как быть с софтом под linux? Есть коммерческие решения или amanda и bacula наше все?
HP Data Protector лет, наверно, 10 как поддерживается на платформе Линукс. Естественно, только RHEL+SLES.
Symantec NBU, Backup exec
EMC Networker
По поводу масштабируемости дисковых систем можно поспорить. Вы привели цифры лишь о емкости, а как же входяший/исходяший трафик? К примеру, у нас в ДЦ стоит EMC Datadomain 890 у которой максимум 3 порта FC 8Gb/s и больше нет слотов. И стоит лента Quantum Scalar i6000 с 24 LTO5 драйверами FC 4Gb/s (96 драйверов максимум). Получается что для того, чтобы достичь уровня ленточной библиотеки в трафике, нужно несколько DD, стоимость которых зашкаливает. То есть там где нужна реальная масштабируемость и большие объемы резервных копий — лента пока имеет свое место исходя из экономических соображений. Но это скорее частный случай.

А в общем случае, дисковая система выигрывает у ленты так же в силу дополнительного функционала:
— дедупликация
— репликация
— client direct LAN (клиентский сервер может напрямую отправлять данные дисковой системе, без участия медиа-сервера)
У DD890 4 порта FC
Не совсем верно. Ленточные приводы не могут быть использованы совместно, в смысле, что два клиента не могут писать одновременно на один и тот же драйв. При этом скорость записи драйва LTO-5 — 140 МБ/с без компрессии, что заведомо ниже 400 МБ/с (предел для 4-гигабитного FC), поэтому при 24 драйвах у вас заведомо не используется довольно широкая полоса пропускания на каждом порту. В случае Дата Домена, через каждый из 4-х портов (8-гигабитных) вы можете презентовать хоть по 10 приводов, и на каждый из них писать одновременно. Это даёт лучшую утилизацию полосы пропускания, и контроллер Дата Домена имеет достаточные ресурсы, чтобы принимать такой поток.

Но и это ещё не вся история. Несмотря на все эти запредельные скорости, узким местом в бэкапе всё равно остаётся дисковая подсистема клиента, с которой данные читаются. С неё как раз, как правило, и не снять ни 400 МБ/с, ни даже 140.
Именно так… Пропускная способность библиотеки далеко не всегда узкое место…
Два клиента могут вполне использовать один и тот же драйвер, естественно они при этом пишут или читают попеременно. Так же как и один клиент может писать на несколько драйверов. У datadomain полоса пропускания одна на всех клиентов — 4х8 Гб/с. У ленты — каждый драйвер со своим контроллером FC.
DataDomain пишет не только через FC. Никто не мешает писать в то же время и через 1/10Гбит Ethernet. Кроме того — через все существующие интерфейсы потоки идут одновременно и параллельно. А DDBoost работает и через Ethernet, и через FC. Дедупликация же, при использовании DDBoost, начинается именно на клиенте, а не на медиа сервере… Где тут преимущества ленты???
Я ведь написал, что у DD890 только 4 порта, которые уже заняты, интерфейс 10 Гб вставить некуда. Я так же писал в каком конкретном случае лента выигрывает у дисковой системы: большие объемы ежедневного трафика (несколько клонов по 15 То), много клиентов резервного копирования. По экономическим соображениям здесь лента будет выгоднее.

Про дедупликацию сейчас речь не идет. Это тема отдельная, там свои заморочки.
По моему interleaving с нескольких клиентов на одну ленту умеют уже все пишущие на ленты системы бэкапа. Это умел уже «привет из каменного века» Legato Networker 4, двадцатилетней давности.

PS. Что, впрочем, само по себе не слишком уменьшает число недостатков ленты для бэкапа.
У лент есть еще одна неупомянутая большая проблема: Если привод сдох, то в магазин за новым не сбегаешь…
Более того, однажды у нас привод таки здох. Заказали новый, но он прочитать старые бакап-ленты не смог… Свои записанные ленты читал и писал нормально… Поставщик менять привод отказался. С тех пор ленты как решение надежное решение нами не рассматривается в принципе…
Если он у вас был один, то вы ССЗБ.
Не лично у меня, а у работодателя… Ленточный накопитель был в единственном числе и out-of-service у производителя когда я пришел.
Рейд контроллер тоже если умирает, в магазине новый не купите…
Данные с диска можно снять и без RAID контроллера. А с лентой вы в полном пролёте… Привод кстати, отремонтировали, но больше с ним связываться не стали…
Снимите данные с raid5…
Вот именно по этой причине мы не используем RAID5-6…
А в чем проблема реконструкировать софтверно схему чередования страйпов в RAID-5? Она фиксирована и достаточно очевидна. Это умеют уже даже бытового уровня утилитки типа RAID Reconstructor.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий