Как стать автором
Обновить

Комментарии 34

Очень, очень круто, автор молодец. Думаю, специализированная контора вроде OnTrack за такую работу, обратись к ней какой банк, взяла бы несколько десятков килобаксов.
UPS'ы поставили после такого инцидента со «скачком электричества»?
упсы пробило…
Думаю автор понимает прелести RAID6. От такого должно было помочь.
Дополнительно можно организовать независимое питание пар дисков с упсами.
Автор теперь понимает прелести бакапа. :)
RAID is not a backup.
а что вы имели ввиду под сообщением «RAID is not a backup.»
Raid это не бекап.
или Raid нельзя бекапить?
просто я в этом не очень разбираюсь. как я понимаю backup и raid созданы для разных целей. а вот про то что raid нельзя бекапить первый раз слышу.
Ну вы же дословно перевели с первого раза. Зачем надо было добавлять отсебятину? Это яркий пример подхода «слышу то, что хочу услышать».
Не придирайтесь, бывает иногда поговорить охото со своими
Эта фраза переводится как «RAID — это не бэкап».

RAID защищает только от одной напасти — аппаратной поломки жесткого диска. Он не защищает ото всех остальных напастей вроде повреждения файловой системы, да к тому же добавляет ряд собственных напастей.

Поэтому данные, хранящиеся в RAID-массиве, нужно обязательно бэкапить. Если бы у автора статьи имелся бэкап данных, ему не пришлось бы так мучиться с восстановлением данных, при этом рискуя потерять их окончательно. Он бы просто запустил новый массив и скопировал на него данные.

Зачем же тогда нужен RAID? Единственный смысл RAID — обеспечение бесперебойной работы. Если один из дисков массива отказывает, система продолжает работать. В некоторых режимах RAID так же имеется приятный бонус в виде некоторого повышения скорости.

Также есть два не-совсем-RAID режима. Я их так называю, потому что они не обеспечивают бесперебойности. RAID-0 используется для повышения скорости, а JBOD для наращивания объема.

Настройте автоматическое резервное копирование и еженедельно заглядывайте в содержимое бэкапов, убежаясь в том, что всё бэкапится своевременно и в полном объеме.
Типичное заблуждение. Ваш вчерашний бэкап конечно лучше, чем ничего, но как быть с сотней-другой человеко-часов которые вложены в период между бэкапом и аварией?
Я не совсем понял, какое именно утверждение является, по вашему мнению, заблуждением?

Вы хотите сказать, что реанимировать массив целесообразнее, чем восстанавливать резервную копию?

Собственно, я и не утверждал обратного. Я только предположил, что автор не стал бы заниматься восстановлением с риском потерять всё, если бы у него был свежий бэкап.

Но давайте попробуем оценить. Время покупки и установки новых дисков не учитываем, т. к. оно одинаково и для реанимации массива, и для восстановления бэкапа. Сколько времени потребуется на анализ ситуации, копирование туда-сюда, восстановление, всяческие пляски с бубном? Я могу предположить, что автор уложился в один день. Но у менее опытного человека на это уйдет несколько дней, а то и неделя.

В случае же с бэкапом достаточно выкинуть старые диски, поставить новые, инициализировать новый массив с прежним конфигом и накатить бэкап.

При реанимации бэкапа будет потеряно на простое ГОРАЗДО больше человеко-часов.

Я уже не говорю про то, что для реанимации нужно новый массив запустить рядом со старым. В описанном случае это 14 дисков! Куда их пихать?

Так что единственная причина, ради которой я вижу смысл париться с восстановлением массива при наличии бэкапа — это отсутствие в бэкапе невосстанавливаемых данных, например, платежных операций или чего-то столь же чувствительного.

Но для таких данных не используют, блеать, RAID-5! В худшем случае, RAID-1. В лучшем, дублирование всего сервера, кластеризацию, и т. п.

Уже из описанной в статье конфигурации (программный RAID, каждый диск обслуживает по два массива) понятно, что речь о какой-то кустарной системе, типа домашней файлопомойки. Использовать такое в бизнесе, где за неполный день расходуется «сотня-другая человеко-часов», — это нищебродство какое-то.

В бизнесе реанимация массива — это самая внештатная ситуация. Система должна быть настроена таким образом, чтобы в реанимации не было нужды ни при какой аварии.

PS Все сказанное — скромное личное мнение. Плюсанул вам в карму.
Согласен, что подход был выбран несерьёзный.
Автор умалчивает о характере данных. Хотел сказать, что в реальной жизни бэкап обычно не отрицает (попыток) восстановления данных.
Вот, у меня вопрос. Каждый раз одно и то же. А нельзя как-то собрать каким-нибудь цивилизованным способом всю необходимую для восстановления информация сразу после создания RAID? И на компакт диск записать.
В свое время с похожей проблемой без особых проблем восстанавливал с помошью Raid Reconstructor
> с похожей проблемой
> без особых проблем
вы уж определитесь — с или без ))
я думаю еще лет пять и совсем русский язык забудуд =)
А утилиты типа капитана немо, в этом случае разве не могут помочь?
всегда удивляли люди, которые используют raid5/6
ну что ж — ни пуха, ни пера вам!
По Вашему можно использовать только зеркало или в крайнем случае 10?
Ага, raid10 для 14TB
ну что ж — ни пуха, ни пера вам!
Поясню для других — на любых массивах больше терабайта, а лучше начиная с полуТБ, лучше использовать raid6 (ну и конечно со spare диском), способный выдержать падение двух дисков + дополнительная проверка целостности данных за счет двойной суммы, чего нет в raid5/10 и всех других
А в чём проблема?
За статью спасибо, несколько лет ждал когда же мой raid5 упадет, пережил три выключения электричества у хостера.
Но слава богу рейд так и не успел развалиться.
Вот по этому сейчас у меня raid 10(4 диска) и glusterFS еще на три сервера( но это две соседние две стойки)
Итого получаем raid 1+1+1+0.
И бэкап(inotify, раз в день) на географически удаленных хост.
Немножко не в тему, у вас с гластером нет проблем зависания при множественных паралелльных записях?
У нас при больших нагрузках скрипты виснут, что только рестарт гластер-демона помогает, на что я им баг-репорт с полными дебаг-логами отправил, а они мне еще и звонили по этому поводу пару раз.
У нас гластер вообще систему убивал.
загрузка проца\сети — 0. la > 150 :)
решилось обновлением версии.

А записи у вас конкурирующие или как?
Вы там не забыли локи прописать и всякое такое?
Мне вот чем GFS не нравиться — так это своей жуткой конфигурабельностью.
Ну нагрузка тоже была, тоже ок после последнего апдейта + скорость записи на реплику возвросла с 10-12 до 60мб/с, но все до того момента, как параллельные записи не начинаются в большом количестве, после этого гластер даже сам иногда падал, правда и восстанавливался сам :)
в конфиге прописал максимальное performance.io-thread-count: 64
но не думаю, что это значение достигаю

Насчет локов не понял, куда прописать и как?
Посмотрите на type features/locks (server.vol)
заодно посмотрите на type performance/write-behind(client.vol)
и лично у меня option thread-count 16, и больше бы я ни-за-что не ставил бы.
ПС: 3.2.2
Насколько я знаю features.locks больше нет в ветке 3.2.x
а behind конечно стоит, точно также как и cache-size в пару гигов каждые.
я тестировал как с дефолтными настройками, так и с заряженными.
Автор, респект. Если интересно поработать в восстановлении данных, присылайте резюме на agalitski@datarc.ru.
Товарищи, те кто думает, что RAID10 надежнее RAID6, то они ну очень глубоко заблуждаются. У меня где-то >600 дисков в сторождах и уже были случаи выхода из строя двух дисков одновременно в одном сторадже в одной рейд группе и это при том, что ни перебоев питания ничего не было (вообщем в серверной все тип топ). Так вот… когда это случилось я привел скептиков (убеждавших меня сделать RAID5) и ткнул носом в этот предотвращенный факап. Многоуважаемый romx очень все правильно написал в своём блоге, почитайте его реально на многое по-другому посмотрите (я жалею, что у меня не было этого блога когда я начинал :) )
Romx молодец, согласен.
Ух ты, отличные цифры ещё раз доказывающие что RAID 5 — зло.
Но мне, впрочем, хватает того что он просто тормозной. Я обычно делаю RAID-ы 10. Благо харды сейчас не настолько дороги чтобы на них экономить.
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.