Как стать автором
Обновить

Комментарии 7

можно использовать ZFS или BtrFS, но тут стоит несколько раз подумать: обе требуют гораздо более серьезного подхода к ресурсам, к тому же ZFS не идет в комплекте с ядром Linux.

Я бы сказал, zfs требует более серьезного подхода к настройке. Ну не идет она в комплекте с ядром Linux и что из того? Вообще, а что ИДЁТ в комплекте с ядром?
В современных дистрибутивах поддержка zfs ставится в 2 команды. Вообще без проблем.


Поскольку современные HDD уже перешагнули планку в 10тб в одном диске — обязательно применение файловых систем или RAID с контрольными суммами, потому что за время перестройки массива или восстановления файловой системы (несколько суток!) может выйти из строя второй диск из-за повышенной нагрузки.

А вы могли бы расскрыть это предложение? Т.е я понимаю о чем примерно хотелось тут сказать, но сформулировано крайне странно и смешано несколько разных проблем в одну кучу.


И да, "несколько суток" восстановления будет обеспечено с железным RAID (примерно как и инициализация), программные raid имеют представление о ФС, поэтому в том числе могут восстанавливать только реально используемое место, а не тупо зеркалировать байт-в-байт.


В целом, тема хранилищ сложная и уже давно всё придумано — облачных хранилищ дофига и больше, выбирай на любой вкус. Их надёжность будет в 99.9 случаях выше, чем то, что будет навелосипежено по такой статье (не обижайтесь).

А вы могли бы расскрыть это предложение? Т.е я понимаю о чем примерно хотелось тут сказать, но сформулировано крайне странно и смешано несколько разных проблем в одну кучу.

От диска ожидается бесконечная надежность, если кратко. В реальных условиях это не так, поскольку есть ошибки чтения, пропускаемые всеми компенсационными механизмами и алгоритмами коррекции. С ростом объема дисков растет число этих ошибок, причем зависимость от объема не совсем линейная (сильнее растет). ЕМНИП я это читал в отчетах по статистике жестких дисков от BackBlaze, а также была рекомендация старшего коллеги: на нескольких дисках объемом от 1тб лучше применять raid6 или raidz2+.


В целом, тема хранилищ сложная и уже давно всё придумано — облачных хранилищ дофига и больше, выбирай на любой вкус. Их надёжность будет в 99.9 случаях выше, чем то, что будет навелосипежено по такой статье (не обижайтесь).

Никаких обид, все верно написано! Но есть товарищи, выбирающие быстро и дешево из быстро-дешево-качественно, эта схема хоть как-то позволяет компенсировать их выбор.

Из опыта — 12 дисков HGST/WD 8 тб. Контроллер Dell perc 830. Raid 5 — ребилд 12 часов.
И никакого лишнего ахтунга…

А вы смелый =) Либо не знаете о проблемах R5 с большими дисками.
И время ребилда, безусловно, зависит от нагрузки. Если кроме ребилда никто с массивом не работает, то в принципе поверю в 12ч. Но в продакшене такие массивы редкость. Разве что архивный сервер какой.

Разве что архивный сервер какой.

Ну об этом и статья…
И о бэкап сервере и говорю.

Ну и как бы неприятно потерять бэкап сервер, не? :)

Бесконечной надёжности от диска вряд ли ожидает даже новичок в нашем деле =)
Но не суть. Верно, с ростом объема сталкиваемся с bite error rate (BER). Ваш коллега тоже прав насчет r6/raidz2+. Но в статье вы пишите немного по другому: что во время ребилда может выйти из строя еще один диск И что нужно использовать фс/raid с контрольными суммами.
Но это оба не верно. =)
Выход из строя еще одного диска во время ребилда:
а) это совсем другая проблема и вообще говоря она не зависит от объема. С объемом несколько растет вероятность, но не он причина.
б) R5 — это тоже уровень с контрольными суммами, но он не спасает при отказе второго диска в ребилде.
в) Строго говоря от этой проблемы можно защититься и тройным зеркалом, без каких-либо контрольных сумм. Вопрос цены.


А вот raid6 или raidz2/z3 действительно спасают И от выхода из строя второго(и третьего — для z3) диска при ребилде, И от пойманной ошибки чтения с живых дисков при ребилде. Это разные случаи. Диск может быть жив, но при чтении будет получена ошибка.


Кстати, раз пошла такая пьянка — это вот почему ZFS'ный RaidZ1 круче своего железного аналога R5 — при ошибке ребилда R5 ВЕСЬ ваш массив говорит гудбай, без вариантов.
В случае с Z1 ZFS знает какой блок диска чему соответствует в ФС, поэтому при некоторой доле везения будут потеряны 1 или несколько файлов, но пул останется жив. Конечно, тоже неприятно, но, согласитесь, это на порядки лучше случая "всё или ничего" =)


Вообще, про ZFS пора писать статью...

Зарегистрируйтесь на Хабре, чтобы оставить комментарий