ableev Apr 23 2013 at 11:46

Бюджетное решение для бэкапа целого офиса

8 min

36K

Badoo corporate blogPuppet*

+50

Comments 46

SamOwaR Apr 23 2013 at 12:39

В итоге получаем диски, смонтированные в директорию /storage/sd${i}, где ${i} ― одна из букв нашего диска.

А как вы потом всё это объединяете в один массив?

beho1der Apr 23 2013 at 13:14

А они и не объединяют, поди программно отслеживает сколько свободно на каком диске и туда пишется! ИМХО

banuchka Apr 23 2013 at 13:30

да, почти так:

— у каждого блочного устройства есть как минимум объем
— для каждого устройства есть «карта пользователей»
— gui при заведении нового пользователя предлагает «оптимальное» размещение, которое оператор может принудительно поменять (оптимальное исходя из оставшегося места, а также исходя из того, какое кол-во пользователей уже пишут в этот раздел)

в случае удаления пользователя место очищается, происходят изменения в «карте» и все пошло-поехало дальше.

UFO just landed and posted this here

banuchka Apr 23 2013 at 13:32

для важной информации — иная стратегия бекапов, также как и место их хранения.
В данном случае показан пример бекапа лептопов/рабочих станций.

Greendq Apr 23 2013 at 13:46

Мы у себя используем смесь rsnapshot и Duplicati — рабочие станции на винде, макаоси и линуксах. Полёт нормальный уже который год. Пару раз требовалось откатиться — проблем не было. Разумеется, пользователи _вообще_ не задумываются о самом резервном копировании — всё автоматизировано.

norguhtar Apr 23 2013 at 14:05

Ребят ну вы реально не ищите легких путей. Особенно здорово с головняком в 24 диска. При этом использование RAID6 даст приемлемую надежность и отсутствие

«Что будет, если умрёт один из дисков, на котором были бэкапы пользователей?» ― спросите вы. Попросим забэкапиться ещё раз после замены диска. Вероятность того, что один из 24 дисков умрёт вместе с ноутбуком сотрудника, действительно мала. В крайнем случае мы попытаемся восстановить утраченную информацию.

ableev Apr 23 2013 at 16:11

В данном случае нам не нужен рейд, о чём и было сказано. Если будет рейд — мы дольше будем ребилдиться, чем начинать процесс бэкапа пользователей на новый диск.

-1

norguhtar Apr 24 2013 at 06:00

Ничего что при ребилде у вас при этом данные пользователей не только не теряются, но еще и бекапиться без проблем можно? Опять же добавление hotspare проблему нам надо срочно поменять диск уберет.

brammator Apr 25 2013 at 09:45

Ребилдиться можно параллельно с бэкапом или восстановлением.

symbix Apr 25 2013 at 11:14

Да на лету все ребилдится прекрасно. :)

Вы, видимо, поддерживаете также и production badoo, и у вас инерция мышления. На production-сторадже действительно отдельные диски — самое эффективное решение, но для задачи бэкапов офиса raid6 подходит прекрасно.

banuchka Apr 25 2013 at 12:08

мы достаточно рассказали о причинах такого применения, что не заставляет вас следовать по нашему пути.
в данном топике бОльший интерес представляет програмная составляющая, а не то есть ли RAID.

symbix Apr 25 2013 at 15:12

Аргумент про максимум объема принимается, OK :)

BmW Apr 23 2013 at 14:10

Объединение в массив+дедубликация, полагаю, дала бы больше гибкости, удобства и в итоге пространства чем распихивание руками по 24 отдельным дискам.

beho1der Apr 23 2013 at 14:33

дедубликация на такие обьемы требует солидное количество памяти на сервере, а в статье сказано про бюджетное решение!

norguhtar Apr 23 2013 at 14:37

Солидное это сколько гиг? А то 16 гиг сейчас вполне бюджетно посмотавить.

beho1der Apr 23 2013 at 14:55

для ZFS вроде это значение 10Gb на 1Tb дедублицированных данных

BmW Apr 23 2013 at 15:14

l2arc?

beho1der Apr 23 2013 at 15:20

Интересно за сколько выгорит SSD под l2arc на такой машине? Практического опыта с ZFS не имею!

BmW Apr 23 2013 at 15:29

Полагаю, там over 90% — операции чтения, сколько у вас данных заливается в день? Подсчитать примерное количество блоков(пусть по 64к), вычесть те что дедублицируются и умножить на 320 байт. Получим ежедневную запись на SSD, дальше смотрим сколько производители гарантируют жизни при каких объемах записи. В соседней вкладке 20гб/сутки и 5 лет ocz обещает.

beho1der Apr 23 2013 at 15:35

Ну не у меня, я никакого отношения к badoo не имею! Насколько я понял их схему там как раз операций чтения то мало и они редки, там больше запись. И я думаю что периодически(раз в неделю\месяц) туда делаются полные снимки систем и далее только инкрементальный! Может создатель топика раскроет текущие обьемы записи в месяц!

BmW Apr 23 2013 at 17:52

Простите, почему-то подумал, что вы — автор. Про операции чтения я имел в виду именно обращения к таблице хешей для дедубликации а не запись данных.

garbager Apr 24 2013 at 02:27

На счёт «ненадежности» SSD у меня асус ееерс 701, купленный в апреле 2008 года, в мае на нём был разбит экран и он приспособлен под файлопомойку + качалка торрентов (freenas) Два винта по USB и кеш ZFS на SSD
Я был уверен что диск умрёт, даже извещение о кончине настроил себе в мыло

5 лет — жив

ableev Apr 23 2013 at 16:19

Нет. Решение расчитано на то, что это и проще настраивать и проще в будущем поддерживать. Чуть выше про ребилд уже написал. Потерять на время малую часть данных, которая восстановится вполне быстро, оптимальнее, чем потерять большую часть.

-2

norguhtar Apr 24 2013 at 06:02

Ага по дискам в ручную распихивать данные проще чем один раз настроить RAID6 с hotspare и извещения о смерти диска.

SamOwaR Apr 23 2013 at 14:20

А ещё интересно — к чему у вас эти 24 диска подключены?

banuchka Apr 23 2013 at 15:56

вы это серьезно спрашиваете? вас что именно в подключении интересует?

SamOwaR Apr 23 2013 at 16:14

Шасси, контроллер, сколько их, или вы мультипликторы используете? Это действительно очень интересно. Обычно такое количество дисков ставится только в специализированные хранилища.

banuchka Apr 23 2013 at 16:59

бюджетный корпус Supermicro на 4U, LSI MegaRAID-контроллер (по-моему, до 128 устройств) + бекплейн, который идет вместе с корпусом. Повторюсь, что от контроллера нам не нужно большой отдачи, т.к. работает он напрямую с отдельным диском, не занимаясь подсчетом контрольных сумм, зеркалированием и прочим.
Т.е. изначально задача была такой:
— делать бекапы на рабочие станции и лептопы;
— охватить все ОС;
— не дорого;
— просто в эксплуатации (т.к. это все на поддержке HelpDesk);

в результате мы получили систему, которая отвечает всем нашим требованиям.

SamOwaR Apr 23 2013 at 17:20

24-ти портовый MegaRAID? За $1.2k? Бюджетное решение? Если это он, то использовать его без RAID-а только как хост-контроллер, ну знаете.

banuchka Apr 23 2013 at 17:46

на данном примере стоит вот это store.lsi.com/store.cfm/MegaRAID_Controllers/9265_Controllers/LSI00278, диски как JBOD

SamOwaR Apr 23 2013 at 19:54

Хорошо, всего $700. Тогда ещё нужно шасси с экспандером на 24 порта. ИМХО — не бюджетно!
Бюджетно, это когда натыкать SATA-multiplier-ов в штатные порты на материнской плате, или 6 штук копеечных 4-х портовых SATA-контроллеров.

banuchka Apr 24 2013 at 12:24

понятие «бюджетное решение» в рамках того, сколько пользователей вам надо бекапить — трактоваться может по-разному. Если вам нужно бекапить 10 человек, то подойдет и обычнй tower, например, соотв. и бюджет будет сильно ниже. В данной статье автор уделил минимум внимания «железной» состовляющей, т.к. эта часть может очень сильно разниться. Цель — показать то, насколько просто можно реализовать удобную систему резервирования для офиса.

SamOwaR Apr 24 2013 at 13:03

Цель — показать то, насколько просто можно реализовать удобную систему резервирования для офиса.

Тогда статью стоило бы назвать «Простое решение ...»? В «бюджетном» варианте названия, очень бы хотелось увидеть цифры (бюджет=цифры) — во сколько вам обошлась система, сколько стоит бэкап в пересчёте на одного пользователя, а также сравнение с не-бюждетными решениями. Хотя «простое», тоже не совсем подходит, так как вы придумали себе сложности в виде отказа от RAID-а и привязки пользователей к конкретным разделам. А как быть, если на каждом разделе останется по «хвостику», недостаточному для бэкапа очередного пользователя, но в сумме этих «хвостиков» хватит ещё на нескольких? Т.е. осталось по 200Гб хвостов (всего 200х24=4.8Тб свободного места!), а забекапить пользователя с его 300Гб вы уже не можете.

banuchka Apr 24 2013 at 15:29

мы, мне кажется, достаточно сказали о причинах того, почему нет рейда. В случае, если у нас 24 диска по 3Tb каждый, то 4.8Tb — это не так много.

BmW Apr 23 2013 at 17:57

Все очень просто!

basanovich.livejournal.com/163813.html

-3

banuchka Apr 23 2013 at 18:12

думаю, что если оно вам на самом деле интересно — автор может сделать фотографию машинки. Она сильно симпатичнее показаной вами.

BmW Apr 23 2013 at 19:35

Зачем? Четырехюнитовый супермикро можно и на сайте посмотреть.

dargo Apr 23 2013 at 15:09

На мой взгляд, backuppc делает тоже самое и даже больше.

banuchka Apr 23 2013 at 16:00

Идея осуществлять резервное копирование встроенными средствами представленный в заголовке ОС: Time Machine (OS X), Backup and restore (MS Windows), ну и что_угодно (Linux).
Backuppc + OS X — расскажите, пожалуйста, возможно, что мы что-то упустили.

imwode Apr 24 2013 at 00:13

а у вас виндовый бэкап работает? У меня нет. Не может закончить операцию. МС в курсе. фикса нет.

ableev Apr 24 2013 at 00:37

Да, пользователи бэкапятся, и тестировали несколько раз, как бэкап, так и рестор. Всё было в порядке, по-моему.

imwode Apr 24 2013 at 01:22

Ну вот для примера:
social.technet.microsoft.com/Forums/en-US/w7itprogeneral/thread/3f96d794-df4a-47a3-9cb8-e210f4527005/

Куча статей на эту тему… Бэкап либо вылетает, либо залипает…

hHeX Apr 24 2013 at 10:52

Впервые слышу. С windows проблем, на самом деле, меньше всего — бекап просто работает, абсолютно прозрачно для пользователя. Вот восстановление чуть менее тривиально, но тоже вполне работоспособно.

vitektm Apr 24 2013 at 02:27

Хочу представить на суд exdupe
консольная утилита сжимает с поддержкой дедупликации на больших расстояниях.

Так базы 1С(каждодневные) 2ТБ ужимает до ~100Гб.
По скорости помню что упирается в основном в жесткий диск у меня было что-то в районе 50-70мб\с средняя скорость на Athlon || x2 1.6 ГГц.
А вот памяти 4Гб ставил.
Создает дифференциальные архивы.

прога бесплатная и регулярно обновляется. Мне страшно подумать что было бы если я винрар скормил 2Тб.

beho1der Apr 24 2013 at 05:48

Написали бы статейку по использованию!