frickelangelo 24 июл 2019 в 09:48

BTRFS для самых маленьких

22 мин

130K

Блог компании Veeam SoftwareOpen source**nix*Восстановление данных*Резервное копирование*

+30

Комментарии 59

НЛО прилетело и опубликовало эту надпись здесь

SystemXFiles 24 июл 2019 в 10:41

Аналогично подумал, когда прочитал этот абзац. Зачем рассказывать о ФС, которые способна необратимо потерять информацию из-за собственных багов. Может конечно это привлечет кого-нибудь для помощи в разработке, но с такой ситуацией пользоваться ей вообще желания нет.

frickelangelo 24 июл 2019 в 11:47

Полагаю, что заверения о стабильности взялись не с потолка. Как минимум, проблемы возникают точно не в стандартных сценариях. В статье хотелось максимально честно отразить обе стороны btrfs. Возможно, стоило указать на минусы ближе к концу статьи — спасибо за фидбек, учтем в будущем. Теперь про спор на тему «надо ли ею пользоваться». Увы, но в общем случае он не разрешим — у каждого частного случая свои задачи и требования. Другое дело узнать что такая ФС, в принципе, существует и познакомиться с подходом в организации хранения и ~~распространения~~ управления данными, думаю, многим интересно. Ну и хочу отметить что словами «зачем… если ...» можно похоронить любой молодой проект.

НЛО прилетело и опубликовало эту надпись здесь

frickelangelo 24 июл 2019 в 16:14

Чтобы не потерять данные делайте Veeam бэкапы.

SystemXFiles 24 июл 2019 в 18:03

Потеря данных так или иначе нештатная ситуация и потому всегда стоит уменьшать вероятность подобного исхода, в противном случае это прямая дорога в ад.

НЛО прилетело и опубликовало эту надпись здесь

oller 29 июл 2019 в 08:32

Как Бекапилка позволит мне узнать, что 1 из миллиона файлов потерян?

-1

frickelangelo 29 июл 2019 в 10:57

С Божьей помощю, разумеется. Тред ушел в оффтоп.

gbg 24 июл 2019 в 15:28

«Рубанули хост с виртуалками, после чего две навсегда ушли в аут» — это насколько «нестандартно»?

Пока утилита восстановления, извините, сегфолтится при попытке такое починить, Btrfs получает официальный бейдж БАРАХЛО-ФС.

frickelangelo 24 июл 2019 в 16:12

Делайте бэкапы с помощью Veeam.

-2

gbg 24 июл 2019 в 16:30

«Покупайте наших слонов! ©»

Спасибо, я как-то с rbd2qcow2 прекрасно справляюсь.

divanikus 24 июл 2019 в 14:08

Судя по официальной вики, наибольшие шансы потери данных в режимах raid56, они официально нестабильны. Остальное достаточно стабильно для production. Для raid56 я бы рекомендовал raidz/raidz2 в ZFS, личный опыт строго положительный.

oller 29 июл 2019 в 08:39

Zfs очень дорогая fs
Озу+проц+ssd кеши.

frickelangelo 24 июл 2019 в 11:53

Почему же избыточно? Как минимум есть те кому интересно узнать что в linux мире существует не только extfs и swap. Что есть иные подходы к организации данных на носителях.

Radjah 24 июл 2019 в 16:28

mdadm, lvm, вот это всё. А сверху хоть черта лысого в качестве ФС можно сделать.
ИМХО в данном случае не стоит валить всё в одну кучу. Управление томами отдельно, ФС отдельно.

frickelangelo 24 июл 2019 в 17:04

Вот это самая большая проблема — объяснять btrfs людям, хорошо знакомым с lvm. Нету на btrfs томов. Есть subvolume. Это не блочное устройство и не может быть трактовано как оное. Сабвольум гораздо ближе к понятию директория, чем к lvm тому.

Radjah 24 июл 2019 в 18:25

Я про встроенные RAID.

frickelangelo 24 июл 2019 в 22:04

Странно что вы адресуете это именно мне. Правильнее это высказывать разработчикам BTRFS, не находите?

Loxmatiymamont 24 июл 2019 в 16:27

По такому принципу все статьи про CEPH тоже избыточны. А их нынче развелось как-то подозительно не мало…

gbg 24 июл 2019 в 16:32

За 8 кластеро-лет ни разу не терял данные по причине багов в CEPH. Может, в консерватории что-то не так?

-1

Loxmatiymamont 24 июл 2019 в 16:41

Это называется ошибка выжившего.

Kabdim 24 июл 2019 в 17:22

Второй год / живет на btrfs и как-то ни разу еще не сталкивался.

iborzenkov 24 июл 2019 в 20:01

У меня примерно пятый год на сервере диск со всеми данными и на домашнем корень, тоже нормально все, особенно с контейнерами хорошо, гораздо лучше чем стандартная.

pansa 24 июл 2019 в 23:36

У меня такая же нога и не болит.

НЛО прилетело и опубликовало эту надпись здесь

alexyr 25 июл 2019 в 11:31

Инкрементальные бекапы на другой носитель решают 99.999% таких проблем! А делаются они быстро и легко. Кто не делает бекапы, может потерять данные на любой системе. Для меня преимущества и удобство BTRFS перевешивают «возможные» потери данных. Восстановление из резервной копии тоже как два пальца! Я так даже устанавливал систему в виртуалке, настраивал всё что нужно и накатывал её простым переносом как резервную копию (с правкой fstab)

DSolodukhin 24 июл 2019 в 10:55

Совсем недавно она перешла из статуса «еще не пригодно» в статус «стабильна».

Скорее из статуса «еще не пригодно» в статус «уже не пригодно». RH задепрекейтила Btrfs и обещает совсем дропнуть в будущем.

frickelangelo 24 июл 2019 в 12:01

На замену btrfs RH пообещала пользователям выпустить аналог под названием Stratis, позаимствовав многие концепты у btrfs и zfs. Отлично же — будут аналоги, будет конкуренция, будет развитие. Может, это и подтолкнет btrfs к качественному скачку в стабильности.

DSolodukhin 24 июл 2019 в 12:25

Может, это и подтолкнет btrfs к качественному скачку в стабильности.

Сомнительно, разработчики уйдут, пользовательская база станет меньше, с чего вдруг должен возникнуть этот скачок. Если за предыдущие годы, пока была поддержка со стороны RH, и в Suse тоже как дефолтная система использовалась, так и не довели до ума, то теперь шансов еще меньше.

Что касается Stratis, посмотрим, конечно, что из этого получится. Но всё таки это не новая ФС, это по факту dev-mapper + XFS.

demfloro 24 июл 2019 в 15:19

Red Hat её особо и не разрабатывала последние годы, Её активно разрабатывает SUSE как минимум с 2014-го.

git shortlog -sne -- fs/btrfs/

 929 Chris Mason <chris.mason@oracle.com>

 655 David Sterba <dsterba@suse.com>

 394 Linus Torvalds <torvalds@linux-foundation.org>

 392 Nikolay Borisov <nborisov@suse.com>

 357 Filipe Manana <fdmanana@suse.com>

 312 Liu Bo <bo.li.liu@oracle.com>

 312 Miao Xie <miaox@cn.fujitsu.com>

 303 Josef Bacik <josef@redhat.com>

 265 Josef Bacik <jbacik@fusionio.com>

 208 Anand Jain <anand.jain@oracle.com>

 205 David Sterba <dsterba@suse.cz>

 155 Qu Wenruo <wqu@suse.com>

 147 Jeff Mahoney <jeffm@suse.com>

 147 Qu Wenruo <quwenruo@cn.fujitsu.com>

 142 Josef Bacik <jbacik@fb.com>

 128 Al Viro <viro@zeniv.linux.org.uk>

 113 Chris Mason <clm@fb.com>

 105 Stefan Behrens <sbehrens@giantdisaster.de>

delphersf 24 июл 2019 в 11:17

А что сейчас в тренде из стабильного и с разными возможностями, раз уж BTRFS не стабильная?

frickelangelo 24 июл 2019 в 13:02

Под данные критерии более-менее подходит ZFS (не сказал бы что в тренде). На хабре про неё есть неплохие вводные статьи.

divanikus 24 июл 2019 в 14:06

ZFS похоже что наилучший выбор сейчас. Набор функций примерно такой же, сама ФС проверена временем и стабильна. Есть правда и минусы:
— в отличие от BTRFS использование в контейнерах ограничено: нельзя внутри контейнера создать или удалить вложенный volume — в BTRFS можно;
— недавний конфликт с разработчиками ядра из-за несовместимой лицензии, из-за чего из ветки 5.х выпилили необходимые для ZFS функции, из-за чего производительность снизится. однако это проблему скорее всего обойдут, если не уже обошли, реализацией этих функций на стороне ZFS.

kazenniy 25 июл 2019 в 16:14

Обошли уже
github.com/zfsonlinux/zfs/commit/e5db31349484e5e859c7a942eb15b98d68ce5b4d

BlinCT 24 июл 2019 в 13:47

Молодец Леха, так держать) отличная статья.

-1

Prototik 24 июл 2019 в 19:20

Замечу, что если попытаться удалить сабвольюм средствами файлового менеджера или утилиты rm, то операция завершится с ошибкой operation not permitted (операция не разрешена).

Замечу, что начиная с какой-то там версии ядра это уже не так

frickelangelo 25 июл 2019 в 15:01

Фикс внесен в ядро 4.18. Внес уточнение в статью. Спасибо.

aborouhin 24 июл 2019 в 19:43

BTRFS использую для личного бекапа (важной для меня части оного) уже 4 года. Около 2 Тб и более миллиона файлов. На разделе, зашифрованном LUKS. RAID на уровне ФС не использую, т.к. «внизу» аппаратный RAID-контроллер.

BTRFS выбрана прежде всего ради удобных снапшотов. Все файлы синхронизируются с различными облаками и нужна была версионность, чтобы при необходимости откатить нежелательные правки / случаи порчи данных, которые благодаря облачной синхронизации моментально расползаются на все машины. А ZFS на момент выбора не прокатывала из-за её аппетита к RAM.
Снапшоты делаются с помощью snapper. Раз в месяц запускается btrfs scrub, проверяющий те самые контрольные суммы, которые в статье упомянуты (а вот scrub почему-то нет). Это весомый дополнительный бонус, гарантия от случайного повреждения данных, каковое на таких объёмах весьма вероятно.

Поломал я её до состояния «всё снести и выкачать из облака заново» один раз, и то по своему собственному невежеству, т.к. в лоб запустил btrfsck, которую вообще запускать не надо. Потом почитал про то, как надо, и больше так не буду (в том случае надо было сделать btrfs-zero-log)

В общем, выбором доволен. Если бы выбирал с нуля — сейчас, когда на домашнем сервере уже 96 Гб RAM, а не 8 Гб, как было 4 года назад, может, выбрал бы и ZFS. Но повода менять уже настроенное и работающее решение не вижу.
Но да, у меня это как минимум третья, а для части данных и четвёртая копия, так что даже самый катастрофический сценарий к безвозвратной потере данных не приводит.

pansa 25 июл 2019 в 00:00

Очень странно, 2 Тб это копейки и для ZFS достаточно 2-3Гб памяти. Главное не включать дедупликацию — это слишком неоднозначная и хитрая фича, которая стреляет позже. В принципе, при небольшом тюнинге 120Тб пулы вполне работают с 64Гб памяти в весьма нагруженном режиме. Правда, на фре…

aborouhin 25 июл 2019 в 00:21

Ну, видимо, ZFS on Linux 4-летней давности не отличалась подобной скромностью требований :)

Oxyd 6 фев 2020 в 03:51

Дурацкий вопрос, а как оно будет жить с штатным софтрейдом, раз со взрослыми рейдами(5,6) у неё не очень?

Sly_tom_cat 7 мар 2020 в 18:51

Нормально будет жить.

myemuk 24 июл 2019 в 21:49

Если на btrfs закончилось место, то даже удаление какого-либо файла может вызывать ошибку «No space left on device». Для решения рекомендуется подключить к btrfs временный накопитель размерами желательно не менее 1GB. После чего произвести чистку данных. Затем удалить временный накопитель.

Как-то приходилось скачивать большие файлы, а потом их удалять. Первый раз, увидел такую картину, что половина диска свободна, а записать новый файл не могу — место закончилось. Трюк с подключением временного внешнего диска нашел не сразу, но он много раз спасал, когда я забывал вовремя балансировку запускать. Может сейчас получше с ней, но уже года 2 как ext4 обратно перешел.

gdt 25 июл 2019 в 20:24

Можно ли слово «subvolume» перевести как, например, подраздел?

frickelangelo 25 июл 2019 в 23:02

Нет. Иначе придется объяснять почему подразделы не имеют ничего общего с разделами. То же самое если перевести как «подтом» — ничего общего с томами.

НЛО прилетело и опубликовало эту надпись здесь

frickelangelo 29 июл 2019 в 11:29

Мой выбор в сторону англицизма основывается на том что subvolume — специфичный объект и достоин быть англицизмом для акцентирования этого. К тому же он не относится ни к томам ни к разделам.
Хотелось бы услышать какой вариант для Вас наиболее предпочтителен. Обоснование обязательно.

НЛО прилетело и опубликовало эту надпись здесь

shs 21 янв 2021 в 11:14

Volume — это том. Sub-volume — это подтом. Сабвольюм — это для обычного человека непонятно что. И по своей структуре sub-volume как раз является отдельным томом внутри контейнера. На Btrfs, может быть, это не так очевидно, но на APFS каждый подтом можно рассматривать как независимую файловую систему (если не учитывать изобретенные ими фирмлинки).

frickelangelo 28 янв 2021 в 17:59

С переводом subvolume = подтом я не согласен т.к. тома и подтома имеют устойчивые ассоциации как блочные устройства, а сабвольюм — сущность файловой системы.

shs 12 фев 2021 в 19:59

Не буду обращать людей в свою веру. Пусть так и будет.

42dmitriy 20 авг 2019 в 09:25

Использую Synology c btrfs и Veeam Agent for Windows. Файл полной резервной копии постоянно растет в объеме, занимая на томе больше месте, чем реально занимает, т.е. например, объем файла резервной копии 150Гб, а на диске занимает 200Гб. Если файл скопировать, но занимаемое место на диске станет 150Гб. Veeam Agent for Windows не замечает замену, этим (скопированным) файлом, файла полной резервной копии. Как с этим можно побороться (постоянным ростом файла полной резервной копии)?

frickelangelo 20 авг 2019 в 12:29

Могу лишь ткнуть пальцем в небо: обратите внимание на фрагментацию на btrfs, так же попробуйте установить флаг nocow на файл бэкапа.

astral-ethanol 20 авг 2019 в 11:49

> btrfs subvolume snapshot create /path/to/subvol /path/to/snapshot -r

А синтаксис немного другой

# btrfs subvolume snapshot -r /path/to/subvol /path/to/snapshot

# btrfs --version
btrfs-progs v4.9.1

frickelangelo 20 авг 2019 в 12:32

Вы правы. Благодарю! Поправил в статье.

astral-ethanol 21 авг 2019 в 13:21

Странно, но не работает ключ --resizefs

# lvextend -L16G centos/dev --resizefs
fsadm: Filesystem "btrfs" on device "/dev/mapper/centos-dev" is not supported by this tool.
  Filesystem check failed.

Взамен приходится делать

# lvextend -L16G centos/dev
# btrfs filesystem resize max /mnt/dev

Sly_tom_cat 7 мар 2020 в 18:46

Если на btrfs закончилось место, то даже удаление какого-либо файла может вызывать ошибку «No space left on device». Для решения рекомендуется подключить к btrfs временный накопитель размерами желательно не менее 1GB. После чего произвести чистку данных. Затем удалить временный накопитель.

Пробовал несколько раз — все прекрасно удаляется (спасибо системному резерву). Даже создать снапшот можно.

zerbino 13 сен 2022 в 16:46

Большое спасибо за ликбез! Сейчас хочу начать пользоваться UNRAID взамен виндового сервера, а т.к. в никсах совсем ноль, то приходится гуглить, какую ФС выбрать для хранения данных XFS или BTRFS. Ваша статья дала представление о второй. Правда в отличие от NTFS, которую может восстановить полно софта, то не ясно какую из этих двух брать на случай сбоев с восстановлением данных.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий