track 24 ноя 2010 в 08:59

Thin Provisioning — «кредитная карта» для хранилища

5 мин

33K

Блог компании NetApp

+19

Комментарии 88

netto 24 ноя 2010 в 09:26

А разве нельзя уменьшить размер раздела? Linux это умеет всяким там gparted, ну и всякие Partition Magic тоже.

adontz 24 ноя 2010 в 09:28

Как это сделать на лету?

track 24 ноя 2010 в 09:36

Отчасти верно, но тут есть вот какое серьезное «но».
Во-первых, хранилище (сам SAN-массив) не знает, что у него там на разделе лежит, что за файловая система, и есть ли она там вообще. Ему приложение не сообщает. А не зная этого, изменить размеры раздела, что связано в том числе и с изменением структур файловой системы — невозможно. Можно это делать только изнутри _каждого_ раздела, и каждого приложения/OS. Кроме того, это вызывает приостановку работы с данным разделом, «наживую», на смонтированном разделе, gparted не работает.

Во-вторых, это не решает проблему, если у нас много разделов, и мы изменяем, например, размеры третьего, седьмого, и двенадцатого, чтобы за счет их уменьшения увеличить двадцатый. У нас все равно получатся либо «куски» в разных местах стораджа, которые надо как-то собрать вместе и «пристыковать» к нужному, либо же надо всю «кухню» разделов двигать, не только три уменьшенных, а все 19. И все их остановить, размонтировать, и передвигать.
Плюс же thin provisioning заключается в том, что это происходит автоматически, «на ходу».

4twilight 24 ноя 2010 в 15:42

LVM, не?
или собственно за хитрой фразой «thin provisioning» он и стоит?

-1

track 24 ноя 2010 в 15:47

Ну есть же и не только Linux.
Речь в данном случае идет, прежде всего, о общем, «низкоуровневом» решении, на уровне стораджа, доступном прозрачно всем OS, а не только истинно православным. :)

4twilight 24 ноя 2010 в 16:55

а, блин, точно, из под винды к LVM только через Virtual Volumes можно добраться…
я уже как-то отвык от проблем того «огорода».

-1

AlexanderCam 24 ноя 2010 в 16:38

Да, хранилище не знает, что у него твориться «на верху» на уровне файловой системы, но размер раздела можно уменьшить. NetApp SnapManager поддерживают функцию space reclamation. romx даже писал об этом blog.aboutnetapp.ru/archives/664

AlexanderCam 24 ноя 2010 в 17:04

Извеняюсь, ошибся, не SnapManager, а SnapDrive (почти одно и тоже). +ко всему NetApp поддерживает space reclamation на NTFS, чего не умеют «всем известные блочные стораджы» ;)

track 24 ноя 2010 в 17:16

Плюс еще недавно присоединился к инициативе Symantec по поддержке Thin Reclamation API, в рамках которого возможности space reclamation будут реализованы в других FS, например, для Veritas Storage Foundation, в VxFS.

Ppord 24 ноя 2010 в 09:38

Боюсь, все это радужно лишь на словах. На высоконагруженых системах это «тонкое резервирование» приведет к очень сильной фрагментации между приложениями, вследствие чего производительность будет падать в разы.

track 24 ноя 2010 в 09:54

Я не зря остановился на этом в тексте. :)
Падения «в разы» не наблюдается, в большинстве случаев не наблюдается даже сколь-нибудь измеяемое изменение.

Ну и, потом, никто же не заставляет обязательно использовать thin provisioning, вполне можно на одном сторадже иметь и thin и traditional разделы, они друг другу не мешают.

Gruxon 24 ноя 2010 в 09:45

И все таки. Каковы накладные расходы в производительности в угоду оптимизации использования пространства?
Хотелось бы прям цифры, т.к. всеравно это надо переводить в деньги, при выборе платформы.
И… это отдельный функционал? Лицензии надо открывать? Дорого?

track 24 ноя 2010 в 10:05

Я, пока писал, к сожалению, не нашел под руками конкретно по NetApp цифр, зато есть аналогичный функционал у виртуальных дисков VMware, и выше в тексте я дал ссылку на этот документ.

Что же касается NetApp, то, например, тестирование производительности по SPC-1 NetApp проводит с включенным thin provisioning (lun reservation = off), и ничуть не боится снижения производительности.

Повторюсь, это не обязательная опция, вы вполне вольны ее использовать, или нет, по своему усмотрению. Например, на части разделов и LUN-ов, где ожидаете заметный эффект — использовать, на других, где не хотите, или не видите эффекта — не используйте. Оно независимо, и друг другу не мешает.

Нет, это «встроенный» функционал OS Data ONTAP и WAFL, на уровня опций при создании тома и LUN, денег не стоит.

Вот тут есть хороший переведенный best practices по thin provisioning:
www.netwell.ru/production/techbiblioteka.php
www.netwell.ru/docs/thin_provisioning.pdf

Gruxon 24 ноя 2010 в 10:23

Спасибо за развернутый ответ!

0Lexx0 24 ноя 2010 в 16:19

Точно сказать сложно, но я думаю лицензия обойдеться по стоимости, как лишние 10-15 TB массива. Так что я думаю, если взять прозвучавшие здесь цифры 60-80% — я бы стал задумывать над лицензией, если есть фрагментация на массиве в 60+80/2*10TB = 70 Tb. Но это только задумываться). И естественно, это ИМХО.

-1

track 24 ноя 2010 в 16:23

Лицензия на thin provisioning бесплатна.
Вернее даже будет правильно сказать, ее вовсе нет, thin это свойство самого стораджа, отдельной лицензии на нее нет.

0Lexx0 24 ноя 2010 в 16:29

извиняюсь, если дезинформировал) наверное слишком много общаюсь с hp и IBM, которые беплатно ничего не дают)

amarao 24 ноя 2010 в 10:43

А теперь вопрос: какой оверхед это даёт по скорости? Если быть точным, допустим, у нас есть iscsi target размером 1.5Тб. Как показывает эксперимент, при форматировании туда пишется около 30Гб данных, то есть примерно на 60Гб блоков. Thin Providing, всё хорошо. Образ занимает 60Гб вместо полутора терабайт, человек заходит, начинает писать… На уже выделенных блоках у него скорость записи, допустим, 300Мб/с. А теперь он доползает до «заявленных, но не выделенных» блоков.

Какая скорость будет при этом?

bit 24 ноя 2010 в 11:17

Думаю, в этом месте будет небольшая заминка на выделение очередного блока, затем все вернется в исходное. Это может оказаться неприятным сюрпризом, если пишутся данные, получаемые в реалтайме с соизмеримой скоростью. Одна надежда — система начинает выделять следующий блок при заполнении предыдущего, скажем, на 90-95%
Вопрос — как это происходит в реале?

amarao 24 ноя 2010 в 11:19

Я с такой проблемой столкнулся с thin providing с использованием VHD на NFS. Не смотря на то, что после выделения места скорость была нормальной, сам процесс был крайне неприятным и дискомфортным.

track 24 ноя 2010 в 16:20

Я не стану утверждать, что thin provisioning у NetApp идеален, и на него не действуют физические законы :)
Нет, конечно, процесс space allocation обязательно вызывает задержки в операциях миллисекундного порядка (впрочем, честно попытался после вашего вопроса найти жалобы на этот счет в community, чтобы оценить порядок — не нашел).

Но, как я уже писал выше, выделение дополнительных сегментов производится все же не «побайтово», а довольно крупными «кусками» что снижает негативный эффект, в том числе фрагментации.

Опять же отмечу, если вы оцениваете, что какие-то разделы, вследствие своего характера заполнения, могут иметь проблемы с thin, просто используйте для них traditional reservation, и все. Как traditional разделы, так и thin, могут сосуществовать на одной системе неограниченно, по выбору админа.

amarao 24 ноя 2010 в 18:32

За информацию спасибо.

Thick не годится, у нас он есть и мне он несколько не нравится.

Итак, вопросы более конкретные:
1) при линейной записи на thin насколько снижается скорость записи на thick?
2) Есть ли апи для выяснения реального объёма занятого места конкретным lun'ом?
3) Цена вопроса для хранилища на 100-200Тб?
4) Сколько юнитов?

track 24 ноя 2010 в 15:56

Как вы понимаете, точно на этот вопрос ответить невозможно. Наши англоязычные товарищи тут говорят «mileage may vary». Слишком много переменных должно быть учтено для точного ответа «в граммах» (а «приблизительно» вас не устроит).

Я бы на вашем месте, если вас заинтересовало, попросил бы примерно соответствующую вашим требованиям систему на тестирование. У любого приличного партнера NetApp, из числа интеграторов, есть (должен быть, по условиям партнерства) демо-пул железа как раз для таких целей, и NetApp всегда поощряет тестирование и демонстрацию непосредственно на задаче и площадке потенциального клиента.

Рекомендую только не пренебрегать консультациями специалистов в настройке, так как, уже говорил, системы внутренне необычные, и требуют некоторого углубленного понимания ряда по певости не вполне очевидных процессов конфигурирования, отличающегося от «традиционных систем».
Системные инженеры NetApp в представительстве не враги, они тоже заинтересованы, чтобы «товар показался лицом».

amarao 24 ноя 2010 в 11:06

Да, второй вопрос. Что дешевле — иметь Thick Provision на большом SATA-рейде (допустим, 2Тб винтами) или покупать лицензии NetApp? Вопрос не праздный, если меня убедите, я подниму вопрос об использовании вас вместо локального iscsi target'а.

track 24 ноя 2010 в 16:01

> если меня убедите, я подниму вопрос

Это шантаж ;)

> Что дешевле

А чорт его знает, если честно, слишком расплывчата задача.
Как написал уже выше, возьмите и проверьте самостоятельно, конкретно, руками. Это будет самый лучший ответ, самим себе.
Кому-то подходит, кому-то нет, нельзя удовлетворить абсолютно всех.

Наверняка есть задачи, где самодельный RAID выигрывает просто по фактору цены. Есть другие задачи, где вес других параметров, кроме цены, в суммарной оценке выше.
Но сложно, и попахивает профанацией и дилетантизмом, если бы я стал втюхивать вам сейчас что-то, не будучи уверенным в том, что это для вас подходит.

amarao 24 ноя 2010 в 18:24

Каким образом я должен «взять и проверить»? Или вы предлагаете «купи и проверь»? М… Мне это не нравится.

track 24 ноя 2010 в 18:29

Нет, у любого нормального партнера можно взять в тестирование имеющуюся у него систему из демо-пула в тестирование (например на 2 недели) под так называемое «гарантийное письмо».
Естественно, это не накладывает никаких обязательств по покупке, если «не подойдет», именно для этого и придумано тестирование.

Странно, неужели это такая редкость, и вы ни разу не сталкивались с таким, мне казалось, что все Tier-1 вендоры такое практикуют.

AlexanderCam 24 ноя 2010 в 18:33

Да, интеграторы дают покататься железо — это точно, сам пользовался :)
Другое дело, что без должной подготовки и с отсутствием знаний по СХД толку от тестов будет мало так что нужно и этот вопрос продумать перед тем как брать что-то на тесты.

track 24 ноя 2010 в 18:46

Это верно. Особенно такая специфическая железка, как нетапп.
Требует кое-какой начальной подготовки, дабы получить ожидаемое, а не фэйл.
Почему и рекомендвал не стесняться спросить консультаций у знающих специалистов.

amarao 24 ноя 2010 в 18:35

Собственно, мы особо в сторону готовых вендоров не смотрели. С учётом, что всё равно никто из них готового решения под нужды виртуализации предложить не может, то брать «якобы готовое» чтобы потом ровно так же пилить, совершенно не хочется.

Однако, вы говорите что-то, что может заинтересовать, так как решает одну из проблем.

bit 24 ноя 2010 в 11:11

Какова стоимость такого решения и соответственно — область применения? Имеется в виду стоимость подключения одного компьютера к такой SAN.
Fiber channel и iSCSI — решения не копеечные. Возможно для пула производительных серверов-молотилок это хорошее решение, но как офисное хранилище на замену 500-гиговым дискам — на мой взгляд дороговато. Да и не нужны офисным работникам такие диски, 150-200 Гиг и то много. А те задачи, где нужны — решаются обычно на серверах, где и применяются соответствующие решения.

amarao 24 ноя 2010 в 11:20

iscsi — решение бесплатное, вообще говоря :)

bit 24 ноя 2010 в 11:30

Вот я темнота! :(
Да. Это решение будет зависеть от скорости работы сети. Получается для офиса оно вполне приемлемо, но с ростом персонала вырастут и нагрузки на сеть. Получается, там, где подобное решение предпочтительней — крупные офисы больших компаний — оно менее работоспособно.
Или я опять где-то ошибаюсь?

amarao 24 ноя 2010 в 12:01

При 10G порте до сервера проблемы раньше начнутся на сервере, чем в сетевом сегменте.

10G до сервера, гигабит до пользователей — вполне комфортно и дёшево.

track 24 ноя 2010 в 16:06

Обычно iSCSI организуют в отдельную сеть. Либо отдельную физически, либо, хотя бы, в VLAN.

Но «скорость работы» это такой гипотетический параметр. Если вашим серверам достаточно iSCSI по гигабиту, и они не прокачивают даже в пике полосу пропускания больше 1Gb/s, (видел таких задач немало, на самом деле) то любое расширение этой полосы в ее неиспользуемой части, не повышает производительность.

Если по шоссе проезжает один грузовик в минуту, и не возникают заторы, то расширение полосности шоссе в 4 раза не увеличит скорости грузовика, и скорости доставки груза.

mirrik 24 ноя 2010 в 15:35

Для КОГО это оно бесплатно? (:
С какой стороны выглядывает его бесплатность?

amarao 24 ноя 2010 в 18:20

Для пользователя. aptitude install iscsi-target. Аналогично initiator.

mirrik 24 ноя 2010 в 18:31

А, ну да. Ethernet тоже бесплатен — всего лишь надо сетевухи, СКС, коммутаторы — и юзай себе (:

amarao 24 ноя 2010 в 18:37

Неправильная аналогия. Ethernet, так же как и FC — не бесплатен. А вот какой-нибудь open-vpn — бесплатен. И iscsi бесплатен. А netapp платный.

mirrik 24 ноя 2010 в 18:44

А зачем нам говорить о iSCSI вообще, без привязки к СХД?
Просто так меня даром этот iSCSI не интересует — одна из множества технологий и только.

amarao 24 ноя 2010 в 20:41

ну, а с другой стороны iscsi находится LVM поверх md или аппаратного рейда.

track 24 ноя 2010 в 16:02

Ну разве у нас бывает что-то бесплатное?
Бывает бесплатно, бывает за деньги.
Но дешевого и бесплатного в области iSCSI действительно довольно много.

0Lexx0 24 ноя 2010 в 16:10

ох уж эти софтварные решения…

-1

track 24 ноя 2010 в 16:15

Вот только не надо снобизма ;)

0Lexx0 24 ноя 2010 в 16:34

Ну… это не снобизм. Любой hba чего-то да стоит. Я конечно не стал бы использовать железное решение если бы мне нужно было организвать таргет для локалки дома. Но на работе использовать софтовые решения не всегда возможно(из-за производительности и ограничений самой ОС).

track 24 ноя 2010 в 16:39

Ну так никто не говорит про «всегда», конечно, надо оценивать стоимость и эффективность решения. Нет смысла возить помидорную расаду на дачу на Ламборгини, также как нет надежды очаровать подружку новой Ладой-классикой ;)

amarao 24 ноя 2010 в 18:37

Ага, ага. То-то у меня рядом «софтварное решение» через 10G во всю молотит.

BigD 24 ноя 2010 в 21:50

iscsi-target?

yahan 24 ноя 2010 в 23:35

А вы не думали, что будете делать, когда возникнет проблема с железом, на котором крутится «софтварное решение»?

amarao 25 ноя 2010 в 00:06

Думали. Железо в хлам, дискам писец, из БП дым.

Для этого DRBD и существует.

Кстати, а «железные» решения в этом смысле, по сравнению с софтовыми, имеют какие-то особые резисты и иммуны к 380 вместо 220 и с размаху кувалдой по корпусу?

yahan 25 ноя 2010 в 22:16

DRDB накладывает ограничения — в качестве клиентов такого SAN выступают исключительно Linux-подобные системы. Поправьте, если я не прав.
В любом случае нужен кластер для SAN, если требуется отказоустойчивость. Железный он или нет — это уже другой вопрос.

amarao 25 ноя 2010 в 22:46

М. Не знал, видимо, с другими системами не приходится работать. Впрочем, Xen решает проблему запуска виндов на DRBD.

Кластер нужен, да. И софтовый предпочтительнее железного, ибо мониторить удобнее.

Osmolovsky 25 ноя 2010 в 15:04

А вот честно, подскажите мне, у нетапа и прочих решений нету материнской платы или контроллера? Они что, сгореть не могут?

track 25 ноя 2010 в 15:24

Конечно все есть. Но если вы покупаете систему в «кластерной», двухконтроллерной конфигурации (это, так сказать, конфигурация покупки «по умолчанию» для NetApp), то выход из строя материнской платы или контроллера не приводят к потере доступа к данным, так как оставшийся контроллер на время берет на себя диски и ресурсы отказавшего. А замена по гарантии осуществляется «на следующий рабочий день» (или даже «через 4 часа» в случае Москвы и Петербурга) с доставкой по месту установки системы.

Osmolovsky 25 ноя 2010 в 16:40

Ясно, спасибо.

Хотя в качестве примера могу посмотреть в стол, там лежит 520я циска, замену которой по 5NBD контракту везут уже как 14й месяца. Точнее 9 месяцев циска ссылась на таможню, и уже полгода как мне уже просто начхать на результат этой операции.

track 25 ноя 2010 в 17:17

Запчасти на все проданные в России системы лежат на растаможенном складе в Москве и Петербурге. Склад (и доставку) обеспечивает курьерская компания UPS.

digreen 24 ноя 2010 в 11:15

&#60&#115&#62fffffff&#60&#47&#115>

-2

НЛО прилетело и опубликовало эту надпись здесь

mirrik 24 ноя 2010 в 15:41

+1, при этом tp очень геморрная вещь, но наиболее приятная ее реализация именно в NetApp.

0Lexx0 24 ноя 2010 в 15:42

Может быть SAN и дороже, зато надежность выше + куча новых возможностей.

track 24 ноя 2010 в 15:45

Хорошо быть богатым, и не задумываться о этой презренной суете. ;)
Однако, на практике, «эффективность хранения», то есть «экономость» в терминах пространства и использования ресурсов, это самая «горячая» тема последних пары лет в индустрии.

Я думаю, что если бы сэкономленный объем, выраженный в тысячах долларов (а FC и SAS-диски в таких системах исторически стоят ну ооочень много), выплачивался вам в качестве премии, то и вы бы стали большим фанатом процесса повышения эффективности ;)

Не думаю, что 60-80% емкости, о которых писалось выше, это «ловля блох».

НЛО прилетело и опубликовало эту надпись здесь

track 24 ноя 2010 в 16:09

Ну, то что вы не встречали, не значит что их нет, поверьте, в России, хотя и традиционно не умеют считать затраты (ROI, TCO), уже тоже начали задумываться, топить ли печь ассигнациями, или дешевле и выгоднее будет купить простых дров для того же самого.
Кризис хоть и идет на убыль, но многих научил считать расходы, а не только «освоенное бабло».

amarao 24 ноя 2010 в 18:22

с учётом drbd, надёжность дисков теперь является фактором, который влияет только на один параметр расходов — на стоимость времени тех, кто диски меняет.

0Lexx0 24 ноя 2010 в 16:08

Хм… я вообще то не говорил вообще ни о какой экономии) Как раз наоборот — сан хорошо использовать с дублированием ресурсов. В этой области — излишняя экономия — это большее зло, чем недостаточная.

track 24 ноя 2010 в 16:14

Это до тех пор, пока вы тратите не свои деньги ;)

0Lexx0 24 ноя 2010 в 16:22

это с тех пор, когда узнал, что датастораджи тоже умеют ломаться.

AlexanderCam 24 ноя 2010 в 18:35

Да, к сожалению от поломки/проблем стораджа никто не застрахован и я тоже, к сожалению, с этим столкнулся. :(

Wott 24 ноя 2010 в 16:07

Все зависит от обьемов. 1Тб — да смешно. 10Тб — это уже может быть дополнительная секция, замена свича и так далее.

amarao 24 ноя 2010 в 18:23

Вопрос не в стоимости хранилища, а в стоимости электричества для юнитов и кондиционеров. Когда мы (в селектеле) обсуждаем платформу, её потребление и количество занимаемых юнитов на первом месте.

0Lexx0 24 ноя 2010 в 15:40

При чем здесь NetApp? Какое отношение имеет SAN к thin provisioning?

-2

track 24 ноя 2010 в 16:10

Непосредственное. В SAN-хранилище NetApp можно использовать thin provisioning. Об этом и статья.

Leonov 24 ноя 2010 в 15:47

mirrik 24 ноя 2010 в 15:59

Это у вас Пермь, а не Netapp (:

voa 24 ноя 2010 в 15:48

Пользуюсь thin provisioning без каких либо FC SAN'ов даже на локал дисках используя VMware ESXi.

track 24 ноя 2010 в 16:13

Все верно, VMware умеет thin provisioning своими средствами, в своей реализации. Но с NetApp thinpro можно использовать автономно и прозрачно, для любого приложения, а не только для VMware ESX.
Thin Provisioning это не конкретная «торговая марка», это скорее концепция распределения пространства, она есть у VMware, а также у множества систем хранения: 3Par, HP, EMC, HDS (если кого забыл — не со зла), есть и у NetApp, и сделана там довольно неплохо.

AlexanderCam 24 ноя 2010 в 16:51

Я бы, как «пользователь» NetApp и других уже блочных стораджей могу сказать, что блочные стораджы теряют в производительности при использовании TP (сам замерял ~10%), а NetApp нет т.к. TP это просто опция у LUN и запись осуществляется точно так же как если бы TP не использовался поэтому и производительность не теряется.

BigD 24 ноя 2010 в 21:09

хорошая идея — грузить операционку полностью с SAN-стораджа. Ни тебе проблемы бакапов, ни летящих хардов…

braintorch 24 ноя 2010 в 23:43

Сплошная теория и абстракция в духе «А вы знаете?..». Я требую конкретных примеров применения на практике. С цифрами.

Pilat 25 ноя 2010 в 09:19

Желательно конкретных цифр, на интервале в месяцы или год, для Windows виртуалок. В которых есть дефрагментатор.

track 25 ноя 2010 в 10:07

Конкретные цифры без подробного описания деталей условий будут в духе "- Петька — приборы? — 70!"
Но если что-то будет достойное описания под руками — конечно напишу.

Pilat 25 ноя 2010 в 12:05

Речь о виртуальных машинах, в которых администраторы запускают дефрагментацию. Как влияет она на рост занятого места? Наверно плохо влияет, а без дефрагментации в windows частенько плохо. Получается, что thin provision может быть даже вредным инструментом, если полагаясь на thin указываем больше размер чем вроде бы нужно — типа «с запасом, всё равно скорее всего не выделится».

track 25 ноя 2010 в 14:52

Тут вот какая загогулина.
Для чего вообще делается дефрагментация? Для минимизации seek-ов, расход времени на которые замедляет процесс считывания/записи данных с дисков.
С минимизацией seek-ов все очевидно в случае, если логический диск лежит поверх простого физическом диска. Считываемые и записываемые последовательно данные испытывают большой выигрыш, если и располагаются они тоже последовательно.

Отметьте, что мы сейчас совсем не затрагиваем тему выгоды (или «невыгоды»)дефрагментации для файлов, считываемых не последовательно, а рандомно. Это еще на целую статью потянет.

Но все становится сложнее, когда раздел располагается поверх непростой RAID-структуры, где последовательно раполоденные блоки файловой системы совсем необязательно последовательно лежат на дисках. Еще неоднозначнее все становится в случае, когда поверх RAID, как в случае NetApp, лежит какая-то структура размещения блоков данных, которая сама по себе использует те или иные методы оптимизации расположения.

При этом дефрагментация ничего не знает о том, как и каким образом работает оптимизация на уровне стораджа, возможно данные, с точки зрения стораджа, размещены оптимально, с максимальным возможным быстродействием доступа, но «фрагментрованно» с точки зрения тупенького «дефрага». Напротив, «дефрагментация» может даже ухудшить структуру расположения, и оптимальность размещения.

Именно по этой причине NetApp, в общем случае, не рекомендует, без специальных консультаций с саппортом, использовать «дефрагментацию» для разделов виртуальных машин, так как это может ухудшить производительность.

И, да, вы правильно заметили, так как сторадж ничего не знает о том, что происходит на уровне FS приложения, это ведет и к ухудшению результатов thin provisioning.
Борьбе с этой ситуацией посвящен метод под названием space reclamation, при котором специальный клиентский софт на уровне OS сообщает стораджу, что «блоки данных номертакой-то и такой-то были стерты (или перенесены), и больше не используются для хранения актуальных данных, можно их освободить на уровне стораджа». Но это еще одна статья, спасибо за то, что подсказали тему. :)

Pilat 25 ноя 2010 в 17:34

Статья про «space reclamation» — здорово актуально, я думаю. А насчёт неважности фрагментации — давно ходят слухи, что на сервере фрагментация не важна. Но практика-то показывает, что если можно файл считать последовательно — он считывается гораздо быстрее, ОС ведь тоже не дураки делают.

track 25 ноя 2010 в 18:05

Все верно, но вопрос, насколько действительно часто встречается в реальной жизни sequental read/write на современных задачах, в многозадачных системах, да еще и в виртуальных машинах?

Я сходу могу назвать только одну такую задачу — создание резервной копии. Отчасти, быть может, еще работа с transaction logs SQL-баз данных, с которыми работают последовательно. Остальные же более или менее random. А случайное чтение случайно расположенных блоков с точки зрения seek ничем не отличается от случайного чтения последовательно расположенных блоков, «случайно» «в квадрат» не возводится :)

Что же касается фрагментации, то бесспорно излишняя фрагментация вредна. Но, с другой стороны, как мне кажется, опасность фрагментации часто очень сильно переоценивается. На дисках у всех давно уже не FAT16.

Вот тут довольно любопытные результаты о влиянии фрагментации «сегодня» приведены
blog.aboutnetapp.ru/archives/466

zhjuve 27 дек 2010 в 16:28

При текущем уровне взаимодействия ОС на хосте с системой хранения все это еще уж больно убого для SAN. Space Reclamation есть только для Windows/NTFS и проходит относительно медленно (плюс нетапп рекомендует не проводить IO intensive операций на LUN в это время).
Однако возможность весьма полезна как ни крути, бывает что нужно получить назад место когда-то съеденное и теперь свободное с т.з. ОС. В Windows 2008 c введением возможности уменьшения партиции NTFS LUN можно и уменьшать через SnapDrive без прерывания работы с данными. Для UNIX не совсем в курсе, но последний виденный SnapDrive не умел делать reclaim и уменьшение партиций вообще.
Думаю если крупные заказчики попросили бы то и для VMWare VMFS датасторов на LUN можно и reclaim и уменьшение организовать (увеличение уже работает без проблем под нагрузкой).

Для NAS все весьма замечательно, отключаем резервирование места хоть под все тома на агрегате и получаем общий пул свободного места хоть под NFS для VMWare/XEN, хоть CIFS шары, хоть одновременно.

С введение TP усложняется управление занятым\свободным местом и возрастает риск переполнения тома\агрегаты, особенно опасное для томов с LUN (которые как известно если нет места уходят в оффлайн на системах NetApp). Решается хорошими средствами мониторинга (у нас например их родной DFM/OM) и осмысленным выбором параметров томов\LUN в соответствии с задачами.

track 17 янв 2011 в 06:37

> При текущем уровне взаимодействия ОС на хосте с системой хранения все это еще уж больно убого для SAN.

Тем не менее, это лучше, чем ничего. Большинство SAN-систем других производителей вообще этим «не заморачиваются».

> Space Reclamation есть только для Windows/NTFS

Не только. Для VxFS, по меньшей мере, еще. (см. новости про поддержку Symantec Thin Reclamation API) А системы, использующие VxFS/VxVM это довольно значительный кусок «энтерпрайза».

> С введение TP усложняется управление занятым\свободным местом и возрастает риск переполнения тома\агрегаты

Естественно, ничто в нашем мире не дается даром :).
Но я уже, кажется, говорил это, лучше иметь возможность, даже сейчас не используя ее, если она не нужна, чем не иметь такую возможность вообще, в принципе.
Тем более, что вы и сами согласны, что все это решается. :)

zhjuve 1 фев 2011 в 14:36

Хм. Спасибо, про Symantec продукты почитаю.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий