Открыть список
Как стать автором
Обновить

Комментарии 197

Надо их выпускать в дизайне голодисков из фаллаут.
image
Увидел неточность в подписи к фотографии — «на кафедре прикладной математики физмата Ленинградского политехнического института, середина 1980-х».
Упомянутая кафедра прикладной математики существовала на физико-механическом факультете Ленинградского Политехнического института. В просторечии использовалось название «физмех»…
эхх, где-б это добро еще купить по цене, приемлемой для дома, для семьи, и без проблем со снабжением картриджами.
странно, что на али нет лент старых поколений за разумные деньги по аналогии со старыми xeon-ами и регистровой памятью.
Смысла нет, наверное. В статье всё так здорово расписано, что я аж побежал смотреть в очередной раз на эту красоту. Сейчас актуально десятое поколение LTO, объёмом в 50 ТБ, цены на картриджи со стримерами скромно выдаются по запросу. Седьмое поколение, шестилетней давности, вмещает 6 ТБ при цене картриджа в 50 зелёных, а стримера — от 3к. А пятое уже просто никому не будет нужно. Так что для дома и семьи проще и выгоднее купить каждому по накопителю в несколько ТБ.
Скорее, наверное, никто не выкидывает кассеты, а уничтожает физически, чтобы данные не попали не в те руки.
5 поколение — это 1.5 тб на кассету — вполне можно пользоваться при наличии экономической целесообразности и решении проблемы с поиском стриммера в случае выхода из строя.
Там же не будут лежать данные, которыми пользуешься. Смотреть фильм, ожидая десятки секунд перед запуском — то еще удовольствие. А вот для бекапов, архивов фоток и прочего — нормальный объем.
Но да, для дома выгоднее диски.
>Но да, для дома выгоднее диски.

Выгодно, но не надежно.
HDD может просто тупо через 10 лет лежания не включится.
по опыту работы в интеграторах, сложилось впечатление, что сами стриммеры довольно хрупкие и не очень надежные. А найти стриммер (правда, в сценарии, когда целая площадка выключилась на достаточно длинный срок), когда вот они кассеты — это отдельный мем.
Хотя, выборка была не очень большой, могу и ошибаться.
По моему опыту работы в интеграторах, то вполне надежны. Да ломаются, но после очень активного использование. Ну и ломаются обычно роботизированные шкафы
У меня сейчас 6 приводов, из них полностью рабочих 2, и то один из них собран из двух. Остальные с дохлыми головами, выдают ошибку short erase operation. Какой то из мертвых приводов был почти новый, около 100 кассет. Я конечно понимаю что 6 это не статистика, но тенденция меня удивляет.
ну а сколько эти дохлые приводы проработали?
Потом примерно подсчитайте сколько у вас отработает hdd, которые мрут пачками в стойках =) Да и сами головы в СХД мрут не меньше. Другой момент, что с картреджем у вас ничего не будет и у вас есть возможность как минимум всегда его прочитать, так как есть обратная совместимость.
вот я в интеграторах работал как раз СХДшником, и менять диски была самая частая задача по обслуживанию (классно было: поехал в какой-нибудь Волгоград или Новосибирск, за 30 минут поменял диск — остальное время гуляешь по городу). Но тем не менее, я бы не сказал, что прям пачками мрут. На стойку дисков на 300 — пара дисков в год.
Правда, один раз была задача по замене всех дисков определенной серии — там привезли грузовик дисков и по специальной процедуре их дружно меняли. Но это все-таки, видимо, брак и такое бывает не часто.

С ленточными накопителями, как я писал выше, у меня хуже статистика была. Один раз коллега рассказывал, как вез куда-то с тремя пересадками на самолете руку для ленточной библиотеки, привез, а она не работает. Вероятно, в пути растрясли.
Ну я же сказал, что сами шкафы это отдельная песня. Данные у вас с лент все равно не исчезнут и их можно всегда прочитать.

На СХД с 24 дисками, под высокой нагрузкой в месяц меняется по два диска в среднем. Понимаю, что температура по больнице но вот факт.
Особенно они страдают при выключении и включении. Такая процедура два раза в год на одном из кластеров. Там включится много кто не может :)
Вероятно все сильно зависит от нагрузки и power cycle.
Был у меня году в 2012 пара кластеров с суммарным количеством шпенделей в несколько тысяч. Вполне обычных по тем временам и относительно надежных дисков объемом по 1-2 Тб.
И вот однажды, по печальному стечению обстоятельств, один из кластеров с чуть более чем 2к шпенделей ребутнулся по питанию целиком. И один этот ребут не пережило порядка 50 дисков, которые до этого работали без нареканий. Вроде как не много, но еще 25-30 дисков менялись стабильно в течении каждого месяца, это уже практически ритуалом было, посмотреть в мониторинг, перетестировать и открыть тикет ребятам в ДЦ на замену.
И это реально было проблемой. Шанс потерять хотя бы 1 диск, ребутнув машину на 4 диска был весьма чувствительно ненулевым. Причем в ДЦ не было проблем с температурой, стойки не били, сервера не возили (отдельная кстати тема, перевозка выключенных серверов, даже максимально аккуратно — это всегда получение какой-то части мертвых дисков на выходе).
В общем, с точки зрения индивидуальной надежности HDD так себе носитель. Вот статистика на 2020 год по «идеальным условиям бэкапного хранилища в ДЦ», которую каждый год публикует Backblaze — www.backblaze.com/blog/backblaze-hard-drive-stats-for-2020
В среднем AFR гуляет вокруг 1%. Вроде не так уж и много (и плохо), но по их статистике AFR выше для первых нескольких месяцев использования и для некоторых моделей (топовые 18TБ Seagate имеют AFR в 12.5%).
В общем, архивный сторадж в идеальных условиях хорошего ДЦ, стабильной невысокой нагрузки, без перемещений и выключений питания жесткие диски вполне переживают и успешно, конечно же, используются (особенно если система внутри реплицирует данные с высокой надежностью).
В менее идеальных условиях — бэкапы с возможностью перемещения носителей в пространстве, отклонения по теплу (они весьма чувствительны и +10 градусов к номиналу дают статистически ощутимый прирост сбоев), небольшое количество дисков, power cycles, RAIDы отличные от 0/10 — это уже весьма лотерейная затея. Решение на пленочных кассетах для хранения холодного архива вполне может оказаться надежнее и дешевле в перспективе, если речь идет о сотнях ТБ.
Кстати можно даже примерно прикинуть стоимость на условные 200 ТБ архива. Сырой емкости при трехкратной репликации нужно 600 Тб. Представим что софт и люди для настройки этой весьма сложной информационной системы у нас бесплатные. Это 24 18ТБ диска, около 400 долларов за диск — 9600 долларов. Пусть еще 2000 стоит корзина, контроллер и вот это все. Итого — 11600.
Для кассет — LTO-8 стример 3500 долларов, сырая емкость кассеты — 12 Тб, нужно 17 кассет. Стоимость кассеты — около 75 долларов (по гуглу из наличия во втором попавшемся магазине). Итого — 1275 долларов за кассеты или 4875 долларов всего. Более чем в 2 раза дешевле. Надежность кассеты, лежащей на полке, вполне высока, но допустим мы параноики и пишем на 2х разных стримерах (мало ли), по 1 экземпляру на каждом и развозим копии в разные места, а то мало ли. Получается 9750 долларов. Все еще дешевле 11600 за хранилище на HDD, которое более уязвимо — данные физически в одном месте, ДЦ может сгореть/закрыться, сервер может понадобиться перевести и его уронят грузчики, а стопка на 24 винта, даже если их вынуть — весьма тяжелая (и скользкая) штука. В общем, для холодного бэкапа лента все еще более чем конкурентна и в плане стоимости, и в плане надежности. И емкость наращивать сильно дешевле.
RAIDы отличные от 0/10 — это уже весьма лотерейная затея

Полагаю, здесь опечатка? Вы имели в виду Raid1? Ну и для архивного хранения все-таки лучше Raid6.

Про выключение — странно. Предположу, что в вашей хранилке не было (не был включен) ресильверинга (когда в свободное время массив читает и пересчитывает чексуммы).

Я не понял, почему диски с тройным резервированием находятся в одном месте. Ничего не мешает разнести. Ну а сырое тройное резервирование — это примерно как раз 2 площадки, собранные в raid6 + hotspare.

Про «холодная лента вполне надежна» — это не показатель. Ее может и мышь пожевать, и пожар поплавить, и сторож пропить. Но дублирование вполне решает эту проблему. Хотя, остается одно но: если вылетел диск, его заменили, он отребилдился — и все хорошо. А если тихонечко сдохла холодная лента — вы об этом можете узнать только, когда она понадобится, и вовремя не предпринять шагов по созданию копии еще живой ленты.

Еще один момент.На дисках вполне эффективна дедубликация. Если вы пишете архив базы раз в неделю — дедубликация будет очень эффективна.
Полагаю, здесь опечатка? Вы имели в виду Raid1?

Да, конечно же Raid 1/10.
Ну и для архивного хранения все-таки лучше Raid6.

Raid6 это очень неоднозначное решение. 24х18Тб при fault tolerance 2 — это около 400 Тб эффективного хранилища и весьма рискованая система. Шанс потерять 3 диска из 24 один за другим, при том что второй и третий вывалятся в процессе ребилда — это конечно маловероятно, но шанс далеко не нулевой. Кроме того, при потере > 2 дисков мы потеряем вообще все данные. Возить бы такое физически я бы совсем не стал. При потере же обоих кассет с репликами мы потеряем только данные на этой касете, остальные будут в сохранности. В случае зеркалирования из массива тоже можно будет достать остальные данные.
Про выключение — странно. Предположу, что в вашей хранилке не было (не был включен) ресильверинга (когда в свободное время массив читает и пересчитывает чексуммы).

«Хранилка» была кластером с софтом, похожим концептуально на Hadoop с HDFS. Ресильверинга там действительно не было, но хранилка при этом данные не потеряла, т.к. erasure encoding с возможностью потери до 3 чанков и все это размазанное на сотни серверов с anti-affinity per-node per-drive. То есть даже потеряв одну машину целиком, терялся максимум 1 чанк данных из 3 (или даже 4, не помню уже) допустимых к потере для любых данных, что на ней хранились. Ну и быстрая распределенная система ребилда и небольшие диски тоже спасали.
Я не понял, почему диски с тройным резервированием находятся в одном месте. Ничего не мешает разнести.

Это еще сильнее увеличивает косты. 3 сервера вместо одного, каналы между ними, обслуживание и т.д. Ну то есть конечно можно (и нужно), но это еще сильнее стоимость повышает, а я старался привести что-то сравнимое по цене.
А если тихонечко сдохла холодная лента — вы об этом можете узнать только, когда она понадобится, и вовремя не предпринять шагов по созданию копии еще живой ленты

Ленты разных производителей, нормальные условия хранения (20-25 градусов, влажность 40-50) и вероятность выживания одной копии становится очень и очень высока. Да и мышь ленту вряд ли съест, коробка и сама кассета прочные, ничего вкусного, вроде бумаги, для грызунов там нет. Сама по себе лента тихо вряд ли сдохнет, но конечно имеет смысл перечитывать архив раз в 1-2 года. Там же нет тонкой механики никакой, физические воздействия (вроде упала со стола/полки) не страшны, даже если корпус каким-то образом повредится, то пленку можно переставить в другой, плюс кодирование внутри опять же весьма надежное.
Если сильно страшно за неведомые факторы, то можно экран сделать у коробки с кассетами экран из фольги/сетки, чтобы внешние поля не повредили и оно «тихо не умерло», а то мало-ли за стеной построят клинику и там МРТ с ума сойдет:)
На дисках вполне эффективна дедубликация. Если вы пишете архив базы раз в неделю — дедубликация будет очень эффективна.

Дедубликация (аппаратная) часто ломается о шифрование и еще чаще об сжатие с шифрованием. Тут все очень зависит от того, что за данные и в каком виде пишутся, поэтому этот фактор я не учитывал. Хранения какого-нибудь медиаархива в открытом виде это одно, хранение шифрованных пожатых дампов базы — это другое.
Шанс потерять 3 диска из 24 один за другим, при том что второй и третий вывалятся в процессе ребилда — это конечно маловероятно, но шанс далеко не нулевой

Шанс (в Raid10) потерять 2 диска из одного зеркала — тоже не нулевой.
Опять же, ресильверинг очень сильно снижает этот шанс, вовремя выкидывая плохие диски.
Возить бы такое физически я бы совсем не стал

Вообще, это не совсем нормальный сценарий.
но хранилка при этом данные не потеряла

не, речь не про это. Мне просто интересно, как такое могло быть, что диски начали массово выходить из строя и единственное логичное объяснение — что там уже были битые сектора, просто они не были обнаружены.
Это еще сильнее увеличивает косты. 3 сервера вместо одного, каналы между ними, обслуживание и т.д

Возить кассеты и обеспечивать нормальное их хранение — тоже не бесплатно. Ну и скорее не 3 сервака, а 2 (все-таки нужно и на raid выделить диски и на hotspare), плюс, это будут серваки поменьше и стоить будут подешевле, чем сервак на 24 диска.
Да и мышь ленту вряд ли съест, коробка и сама кассета прочные, ничего вкусного, вроде бумаги, для грызунов там нет
вы, видимо, не видели, как они жрут оптоволокно в не менее жесткой оплетке. А из вкусного могут быть потожировые следы от рук. А если переносивший кассеты до этого слопал бутерброд с колбаской — этот запах вполне может остаться на долго. Да и просто любопытство.
и вероятность выживания одной копии становится очень и очень высока… Сама по себе лента тихо вряд ли сдохнет

А не подскажете, где можно почитать про эту надежность? Просто, я 6 лет проработал СХДшником — и только сейчас в первый раз слышу про фантастическую надежность лент. Я, конечно, мало с ними работал, но тем не менее. Плюс, от коллег слышал, как они пытались безуспешно восстановить данные с ленты, хотя это вполне может быть аналогом ошибки выжившего.
Шанс (в Raid10) потерять 2 диска из одного зеркала — тоже не нулевой.

Безусловно, но разница в том, что даже потеряв оба зеркала данные все еще будут живы по крайней мере в остальном массиве, плюс есть шанс из двух полумертвых винтов с копиями все-таки вытащить какую-то часть (возможно очень большую) данных, т.к. это просто обычные копии, там нет никакого хитрого кодирования.
диски начали массово выходить из строя

У меня нет точного ответа на этот вопрос. Более того, не только мы с вами им задаемся. Есть вот такое исследование от китайского университета под названием "What Can We Learn from Four Years of Data Center Hardware Failures?", сделанное совместно и на основании данных Baidu.
В исследовании отмечает корреляция сбоев питания и сбоев жестких дисков. Кроме того, на странице 8 отмечается, что де-факто имеют место batch failures дисков, которые вероятно вызваны какими-то факторами, вроде одинаковых условий и нагрузки:
«We calculated N for each type of components, and Table V shows the results with N= 100, 200 and 500. We find that batch hard drive failures are common. During 2.48% of the days (35 out of 1,411 days), we observe over 500 hard drive failures. We also observe batch failures in components such as memory, power supplies, RAID cards, flash cards and fans.»

Для N=100 процент составляет 55.4, а для N=200 — 22.5%.
А из вкусного могут быть потожировые следы от рук.

Это тараканы любят, грызунам такое вроде не особо интересно.
Да и просто любопытство.

Коробка из сетки за 50 долларов вполне спасет от грызунов. Сталь прогрызать они пока не особо научились.
А не подскажете, где можно почитать про эту надежность? Просто, я 6 лет проработал СХДшником — и только сейчас в первый раз слышу про фантастическую надежность лент.

Ленты не «фантастически» надежны, они просто достаточно надежны для того, чтобы на них можно было полагаться и меньше подвержены случайным деструктивным воздействиям (банальная механическая прочность и отсутствие сложной механики, большинство же падений для жестких дисков фатальны в любом случае), вкупе с возможностью частичного восстановления за куда более разумные деньги, чем чтение данных с блинов мертвого диска, если там с механикой проблемы.
Но да, они все таки требовательны к условиям хранения (влажность в первую очередь).
Что касается исследований, то тут интересная ситуация. HP в 2012 году писал о том, что они взяли 10 кассет из офиса, которые там пролежали 10 лет и все они прочитались без ошибок. Официальный сайт LTO, как и производители оборудования (все полтора землекопа на текущий момент) говорят, что жизненный цикл кассеты равен по крайней мере 30 годам, в течении которых данные будут в сохранности, тот же Dell в своих документах пишет: " Cartridge Life. Durability – 1,000,000 passes on any area of tape, equates to over 20,000 end-to-end passes/260 full tape backups. Archival life – 30 years."
Вот еще исследование за 2015 год от HP, но они тоже заинтересованная сторона.
Настоящие полноценные исследования (кроме опровержения фейка про то, что в 71% случаев восстановление с ленты фейлится, который использовался много где и даже крупными компаниями для продвижения своих продуктов) к сожалению лично мне найти не удалось. Есть рендомные данные из тредов на разных ресурсах вроде этого, где люди с большим опытом хранения не отмечают проблем и говорят что все весьма и весьма надежно.
То есть безусловно сбои бывают и там, и там, нет никакой абсолютной надежности, но хранение больших объемов данных, которые могут понадобиться от «через месяц» до «никогда», но которые надо хранить и иметь возможность оттуда что-то вытащить — тут пленка все-таки пленка дешевле для того же (большого) объема, как раз благодаря относительно дешевым носителям и более низким сопутствующим расходам.
Безусловно, но разница в том, что даже потеряв оба зеркала данные все еще будут живы по крайней мере в остальном массиве

С чего это? Raid10 — это страйп по зеркалам. Да, остальные зеркала будут целы, но вам то какая от этого радость, потерянные данные будут равномерно распределены среди ваших файлов, не говоря уже о крахе файловой системы.
Возможно, это работает при конкатенации зеркал (это не Raid10 и не Raid01), но во-первых, вы тогда не получаете бонуса в производительности на запись, а во-вторых — все равно не понятно, как это переживет файловая система.
плюс есть шанс из двух полумертвых винтов с копиями все-таки вытащить какую-то часть (возможно очень большую) данных, т.к. это просто обычные копии, там нет никакого хитрого кодирования.

В кодировании нет никакой магии. Из полумертвых винтов можно и с кодированием вытащить данные. Мало того, насколько я помню, СХДшки умеют не сразу выкидывать сбойный диск, а только когда данные переедут на hotspare.
We find that batch hard drive failures are common. During 2.48% of the days (35 out of 1,411 days), we observe over 500 hard drive failures

Ой как мне не нравится эта формулировка. Дело в том, что нормальное распределение по количеству вылетевших дисков вполне допускает, что (на больших отрезках времени) будет несколько вылетевших дисков.
в 71% случаев восстановление с ленты фейлится

Возможно, этот фейк оказывает влияние на мое мнение.
Дело в том, что я 5 лет назад перестал быть СХДшником, и уже трудно вспомнить, что факт, а что — фейк.
Raid10 — это страйп по зеркалам. Да, остальные зеркала будут целы, но вам то какая от этого радость, потерянные данные будут равномерно распределены среди ваших файлов, не говоря уже о крахе файловой системы.
Из полумертвых винтов можно и с кодированием вытащить данные.

В целом тут вы правы. Просто так данные оттуда не восстановить, но бОльшая часть данных все-таки будет доступна, хоть и в поврежденном виде, что для некоторых типов данных может быть и не особо критично (медиафайлы, допустим). Плюс, за счет того, что у нас будет 2 поврежденных винта с одинаковыми данными (а не какое-то количество поврежденных винтов с кодированными _разными_ данными, из которых достать что либо методом «этот сектор не читается с А, прочитается с Б»), сохраняется шанс «собрать» из них достаточно данных, чтобы собрать хотя бы одну рабочую или условно рабочую (с пропусками, забитыми нолями) копию, которую все-таки можно будет накинуть в оригинальный массив и достать все или почти все уже без совсем сложного гемороя с частичным восстановлением. Но конечно тут речь не о падениях вида «сервер упал с полки, на пол»:)
Ой как мне не нравится эта формулировка. Дело в том, что нормальное распределение по количеству вылетевших дисков вполне допускает, что (на больших отрезках времени) будет несколько вылетевших дисков.

Вы немного невнимательно прочитали, мне кажется. Речь идет о промежутке в 1411 дней, за которые бралась выборка, и 35 днях этой выборки (2.48% всех дней) вылетало больше 500 винтов в день. При том, что более 100 винтов в день вылетало в 55.4% дней, а более 200 — в 22.5% дней. То есть это как раз показывает, что в динамике выхода из строя есть всплески, которые выходят за рамки нормального распределения и есть предположение (исходящее из статистики), что по каким-то (однозначно не сказано каким) причинам винты тяготеют к выходу из строя группами, а не единичными устройствами, иначи они высыпались бы равномерно, в соответствии с износом. Кроме них кстати склонность к групповому выходу из строя показывают другие компоненты, но винты в лидерах судя по исследованиям.
Плюс, за счет того, что у нас будет 2 поврежденных винта с одинаковыми данными (а не какое-то количество поврежденных винтов с кодированными _разными_ данными, из которых достать что либо методом «этот сектор не читается с А, прочитается с Б»)...

Все ровно то же самое. Есть N+2 дисков. Есть частично поврежденные диски. И чтобы потерять данные, нужно, чтобы на 3-х дисках в одном и том же месте данные не прочитались. Даже если на двух не прочиталось — именно та же логика — прочтем с остальных, посчитаем — и вот они данные.
Вы немного невнимательно прочитали, мне кажется.

Я все внимательно прочел.
We conduct this study on a dataset containing all hardware
failure operation tickets (FOTs) collected over the past four
years from a major Internet service company that operates
dozens of data centers with hundreds of thousands of servers.
Сотни тысяч серверов. Жестких дисков в них еще в несколько раз больше. И из этого зоопарка — под миллион дисков — естественно, что будут дни, когда они вылетают сотнями. Тем более, что 100 дисков — это почти медианное значение. Всего в 5 раз больше медианы — это вообще не много и прям прекрасно укладывается в нормальное распределение. А скорее всего, даже без статистики, просто по формулам теории вероятностей (скажем, формула полной вероятности, повторенная 500 раз) мы получим похожие цифры.
есть всплески, которые выходят за рамки нормального распределения

Про выход за рамки нормального распределения там было только про стойки 22 и 35 — с возможным анализом объективных причин. А такие всплески как раз прекрасно в него укладываются (вообще, вполне может оказаться, что выход из строя подчиняется не нормальному, а какому-нибудь другому распределению. Нормальное распределение обычно предполагают по дефолту, когда нет достаточных оснований предполагать другое распределение вероятностей).
Все ровно то же самое.

Теоретически то действительно можно, но чисто технически эта задача представляется весьма сложной и без спец. софта это сделать будет весьма затруднительно, просто из-за более сложной структуры храниения и необходимости вычисления данных. Вы не подскажете софт, которым можно подобное сделать в не-mirror винте? Я как-то искал и нифига не нашел ничего, что способно идентифицировать блоки, которые приходятся на нечитаемые сектора и потом пойти и вычитать их с из другого места. Так то ни один диск в raid 5-6 не является копией другого, данные с каждого размазаны по всем другим.
А такие всплески как раз прекрасно в него укладываются

Ну вот исследователи говорят что нет. Видимо имеют на это основание. В долевом вычислении цифры там действительно не большие и я думаю укладываются в средние по индустрии 1-1.5% от парка в год, но групповые сбои это не совсем то же самое, что просто сбой большого количестве дисков. Если винты в сторадже начнут сыпаться один за другим, то легче от того, что это 0.01% от всего парка то не станет.
вообще, это очень сильно зависит от того, каким raid-контроллером, софт рейдом или файловой системой это делается и должно им же и делаться.
Опять же, появление битого сектора — не приговор диску. Он реаллоцируется новым блоком из пула для замены. И в теории, все это должно проходить тихо и на фоне, заранее переехав на новый диск, когда будет превышен порог.

В идеале да, релокация из сервисной зоны и т.д, что происходит вообще незаметно и по сути видно только в смарте.
Все истории с проблемами с восстановлением начинаются тогда, когда штатные механизмы по той или иной причине отказывают. На ручном управлении я к примеру знаю, как с помощью известного мне набора утилит (начиная с dd, заканчивая быстрым написанием своей утилиты для посекторного сравнения данных и автоматического формирования максимально целой копии из двух побитых, т.к. задача в целом простая и линейная как тапок) собрать из двух зеркал одну максимально рабочую копию и вообще я представляю порядок действий для восстановления в подобной ситуации.
В случае же других массивов, отличных от зеркальных, порядок действий мне до конца не понятен и универсального софта (да даже не универсального, хотя бы для soft raid в виде того же md), который способен каким-то образом помочь мне выйти из этой ситуации я не знаю. Штатные средства начнут отстреливать полумертвый диск (особенно лагающий) задолго до того, как система сможет что-либо внятно с него перенести. Остается только сделать полную копию того, что можно прочитать, сторонними средствами, а дальше остается только молиться, чтобы система корректно вытащила данные и поняла, что забитые нулями битые непрочитавшиеся блоки просто некорректные и их надо откинуть.
На самом деле получился бы весьма любопытный эксперимент. Надо потыкать на досуге.
>>>Все истории с проблемами с восстановлением начинаются тогда, когда штатные механизмы по той или иной причине отказывают>>>

Тут еще все проще, вся история заканчивается когда умирает большая часть дисков на полке. Обычно в полках или в серверах идут запилы дисков, так как высокие обороты и у нас там все же есть воздух и какой бы класс очистки не был, рано или поздно все становится плохо. Восстановить такой диск просто не реально, электроника там будет жить поживать нормально и в такой запил она падает резко и смарт об этом ничего не скажет. Ну, а выше про надежность пленки, я добавлю ее можно и склеить =) и оно прочтется, но конечно не прочитаются те файлы которые попали на этот участок.
А если тихонечко сдохла холодная лента
— вы об этом можете узнать только, когда
она понадобится, и вовремя не предпринять
шагов по созданию копии еще живой ленты.

Получается, что в планах хранения обязательным пунктом должна быть регулярная проверка читаемости хранимой информации, чтобы вовремя выбрасывать умершие ленты и менять их на новые.

Правда, один раз была задача по замене всех дисков определенной серии — там привезли грузовик дисков и по специальной процедуре их дружно меняли. Но это все-таки, видимо, брак и такое бывает не часто.
Тут hp в прошивках ssd косячил, что те дохли четко по времени работы. Так что веселье бывает разное.

Самое что обидное в ленточных — что робота оемного могут залочить на комплектуху фирмы и ты потом будешь носиться с тем, где купить привод, чтоб точно работал, ибо восстанавливать техподдержку у IBM за пачку лет и потом покупать у них — дешевле нового взять. А леново не может гарантировать, что новый их привод от этой же чертовой серии бибилиотек заработает с ibmовской железкой (точнее их инженер считает, что не заработает)
>точнее их инженер считает, что не заработает

Ну так обычная история в кровавый интерпрайс. Инженер не может давать гарантию на что то другое, вне своей зоны ответственности.
Но практика показывает, что все можно и все работает и вполне себе живо =) По крайне мере до lto6.
Вполне верю, просто в основном все эти истории с недоэнтерпрайзом заканчиваются одинаково. Вначале вам названивают разные фирмы, которые готовы вам чего угодно продать, потом ты их спрашиваешь «а не продадите ли вы нам апгрейд полки hp с 2х1Gb на 2x10Gb сетевухами», после чего все говорят «ой, не, нас такие заказы не интересуют, мы вам хотим продать новую полку полный фарш, а вас, нищебродов, обслуживать не хотим». Ну и с приводами тоже примерно так было, что никто не хотел даже пробовать.
Поэтому я сделал выводы относительно железок кровавого энтерпрайза и того, к каким расходам должна быть готова контора, которая их использует. )
ну так да< ничего там нового нет. Яркий пример был какой то NAS от HP, которая разработала на HP, а они что-то купили. Стоил бешеных денег, но в совокупности с другими заказами продавливают скидки. Но я всегда говорю компаниям, представим, что вы завтра потеряете все данные — насколько это для вас критично и сколько вы готовы будите заплатить за восстановления. Дальше, уже пляски. Еще один пример я тут приводил, когда надо передать видео записи курьером, через много километров. LTO тут решает.
Встречал вопросы к механике той же, что всякие проблемы с смазкой (застыла или вытекла), заклинивает механику, окисление, пыль и прилипание и т.п.
итого: хранить нужно в сухом месте, завернув в антистатический пакте с селикогеле, причем чтоб ещё не шаталось ничего, вверх крышкой.

Но в общем люди обычно не хранят диски без подключения столько лет, поэтому статистику собирать, боюсь, не получится)

Совершенно верно!
У нас один HDD пролежал года 2 без компьютера.
Потом включаем его, а он не подаёт признаков жизни.
Ну важной-то информации мы на нём и не хранили. Так что ничего важного не потеряли.

Шутки ради, можно прям библиотеку купить за 2000 евро. Рабочую. На 678 кассет LTO-2:)
Но вообще, LTO поколения до 9-го совместимы на 2 поколения назад. То есть LTO-5 может работать с носителями LTO-4 и LTO-3. И такой драйв (LTO-5) сейчас можно найти за 250-400 евро. Приводы же LTO-7, последние совместимые с 5, будут доступны еще весьма и весьма долгое время (а сейчас ну слишком дороги), которого более чем хватит, чтобы накопить и неторопясь купить себе резервный совместимый драйв.
Но вообще, LTO поколения до 9-го совместимы на 2 поколения назад.

Скорее, на полтора — обычно привод может читать-писать предыдущее поколение, а вот предпредыдущее — только читать. Кажется, из этого правила есть какие-то исключения, но могу ошибаться.
только не забывайте, что второе поколение только на чтение.
Скорее, наверное, никто не выкидывает кассеты, а уничтожает физически, чтобы данные не попали не в те руки.


Не обязательно, у сервисных утилит для ленточных устройств есть процедуры безопасного стирания данных.
Для этого нужно прогнать всю кассету. Маловероятно, что ДЦ будет этим заниматься ради нескольких тысяч долларов профита.
Разве что в рамках заботы о окружающей среде. Но где тогда достать приводы в таких количествах? Если в ДЦ, условно, один привод на 100-1000 кассет, то для обычных пользователей это число в среднем будет 2-10 кассет на 1 ридер.
Ну так не все же, кто с лентами — ДЦ. Мне приходилось очищать несколько десятков картриджей LTO4.
Скорее, наверное, никто не выкидывает кассеты, а уничтожает физически, чтобы данные не попали не в те руки.

Мне кажется, кассеты никто не выкидывает особо. На них хранят данные, которые нужно хранить очень долго, десятилетиями. К моменту вывода оборудования из работы оно может пару раз морально устареть.

тут есть одна деталь: скорее всего вы платите за обслуживание ленточной библиотеки. И вот стоит она, занимает место, требует ежегодной платы за поддержку (а она дешевле не становится, может быть даже дороже будет, чем поддержка новой), а емкость у нее многолетней давности.
Поэтому, в определенный момент выгодно сменить старую на новую

Давайте смотреть еще глубже: владелец ленточной библиотеки за её стоимость её уже заплатил. Стоит она, конечно, и место занимает, но кушать много не просит, пока она просто стоит и хранит уже существующие данные (новые, естественно, пойдут уже в более современные системы).


Клиенты платят относительно небольшую сумму за хранение и относительно большую сумму за доступ не просто так: хранение — лента спокойно лежит на полке, чтение — это потребление электроэнергии и износ оборудования и ленты. Поэтому считывать все содержимое старой системы и записывать в новую — очень невыгодная операция. Это стоит и денег, и оборудования (которое, если умрет до того, как успеет все данные считать, будет невыгодно чинить).

1. Кушать она просит. Место в ЦОДе не бесплатное.
2. А что вы будете делать с этими кассетами, если сама библиотека выйдет из строя? Новые поддерживают только 2 поколения лент назад. И будут они «висит груша — нельзя скушать».
3. Я так полагаю, вы предлагаете стратегию «получилось прочитать — хорошо, нет — ну и ладно». Я противник таких стратегий и, имхо, лучше никак, чем так.

Имхо, перенос данных стоит производить, когда заканчивается контракт на поддержку, который не собираетесь продлевать. Тогда ремонт — проблема тех, кто поддерживает. А иметь ценные данные на не поддерживаемой системе (разумеется, если нет другого продуманного сценария, вроде второй рядом стоящей библиотеки или наличия людей, которые способны это починить) — имхо, плохая идея.
>> А что вы будете делать с этими кассетами, если сама библиотека выйдет из строя?>>>

только сейчас морально устарели lto2 и их стали снимать и больше нет поддержки. Возможно lto3. Lto4 сейчас в ходу и заказать детали не большая проблема.

>>>Я так полагаю, вы предлагаете стратегию «получилось прочитать — хорошо, нет — ну и ладно».>>>

Стратегия не в этом. Стратегия в том, что у вас данные и большой их массив, хранятся и более надежно. Как уже выше писали карики не жрут электричество и они в любой момент готовы. Ну и обычно всегда считает, а что будет если мы потеряем данные. Сколько бизнес у нас потеряет. Вообще стратегия хранения больших данных, это отдельное искусство и иногда головная боль. Пока данные не были восстановлены и проверены, что их можно восстановить — они находятся в состоянии суперпозиции. На моей памяти, вообще мало кто это проверяет и делает. Как и отключение одной из половин кластера, после который схд может потерять легко половину дисков.
Лично мне не помешает несколько десятков секунд перед запуском фильма. Всё равно надо собрать домашних, удобно устроится. Но это конечно только для фильмов.
Все равно это снижение уровня сервиса.
А если захочется перемотать до какого-то момента? А если это сериал с 20-минутными сериями? Не обязательно же они в нужном порядке запишутся (а то и параллельно на разные дорожки).
1)В случае необходимости данные должны писаться последовательно. Учитывая объём накопителя небольшая потеря ёмкости допустима.
2)Давай посчитаем. 1250м длина плёнки, 560tb ёмкость, 4м/с скорость плёнки при чтении записи (сколько при перемотке неизвестно, но точно не меньше).
1250/4=312 секунд время чтения.
560/312=1,79tb/сек.
Фильм занимает максимум 50гб. Значит за 1 секунду можно промотать 36 фильмов. Перемотка совершенно не проблема. Даже если не только серии, но даже целые сезоны записаны в разнобой.
560 тб? Такие пленки еще очень не скоро будут доступны, не говоря уже о цене, «для дома для семьи». Смысл их сейчас обсуждать? Тогда, может, и обычные диски (или ssd) будут сравнимого объема, или что-нибудь еще более новое придумают.

Плюс, вы же не количественно фильмы насматриваете, вы смотрите те, которые хочется, а они могут оказаться в разных местах пленки.
Ну мне было интересно посчитать для хайтек решения. Но учитывая запас который получился думаю для более дешевых решений тоже хватит.
Если вам интересно-пересчитайте.
Я редко за раз более 1 фильма смотрю. а если и захочу всё равно будет перерыв на чай\туалет. Вот сериал да, но для сериала я посчитал.
когда хайтек решение будет доступно — может, и фильмы будут совсем другого объема. Сейчас lto9 — это 24 тб.
Ну и в любом случае, никто не гарантирует, что следующий фильм (следующая серия) будет на разумном расстоянии, а специально упорядочивать их — опять же, лишние действия, снижение качества обслуживания.

И еще один момент: а что, если с этого носителя будут параллельно смотреть двое? Ребенок — мультики, вы — фильм. И параллельно захочется фотки посмотреть, а может и загрузить.
Имхо, дома со всем этим можно мириться только в случае привлекательной цены, в том числе и на стриммеры
специально упорядочивать должен софт. Я не говорю что таким решением НАДО пользоваться, я говорю МОЖНО. В смысле железо позволяет.
Двое? ну обычно фильм около 10 гб. Его даже в ОЗУ закешировать можно. 50 гб… ну в кеш SSD. И это не говоря о том, что закешировать можно половину. У меня ребёнка нет, но у всех друзей дети мультфильмы только онлайн смотрят.
Ну и в любом случае, никто не гарантирует, что следующий фильм (следующая серия) будет на разумном расстоянии, а специально упорядочивать их — опять же, лишние действия, снижение качества обслуживания.
Софт.
И еще один момент: а что, если с этого носителя будут параллельно смотреть двое?
Кэширование на диск. Чтение с ленты быстрее, чем требуется поток для вывода на девайс.
Имхо, дома со всем этим можно мириться только в случае привлекательной цены, в том числе и на стриммеры
Роботы тоже очень дорого стоят, к сожалению… но в целом надежность лент для постоянного чтения данных требуется другая, чем для режима запись нескольких десятков бекапов с перетиранием и всего несколько чтений за это время. Через, допустим, сотню циклов записи лента на выброс, а дома это будет сотни циклов чтения ленты…
>Роботы тоже очень дорого стоят, к сожалению…

Дорого и ломаются T_T
Если честно, то мне даже интересно, почему при таком развитии роботостроения как хобби я вот не смог найти даже попытки сделать свою руку с сканером штрихкодов на какой-нибудь малинке…
Через, допустим, сотню циклов записи
лента на выброс, а дома это будет
сотни циклов чтения ленты…

Не понимаю — что может потребовать так много циклов чтения информации, которая записана на носитель в основном только для хранения?


Проверка читаемости — не больше нескольких раз в год.


Вытаскивание бекапов информации, которая бекапится на случай, если "где-то что-то куда-то улетит" — бывает и часто, но в среднем — тоже довольно редкое явление.


Посмотреть дома любимый сериал повторно — вряд ли чаще, чем через 5 лет после его первого просмотра, в третий раз — даже не через 5 лет, а ещё позже, а потом — вообще только потомкам, да и то — только тем, который стариковские фильмы поймут и заценят по достоинству.


Так что тут даже за несколько десятков лет достичь циклов 100 чтения наверно никому не потребуется. А там гораздо быстрее наступит время переписывать информацию с лент устаревших поколений на ленты более совершенные.

Записали кучу детских мультиков и фильмов и всё. А с учетом, что смотреть ребёнок будет не по порядку, то «хочу машу, хочу колобка, хочу братьев пилотов» и туда сюда гоняется лента.
С учетом, что один фильм посмотреть — это перемотать пол ленты, такое себе…
ну так это не на постоянно смотреть. Это копия ваших мультиков, на тот момент, если ваш нас откуда вы смотрите — посыпаться. Можно задаться, а на кой черт вообще хранить мультики, фильмы итд — ну например есть редкие ролики или есть в том переводе, который потом исчезает из масс. Ну как такой тупой вариант.
Ну в ветке же по сути обсуждается решение на домашнее использование плёнки под медиасистему, что большой объем, сама пленка не очень дорогая, а 10 секунд до запуска фильма — это не долго.
Под бекапы то понятно, что пленка как решение во многом лучше)
ну тогда решение будет такое себе и выбор начинается только от lto5 с ltfs
Фильм занимает максимум 50гб.
Посмотрел на десяток фильмов в нормальном качестве для 4k фильмов… «День сурка» под соточку у меня. В связи с чем 2 тб внешнего диска быстро закончились после добавления в коллекцию с десяток подобных фильмов…
что-то я отстал от жизни. Про BDXL и не слышал до вашего поста.
Хотя всё равно. Для FHD имхо больше 12гб на 90 минутный фильм нафиг не надо. Даже если на 4 умножить(а по факту меньше т.к. при большем разрешении больше сжатие) всё равно меньше 50гб.
Вспоминаются последние звездные войны. Гигабайт 20 всего 4к рип, и куча шумов плёнки видна. Но это так, к слову.
Вспоминаются последние звездные войны. Гигабайт 20 всего 4к рип, и куча шумов плёнки видна.

А откуда там шум пленки, если последние ЗВ (и не только последние) полностью сняты в цифре?
Более того, таже Эпизод 2 в 2002 году уже был снят полностью в цифре.
Хз, мы на семейном совете решили, что это художественный приём, но он нам не понравился.
Ну вот всякие переноски тяжестей в виде тугоплавких колец туда-сюда, однотипные дни и прочие аватары с роботами-выносящими мусор что-то все весят заметно за 50 гигов для fullhd и выше, так что 10-12 фильмов выжрали терабайт где-то. Я сам немного погрустил по этому поводу, потому что из 8 тб делать внешний диск не хочется...

А вот ленту для бекапов использовать для дома очень хочется, потому что скинуть касету родителям в другой город и сестре в другой район — и всё, можно не беспокоиться о старых файлах)
По факту, если данные на внешнем жестком диске, то если поставить на паузу тяжелый фильм и уйти минут на 10, то потом секунд 5 на раскрутку диска и на продолжение чтения диска тратится.
Если бы софт был оптимизирован, то при наличие библиотеки файлов с кэшами картинок и названиями, а так же умным кэшированием читаемого в процессе — сервис был бы не плох (с ленты даже lto4 файлы копируются очень шустро, дольше ждешь пока робот загрузит, при этом на компе хранится вся информация где какой файл на ленте лежит и т.п.).
Косяк в том, что трудно удалить и записать на это место другое, а чтение так же расходует ресурс ленты.
Ну БУ и не нового поколения вполне можно купить и для дома этого хватает.

image

image

еще в другом месте lto4, фото искать лень и надеюсь выкуплю lto6.
Так я покрываю обратную совместимость.

В целом хватает lto5 + ltfs, так как не надо плясок бубнов с софтом

Оффтоп. А там реально полуось или это просто обоина от 4-го варпа? ;-)

По моему там чётко видна панель задач десятки сверху.
нет там 10, но полуось есть рабочая в разных вариациях =)
от os/2 1.3 до arca

Опа. Арка-же в сеть не утекала, кроме как одна из первых версий от одного из представителей комьюнити, для комьюнити. Или вам тоже знаком канал #os2russian на efnet?

Офигеть. Знаю ровно одного человека в этой стране(не по работе) купившего арку. Ну и маленькую питерскую конторку, работающую на нефтегаз, разумеется тоже знаю. Но они пачками покупают, для своих решений.
А вообще Респект!

Извините, я правильно понял, что таблица «Увеличение плотности записи и ёмкости картриджей LTO. » описывает плотности записей, достигнутые как-то в лаборатории IBM, и не доступные для покупки? Потому что LTO-8 несжато хранит лишь 12 ТБ, а LTO-9 всего 18 ТБ.
Если она такая дешевая и вообще за ней будущее, почему мы перестали ее использовать повсеместно?
За ней будущее хранение данных в ДЦ.
Даже в нашей компании как минимум в одном ДЦ в каждом регионе стоит по ленточной библиотеке.
Почему не используем повсеместно? Потому что устройства чтения/записи стоят как профессиональный Mac, нафаршированный по самое не балуйся.
Если только что-то записать и отложить лет на 100, тогда да, будущее.
Понимаете, очень много данных нужно хранить из-за законодательства или людей в синих костюмах.
При этом даже не факт, что эти данные понадобятся — но хранить нужно.
Поэтому есть тёплый бэкап и геораспределенный резерв, а остальное (свыше недели/месяца) пишется на ленты и уходит в хранилище.
В результате приколы, типа, судебных исков очень просто решаются именно с лентами. На HDD такой объем данных хранить нерентабельно, особенно, если не знаешь, а понадобится их чтение или нет.
очень много данных нужно хранить из-за законодательства или людей в синих костюмах.

В костюмах любого цвета :-) Приходит пользователь и говорит — у меня в такой папке на сервере лежал нужный файл, а сейчас его нет. Залезаешь в каталог бэкапа, и обнаруживаешь, что кто-то удалил этот файл полтора года назад. Вставляешь в библиотеку нужный картридж, через двадцать минут файл на месте, пользователь счастлив. У меня это было неоднократно.

Именно "повсеместно" мешает низкая скорость доступа к произвольному блоку данных. До него надо ленту мотать, а то и кассету менять. Диски и твердотельные накопители универсальнее.


Там, где это некритично (бэкапы и архивация) — используют все, кто может себе позволить.

Сыпятся пленки-то. Я так от бобинника отказался, бо пленки восьмидесятых мелкими кусочками скидывали с себя магнитную поверхность, до прозрачности.


А отцовские ленты семидесятых еще и намагнитились.

Современные плёнки должны быть двухслойными!
Тогда магнитному слою некуда будет деваться))
Одно дело — сыпется бытовая плёнка «Опытного Шосткинского объединения „Свема“» (где слово «Опытное» не просто так вставлено, а плёнки там делали для совершенно разных целей и не всегда с предсказуемыми результатами), другое — упомянутая Orwo, наверно совсем третье — современные плёнки. А если нужна стабильность — это Вам в упомянутое хранилище в вечной мерзлоте. Даже в школе бобины/кассеты хранили в холодильнике.

Технологии на месте не стоят, как производства чувствительного слоя, так и несущей ленты и адгезивного слоя, да и механика тоже развивается.
К примеру, кто сейчас вспомнит трёхшпиндельную конструкцию лентопротяжного механизма магнитофона, дававшую улучшенную плавность движения ленты и низкий коэффициент детонации? Дорого, сложно, мало распространено. А элементарным решением, дающим не худший результат, стало опоясывание подающего, принимающего узлов и головок единым пассиком, гарантирующим строгую синхронность движения ленты по всему тракту. И решение это было использовано в конструкции одного из многочисленных типов картриджей для стримеров. В магнитофонах решение уже не пригодилось, к сожалению.
Магнитная пленка она разная есть :]
Это элементарное решение было в ранних магнитофонах, потом стали заботиться о натяжении плёнки в катушках и появилась трёх моторная схема. В ранних катушечных стримерах тоже она + ленточные пулы, их видно на фото.
В картриджах, за порядком следит софт и логика управления двигателем, которая просто не позволяет творить с плёнкой непотребства, да и необходимость поиска начала сессии на картриджах отпала.
В ранних стримерах то же далеко не бытовая пленка была. Самый бытовой и доступный стример, это был арвид с vhs. Но не взлетело, так как с vhs тупо все было плохо да и другие форматы стали более дешевыми. Тот же dat/dds не без проблем но работает.
Арвидом пользовался, вполне удобно и продуманно было сделано. Всё-таки 2 ТБ во времена 400 МБ винчестеров было довольно неплохо, да и по цене доступно.
Да я не говорю, что плохо. Но проблемы с пленкой и надежности, оставляло желать лучшего.
Но проблемы с пленкой и надежности, оставляло желать лучшего


Пользовался Арвидом с 1995 по 2005 годы, до тех пор, пока этот девайс не устарел морально, после покупки ASUS DRW-0402P/D в 2004 году.
Была куча кассет и ни одной серьезной проблемы за эти годы (кроме времени, кассету надо было писать 3 часа в реал-тайм :)
Писалось, конечно, долго, но ведь задача на запись ставилась быстро — в прилагаемом файловом менеджере помечались файлы и запускался полностью автоматический процесс, можно было идти спать.
я бы и сейчас пользовался, если бы драйвера были(да хрен с ними с драйверами, откройте спеки я и сам напишу)
А в QEMU не запускается? В конце концов, можно DOS-машину отдельную держать, оснастив сетевыми возможностями, например, за счёт EZ-NOS.
та его уже просто нету у меня (. был примерно с 1996 по 1998 год

АРВИД сейчас либо на ретро железо, либо на современное железо, с промышленной материнкой, можно поставить. Он-же исключительно для ISA шины существовал.

и кстати, помню, читал еще чуть позже, чем собственно был арвид, обзор некоей вундервафли западного производства, то был уже честный стример на vhs кассеты.
не помню ни названия, ни объемов хранения. это уже год так примерно '99 — 01.
Зачем вам документация, тв тюнеры сейчас почти ничего нестоят, свой формат выдумать и выводи на мафон туда и обратно ;) Проблемка в другом где брать сейчас и в будущем эти видеомагнитофоны :D
Да Да То то мы все замарочились с pcm и сделали софт реализацию -)
ну так велком, обратный реверс идет на Канале Fagear, правда пока вяло. Вроде плату уже развели.
Всё-таки 2 ТБ во времена 400 МБ винчестеров

2 ГБ же?
Описка, конечно 2 ГБ.
Тут я под стримерами, боянистые катушечники имел ввиду ;-)
А Арвид-то да, кросавчеги, я их хорошо помню, не взлетело потому-что продавать не умели толком. И проблем было не так уж много, если видак эпизодически чистить.
dat/dds стоили совсем других денег и ещё сказявый контроллер для письки.

И вот ещё штрих к портрету, Alesis ADAT он правда для звука и законченное устройство, а не опция аки PCM. Но, я не слыхал не разу, что бы у кого-то что-то не читалось, и вообще у кого не спроси, у всех довольная лыба при упоминании этого устройства. Уж больно дёшево, да круто, для своего времени оно было.
и вообще у кого не спроси, у всех довольная
лыба при упоминании этого устройства

Году ~ в 98-99-м увидел я впервые устройство чтения/записи (ну и накопители к нему), от которых получил ну не лыбу, но почти удивление (граничащее с восхищением) — зип-дискеты.


Пока в университете учился, всегда знал, что зип — это такие архивы. Ну ещё этим слово вроде применяют в США для обозначения того, что мы называем почтовыми индексами.


А оказалось, что в мире существуют ещё и некие зип-дискеты размером на 100 мегабайтиков. Мы на этих дискетах тогда кому-то таскали какие-то обновления чего-то — Консультанта что ли или чего-то подобного. Ну по тем временам дискеты эти 100-мегабайтные представлялись мне тоже неплохой идеей для хранения информации.

Дискета вообще была оптимальным средством переноса данных. Можно работать с произвольным файлом, редактируя его прямо на месте. Плюс остаточно дешёвые, чтобы можно было просто отдать получателю.

А ZIP-ы и магнитооптика ещё и объём актуальный получили. Очень жаль, что повышение стоимости «новых дискет» и снижение стоимости пишущих CD это направление зарубили.
Ну, плёнки из восьмидесятых у меня до сих пор лежат, и нельзя сказать что всё это время они провели в идеальных условиях, но условия хранения сильно влияют.
В нулевых оцифровывал концертную запись битлов из шестидесятых.
Сложность была только в том, что магнитофон которым она была сделана не сохранился и продюсерам не удалось накопать о нём никакой информации. Там было три дорожки на всю ширину ленты, и не стандартная коррекция.
Химичить с плёнкой не пришлось, хотя для плёнки это большой срок.

А вот звёзды нашей эстрады напротив, писались и бэкапились на редкостную гадость.
И доходило до того, что мастер лежавший дома на полочке жестоко осыпался, а многострадальная концертная копия сохраняла целостность.
Только к каждому биту на HDD можно получить доступ практически мгновенно. А вот ленты на катушках надо перематывать. Они хороши только когда данные идут последовательно, например фильм или музыка.
Почему же на HDD мгновенно? Там ведь поиск дорожки и ожидание сектора, иначе зачем SSD?
Зато на одной ленте поместится несколько копий HDD. Поиск нужной не моментален, но автоматизирован.
На HDD время доступа — это, грубо говоря, передвинуть блок головок и подождать, пока диск сделает долю оборота. Допустим, на это уйдёт секунда (совсем никчёмный диск, да).
На ленте — промотать кучу плёнки. Сколько понадобится времени, чтоб эту самую плёнку перемотать, особенно если её много десятков метров?
Плёнки хороши для бекапов или для данных, которые читаются/пишутся большими блоками, а для случайного доступа… нет, спасибо.
мы же тут про надежность сохранения данных вроде как. Холодный архивные данные не кто не отменил и они не исчезнут.
Плёнка для холодных данных, хранить на ней горячие не имеет смысла.
Чего такого вообще есть в приводе за 8000$? Чего нет в HDD и DVD к примеру…
Нерастиражированные в таком количестве чуть более точная механика, чуть более производительная электроника и чуть более сложная прошивка, вероятно. Магнитооптика тоже до сих пор недёшева.
а можно современные реализации магнитооптики? Ну кроме как то, что планируют сейчас в новых HDD делать.

Так вроде на стандартах UDO2 все и заглохло.
Вроде заглохло, да. Но периодически всплывающие экземпляры приводов стабильно радуют рандомностью цен.
ну так на Раритет цены вообще радуют — Говно дидов же, редкость! В итоге оно потом идет в мусорку. Ну а когда на ютубе поднимаются тренды, на примере sony pwm, так вообще чума. Ты, что чувак в nes/sega играть со всеми цветами — это же модно молодёжное и поэтому оно стоит 18 тр :D Хотя состояние экземпляра ушатоное бывает в говно.
Но если предположить, что кто-то именно на МО диск снёс с глаз долой свою крипту, например, или что-то другое, представляющее не только историческую ценность, то цена может быть просто любой.
Это уже некая клиника, сначала на непопулярный носитель скинуть крипту, потом за баснословные деньги покупать привод (вместо услуги по чтению данных).

На счет механики, хочется подробностей. Вот в HDD я понимаю, и гелий и балансировка блинов и головки с нанометровыми зазорами. Что в LTO приводе?

Про скорость электроники, ну если уйти от сжатия на лету, что в современных реалиях не нужно совершенно, то и электроника будет вполне обычной. Да и то, видеокарта совсем топовая стоит менее 1000$, огромный кристалл и 350 Вт. В приводе все куда скромнее должно быть, просто исходя из его ТТХ.

Все выглядит как будто рептилоиды специально поделили рынок HDD и лент, чтоб точно не пересеклись.
«Скорость последовательного чтения и записи на плёнку выше, чем у современных HDD.»
«В последней модели LTO… головки позиционируется с точностью 3,2 нанометра.»

Но дело не в этом, в конце концов комплектующие всё равно типовые, иначе бы накопители стоили ещё дороже. Вопрос в скромном тираже, на который размазывается стоимость разработки новых стандартов, устройств, прошивок и носителей, а также хранение запасных частей.
Топовая видеокарта, если бы производилась таким тиражом, стоила бы дороже.
Единственная причина, по которой я не буду использовать ленточные накопители (а мне надо уже сейчас до десятка терабайт, обхожусь семью дисками по 3тб в рейд5, но в ближайшее время этот объем удвоится а может и утроится, а еще хотелось бы бакап разнести удаленно) — это неадекватно высокая цена ридеров и высокая цена носителей в розницу (где эти 1$ за терабайт?).

Единственный кто определяет популярность технологии в данном случае — это производитель, удерживающий цены выше адекватного порога, на столько что пользуются ими те кому в принципе альтернатив никаких нет и пороговые объемы уходят за петабайты.
высокая цена носителей в розницу
Картридж LTO-6 HP 6.25 ТБ — 2800. 4 и 5 примерно столько же. Новые.
На авито — дешевле помню были.
Картриджи то как раз халявные. Вот стримеры — безумные цены имеют…
Это старые поколения, там велик риск того, что через 10 лет нечем будет прочитать.
Эм, мы года полтора назад взяли ещё ibmовский новый стример lto4 через фирму для библиотеки на 24 касеты (lto5 не рискнули — ибо ibm же, там без их инженеров соваться опасно, а за такие деньги, в которые обошелся бы нам оный, мы б нового робота закупили бы). Выход 4 поколения — 2007 год.
LTO6 будет писаться ещё 7, а читаться 8 поколением.
Подозреваю, что ещё лет 15-20 это не будет проблемой…
Собственно, в том числе и поэтому это столько стоит.

Тут как раз дело в том, что объёмы уже маловаты на текущий момент для серьезных дядей, но и только.
Ну вот я один из этих серьёзных дядей, мне всегда мало ))
Ну я вот смотрел на бу библиотеки на авито… а что, удобно — загрузил 12-24 картриджа и загоняй на них по кругу.
Но вот чтоб мне прям щаз не хватило картриджа на 2,5 тб без учета сжатия (кстати, удобно — не надо вначале жать бекап, чтоб куда-то кинуть, на лету пишется обычные юзерские данные с сжатием раза в 1,5-2 точно) — это если только туда мою новую коллекцию фильмов с высоким битрейтом туда писать) А то на 4k 1,5 гиговые рипы смотрятся уже не так интересно)
А библиотека позволяет сквозную запись больших файлов? Грубо говоря, вот есть файл на 8 терабайт, можно его без бубна записать на 4 картриджа в библиотеке?
Так как я лично работал с библиотекой только через прицел купленной программы для бекапов и восстановления, а подбных файлов у нас никогда не было, то я таким вопросом не задавался. Скорей всего нет, бубен потребуется (хотя бы в виде умеющего в это дело софта)
Программа пакует файлы в свой формат и там его, если умеет дробит. Дальше софт в своей БД пишет какой файл записан на картридже. Так осуществляется быстрый доступ. LTFS вы все это делаете сами
Подскажите, на сколько удобно работать с файлами на чтение? ридеры имеют какой-нибудь кеш для данных или они складываются на диске? могут не складываться? нужно ли заранее решать, сколько именно данных нужно с ленты запросить?

т.е. к примеру огромный объем данных, нужно линейное чтение, потоком отправляется в софт для обработки (пусть даже не будет успевать, вопрос кстати будет ли от этого проблема, если лента будет рывками то запускаться то останавливаться)
не очень понятен вопрос.
LTFS очень удобно работать, так как lto выглядит как флэшка. В начале ленты есть данные о папках, файлах итд итп. В youtube есть примеры как работает ltfs.

Другие форматы зависит от ПО которым вы будите пользоваться. В нам вы выбираете файлы для распаковки и все. Те это не как работа с флэшкой. С LTFS можно нормально просматривать фильм.
Надежность наработки на отказ, то, что требует бизнес. Обычный человек не выработает этот ресурс, в бизнесе легко. Ну и сложность системы, юстировка, бвг, головы, наклоны + обеспечить обратную совместимость на два поколения назад.

Можно посмотреть само технопорно



Совсем недавно массово были недорогие miniDV камеры, вся та же самая прецезионная механика и вращающийся блок головок, тут я так понимаю, вообще линейная головка.

Вот еще интересно, а указывается где нибудь, как часто ленту можно мотать? Условно говоря, если я все фильмы скину на ленту и буду каждый день ее мотать, как быстро она умрет? Или лента все же чисто бакапная, то есть в основном пишем и скорее всего больше никогда не обращаемся к ней? И еще, а требуется ли ее перематывать хоть иногда? Помню, со времен магнитофонов, была такая рекомендация, перематывать бобины хоть раз в год если не слушаешь.
Линейная, да с приводом, скорости, стабильности, и совместимости ради.
Перемоткой, как я уже выше писал, управляет софт и делает это разумно, а в картриджи плёнка и вовсе сматывается, да и линейным головам не так критична стабильность скорости.
А по поводу живучести, тут трудно сравнивать различные поколения плёнок и технологий, но в общем БВГ пилили плёнку гораздо более жестоко, и ничё.
На Wikipedia.
Строка «Expected tape durability, end-to-end passes». В зависимости от поколения от 9600 для первого до 20000 для шестого и выше.
Для полной записи всей емкости требуется от 48 до 208 полных проходов в зависимости от поколения.
Для LTO-5 это 80 проходов на полную запись и 16000 проходов предполагаемого ресурса, то есть порядка 200 полных записей (или полного чтения, все равно мотать же). Не особо надолго хватит.
>Вот еще интересно, а указывается где нибудь, как часто ленту можно мотать? Условно говоря, если я все фильмы скину на ленту и буду каждый день ее мотать, как быстро она умрет

Да указанно на самом карике.
1. Где-то читал, что лента выдерживает 250 записей/воспроизведений (т.е. протяжек вдоль головок). Но эти данные про старые LTO ( до 5).

2. Перемотка ленты при хранении: для аналоговых записей дело нужное, иначе намагнитятся соседние слои катушки (копир-эффект). Для цифровых записей не уверен, т.к. поток 0 и 1, а при случайном перемагничивании информации должна восстановится кодами Соломона-Рида.

p.s. Про осыпание лент: у меня была книга про магнитную запись, так в ней рекомендовалось для архивного хранения использовать ленту немного б/у, т.к. она уже потерта и «рыхляк» с нее осыпался. для цифровой записи этот совет наверно актуален.
Все верно. 250 это полный цикл.

У DDS/DAT был регламент переметки лент как рекомендуемый, на LTO совсем другой тип ленты и я не помню, что бы в даташитах и сам производитель рекомендовал это делать. Ну и еще есть WROM карики, которые только на чтение.
В стандарте — видео выше 15000 циклов прохода я так понял
Возможность задрать ценник и продать это крупному бизнесу, который таки купит)
Но если б lto был в каждом доме, то ценник мог бы быть и ближе к блюрею какому-нибудь.
А так покупателей не так чтоб прям много, к тому же это лент закупают вагонами, а приводов то нужно на порядки меньше, вот и получаем, что недостаточно массовый продукт, но нужный серьезным дядям.
Да и то, видеокарта совсем топовая стоит менее 1000$, огромный кристалл и 350 Вт.
А процессор интела на 28 ядер имеет кристалл меньше и цену в десятку тысяч баксов. Потому что, да…
— Холодное хранилище
Ледниковое будет точнее.
У ленточных накопителей относительно высокий срок гарантированного сохранения данных.

А вот устройства для чтения (стримеры), увы, очень быстро выходят из строя.
Например, распространённая причина выхода из строя SSD и HDD — сбой электроники в контроллере, а в HDD ещё повреждения головки. Плёночным картриджам в этом случае ничего не грозит. Вероятность ошибок при записи или чтении плёнки на 4-5 порядков ниже, чем у жёстких дисков.

Если у вас сломается LTO привод восьмого поколения, то считать данные с кассет будет ещё той проблемой! Кассета записанная и читаемая на одном приводе может с лёгкостью не прочитаться на другом. Вот и получается как с жесткими дисками — контроллер сломался, данные с диска никуда не делись и вроде бы вот они — есть, но калибровка с метаданными для доступа к пластинам улетучилась вместе с сгоревшей микросхемой памяти контроллера диска и чтобы получить эти данные нужно идти на поклон в ремонтные лабы. В случае с стриммерами, правда, ситуация вроде бы проще — можно накупить их несколько и надеяться, что кассета на каком-нибудь прочитается, но если не получится, то так же придётся нести кассеты в лабы.
Вот интересно — как эта проблема решается, где лента внедрена в масштабе (БАК, хранилища и т.д.)? Все приводы калибруются по эталону?

Хм, а в ленточной библиотеке разве только один ридер? Или кассета всегда пишется и читается только в одном? Мне кажется, это большой минус технологии, если после поломки ридера можно выкинуть все кассеты с него, нужно резервирование резервных копий...

Или кассета всегда пишется и читается только в одном?


Нет, конечно — в середине 90х у нас были стримеры в виде переносных устройств, которые в те времена использовались для переноса данных из одной конторы в другую. Они все были одного типа и никаких проблем чтением/записью у них не наблюдалось.
Модель уже не помню, но на одну кассету влезало 50...80 Мб, что для 1994 года было больше чем дофига.

У нас в данный момент 36 приводов. Робот автоматически использует первый свободный.


Однако, за свой более чем 20 летний опыт работы с лентами действительно встечал случаи, когда записанное одним приводом, другой прочитать не мог. Но это конечно же дефект, хотя в потребительском секторе, возможно, это нормально.

> лентами действительно встечал случаи, когда записанное одним приводом, другой прочитать не мог.

Это очень редкий случай и обычно в роботизированных шкафах.
Но там беды не в самом приводе обычно, а в криворуких инженерах, которые меняют приводы или по причине поломки (что бывает редко) или по причине износа, что более часто. Так вот когда меняют по причине износа, то часто что-то идет не туда и это может привести опять к причине поломки. Решается это конечно на уровне вендера с выездом нормального специалиста и почти второй копии шкафа в разобранном виде. Обычные стационарные, если их не убивать и не делать эксплуатацию больше отработок по часам, то все будет ок.
>если после поломки ридера можно выкинуть все кассеты с него, нужно резервирование резервных копий…

Нет там этих проблем. Все нормально прочитается на другом. Проблема начинается в софте и его использовании. Для того, что бы знать где какие у вас данные используется БД, у кариков есть штрих код и метка rfid внутри, по которой робот или стример ориентируется. Вот если вы просрали БД кариков, для вас начинается попа боль. Для обычных смертных да и вообще упрощение, придумали ltfs с 5 поколения. Когда ты отснял материал где то простите в #$%нях и его надо быстро отправить оленями, не один hdd не спасет. Шанс, что он приедет нормальный очень низкий. Поэтому проще для видеоиндустрии отправлять кариками. Есть отдельные стример LTO с экранами.
>Если у вас сломается LTO привод восьмого поколения, то считать данные с кассет будет ещё той проблемой!

Сразу видно, личный опыт.
Опыт со стриммерами одноразовый. Вы вот выше пишите, что это скорее редкость, но я в своё время посидев по профильным форумам и пообщавшись с сотрудниками контор по восстановлению данных пришёл к выводу, что проблема-то такая есть и связана, конечно, с усложнением техники. Сами посудите — 15 лет назад можно было починить жесткий диск самому: покупаешь точно такой же (по платформе), берёшь отвёртку и переставляешь контроллер. И оно работало! Со старыми стриммерами (я так понимаю, где-то, вплоть до LTO-5) тоже не возникало никаких проблем с совместимостью. Нынче уже всё не так.
>>>15 лет назад можно было починить жесткий диск самому: покупаешь точно такой же (по платформе), берёшь отвёртку и переставляешь контроллер>>> берите больше, лет уже 20 назад и то с оговорками. Это сейчас кажется простым такой ремонт и жестких и плат и всего остального. С LTO сейчас ситуация простая, это юстировка.Посмотрите роли выше, что я скидывал и вообще канал у человека. Там есть попытки пересадки и с робота и перепршивка
Извините, но на библиотеках два привода вполне себе работают штатно, если б всё было так ужасно люди бы с роботами не могли работать.
Правда у меня опыт не с 8 поколением, а с 4 и после замены привода как бы прочитались старые ленты.

Ага, и время случайного доступа к памяти от нескольких минут..., это если «касета» уже в «магнитофоне»
Так что будущее у пленки это сегмент бекапов и возможно ещё чего-то специфического.

Так что будущее у пленки


Помню, были какие-то слухи о том, что китайцы с австралийцами сделали оптический диск на 10 Тб с фантастической на текущий момент надежностью хранения данных.
Сейчас эту нишу взял на себя M-DISC
Сейчас эту нишу взял на себя M-DISC


Там до 100 Гб, это на два порядка меньше.
оптический диск на 10 Тб

Перезаписываемый?
Или данные один раз записал, "зафинализроивал", а потом только читай их?
И какая скорость записи да чтения?

Перезаписываемый?


Нет, сугубо для архивов — процесс перезаписывания 10 Тб будет весьма долгим.
А так даже у меня есть свыше 40 Тб архивных данных, которые в перезаписывании не нуждаются, но место на жестких дисках занимают.
будущее у пленки это сегмент бекапов и возможно ещё чего-то специфического.

Так это не то что будущее, настоящее плёнки — бэкапы и холодное хранение данных типа научных, объём которых будет только расти. Так что за будущее столь архаичной на первый взгляд технологии можно не переживать. Место в будущем есть как у магнитной плёнки, так и такого откровенного ретро, как например, цветной матричный принтер.
Вот бы сервис записи на кассеты последнего поколения, ну или там аренды какой-нибудь специальной версии писалки с подключением по USB. Можно было бы наделать бекапов и быть уверенным в том, что сможешь их прочитать в течении хотя бы 10 лет.

Называется Amazon S3 Glacier. Главное чтобы кредитная карт была резиновая…

Там я данные пощупать не могу, плюс да, бешеная цена при восстановлении большого объёма данных, плюс хоть небольшая, но копеечка на их холодное хранение.
Кассета же в личном пользовании при хранении ничего не стоит, а восстановление по сути будет стоить столько же, сколько и запись.
вопрос как вы проверите, что там то, что надо =)?
Ну вот пришлите вы мне данные, я запишу и?

Дешево сердито и если надо, это все же m-disc
Можно записать у одних и считать у других. Вместо других можно использовать первых же, принеся им кассету и пустой диск, пусть восстанавливают.
M-DISC вещь хорошая, но менее ёмкая, и у меня есть сомнения в его долговечности.
про сам M-DISC не могу сказать, скажу только лет через 20 =) Но вот диски CD с золотым напылением, лежат 25 лет и читаются.

По поводу стримеров, все равно мало кто это будет делать, а коммерческая деятельность сомнительная в виду того, что все хранят в облаках, да и 80 процентов людей не думают о копиях.
Но вот диски CD с золотым напылением, лежат 25 лет и читаются


Не так давно вытащил и пачки гаражного хранения (обычный стальной гараж на стоянке, без отопления) несколько записанных в 2003 году дисков.
Все прочитались нормально.
Из пяти старых хардов на 20 Гб (WD200EB и WD205BA), хранившихся в тепле дома с того же самого 2003 года — рабочими оказались только два.
Fujitsu MPB3021AT из того же гаража с тем же сроком хранения — оказался рабочим.

Похоже, что слухи о ненадежности оптических дисков немного преувеличены.

им свет (уф?) вреден, у меня записанные болванки на подоконнике лежали — за полгода пришли в негодность

им свет (уф?) вреден


У меня как-то на лоджии солнце выжгло лежавший там линолеум, оставив на нем тени как после атомного взрыва.
Причем максимум за пару лет. А забытый в укромном уголке пластиковый пакет рассыпался при прикосновении почти что в пыль (выметать было крайне сложно).
(Пришлось положить плитку и запомнить, что ультрафиолет и проч диапазоны света — страшная сила :)
это биоразлагаемый пакет попался, похоже, у них это как раз ожидаемое поведение.
это биоразлагаемый пакет попался, похоже, у них это как раз ожидаемое поведение.


Обычный пакет из дешевого магазина. Сомнительно, что бы в этой сети заморачивались биоразлагаемыми пакетами.
А вот южная сторона и окна без штор и занавесок…
а что за сеть-то? магазин может и не заморачиваться, а производитель пакетов — вполне.
а что за сеть-то?


«Сильпо» :)
Две упаковки по 100 штук CD болванок Verbatim долго стояли на подоконнике окна, выходящего на несолнечную сторону. Ближняя к окну коробка — все диски стали полупрозрачными, с некоторых защитный и чувствительный слои частично отслоились. В дальней коробке 2/3 дисков выжило, но в среднем писались хуже неэкспонировавшихся.

p.s. Архив в вертикально стоящих в шкафу сумках в кондиционируемом помещении за 15 лет пока читабелен.
От качества. Самые дешевые старые в нормальном хранении, стал отходить слой. Те без солнца. Солнце конечно им сильно противопоказанно, но сам факт деградации слоя со временем есть и зависит уже от качество самой болванки. Поэтому есть болванки с долгим хранением и теперь можно официально сказать, что это действительно так.
Самые дешевые старые в нормальном хранении, стал отходить слой


Самые дешевые в нашем регионе были болванки Sky.
Они начали дохнуть почти сразу (несколько месяцев) и через пару лет архивов с ними не осталось, так как я не мог так рисковать :)
А практически все остальное, разных производителей, живо до сих пор.
По факту они оказались самым надежным вариантом хранения информации, сразу после книг (арвидовские ленты не на чем читать, харды дохнут, флешки многие живы, но малый объем не давал делать на них архивы, дискеты изначально были непригодны для длительного хранения (но, тем не менее — некоторые 3,5" с драйверами все еще читаются через USB FDD), дискеты Zip были редки и тогда, когда были актуальны).

Проверил, пока писал — CD-RW тоже живы, по крайней мере те, что у меня под рукой.
>>> самым надежным вариантом хранения информации, сразу после книг

у меня еще магнитооптика жива вполне.
3.5 как и 5.25 у меня читаются, но по ним статистику и там все знаем До текущего времени выжили стойкие Да и чтение зависит сильно от привода. После 97 и совсем после 2006 приводы стали делать так себе. usb-fdd к ним относится. + с vista изменился драйвер работы с floppy. Он конечно и в XP изменился, но не так кардинально. Да говорю так, так как ретро системы дома.

Тогда ваш бэкап будет зависеть от наличия такого сервиса в разумной досягаемости, т.е. от устойчивости чужой бизнес-модели. Не супер.


В принципе все облачные бэкапы от таковой же зависят, но между ними данные перелить, если кто-то вдруг разорится, заметно проще.

Я пока видел только сервис по аренде лент в защищенном хранилище.
Мы даже в всерьез подсчитывали, что лучше)
И в 2021 году плёнки остаются самым дешёвым накопителем со стоимостью хранения примерно в 6 раз ниже, чем на HDD.

Чушь какая-то. Типа Google все данные хранит на плёнках. А специальный пленочник постоянно следит за тем, что бы пленки не размагничивались и перезаписывает их? Так чтоли?
А специальный пленочник постоянно следит за тем, что бы пленки не размагничивались и перезаписывает их?
так гугл не хранит данные на аудиокасетах
Удивительно, что столько лет развития технологий, пленка все равно остается довольно таки дорогим удовольствием
Сама плёнка дешёвая, писалки-читалки дорогие.
Не такая уж она и дешевая $85 за lto-8 12Gb, та же цена у самого дешевого тошиба 3tb hdd
т.е. всего в 3 раза дешевле

Ридер lto-8 же гуляет по цене от 3000$, без роборуки само собой.
т.е. чтобы это начало становиться дешевле, размер хранилища должен быть больше 168тб
lto-8 12Gb

lto-8 12TB
т.е. всего в 3 раза дешевле

12/3=4

да мой косяк, но итоговые вычисления верные, из-за дорогого ридера минимальный размер хранилища для которого в принципе имеет смысл использовать стример начинается с полутора сотен терабайт

Безуспешно жду коммерциализации терабайтовых оптических накопителей, о которых говорили еще 10 лет назад а 15 лет наза говорили про 100Gb блюреи
еще 10 лет назад


Новость из 2018 г:
"Исследователи из австралийского университета RMIT и Вуханьского технологического института, Китай, разработали радикально новый тип высокопроизводительных оптических дисков большой емкости. Один новый диск способен сохранить до 10 ТБ (терабайт) данных и обеспечить сохранность этих данных на протяжении более шести сотен лет. Показатели нового оптического диска в четыре раза превышают информационную емкость существующих технологий и в 300 раз — по продолжительности хранения информации.

Основой технологии нано-оптической записи и хранения данных является новый тип гибридной стеклянной матрицы, а не полимерной, которые используются в нынешних оптических дисках. Эта матрица производится при помощи самых новейших технологий, позволяющих получать стекло и керамику более высокой чистоты и качества, нежели любые другие технологии. Специальное стекло — это очень стойкий материал, который может выдержать без разрушений и нарушений его структуры порядка тысячи лет, а объединение этого стекла с определенным материалом органической природы позволило радикально увеличить емкость оптического диска, снизив время хранения информации до 600 лет."

Если цена приводов и дисков будет приемлемой, на уровне BD — вопрос о лентах в быту отпадет еще на некоторое время.

Нашел решение от сони еще с 2012г

у них компакт диски в кертридже до 1.5Тб были, можно купить но по неадекватным ценам (90$ или у нас от 12т.р.) сам ридер вообще стоит кошмарных денег $6500

Где обещанные в статье 1$ за терабайт?
Хочется воскликнуть — заговор, людям (массам) не дают инструменты для хранения данных чтобы они топали в облачные хранилища, никакого контроля, только хардкор и насилие (клиенты становятся заложниками через данные)
ценник как ценник… если посмотреть на новость, то за стандартом стоят одни телевизионщики, а у них такой порядок цен — нормален, я б даже сказал дешево.
8 тб обычного домашнего саташника — 15к.
12тб — уже от 24к

HPE lto8 12/30 Тб — 9,6к
т.е. чтобы это начало становиться дешевле, размер хранилища должен быть больше 168тб
Ну, если вы будете каждый раз вынимать жесткий и втыкать новый (для записи 12 ТБ вам потребуется это 4 раза ручками сделать и потом осторожно отнести диски к месту хранения) — то я с вами соглашусь. Правда, я б тогда надежность хранения делил бы на 5.

А если начнём считать, как эти 3 тб без дерганья подключить, то библиотека на 56 мест под жесткие 3 тб сколько вам встанет?
Производители современных картриджей типа LTO обычно гарантируют сохранность информации от 15 до 30 лет.

Если постоянно считывать, то слой быстро размагничивается (хотя возможно головка как-то подмагничивает пленку), плюс на пленке остаются механические повреждения. Кроме того, если постоянно перезаписывать ленту, то срок службы станет еще меньше.

Короче карандаш рулит до сих пор
image
К своему удивлению я столкнулся с тем, что трудно найти современный карандаш, которым можно перематывать кассеты. Диаметр оболочки современного карандаша уменьшился и теперь нет надежного сцепления с зубцами сердечника.
Просто кассеты нужно заказывать новые, у тех же поставщиков.
Жаль не развивают технологию лазерной записи на ленту (типа блю.рей).
Этож какая по площади рабочая поверхность бы была.
Вполне же можно ленту на небольшом участке на валу с большим радиусом ровно положить, чтобы на ней сто то прожечь лазером.
А в целом, единственный способ надежного вечного хранения, не зависящего от технологий в каждый момент периода времени — это распределенное по всем компам мира хранилище.
Должно быть по 10-20 копий частей по всему миру и поддерживать всегда это число, если один сдох комп или апгрейднулся, то писать часть на другой чтобы опять было 20 по миру. И так все время.
Пустое место всегда есть у всех почти. Начислять какие то криптовалютные баллы хранителям.
Причем такое хранение не требует гарантии хранения каждым. Главное что ты часть времени хранишь возможный для тебя объем информации.
Сломалось — ничего страшного, кто то где то возьмет 20-ю часть на себя (скопируется от кого то кому то). Нужно просто продумать алгоритм шифрования и проверки наличия и целостности.
Уже идут работы по таким распределенным файловым хранилищам.
Вот у меня почти всегда в среднем пол диска пустые. Я бы с удовольствием хранил каки то части зашифрованные архивов других за небольшую плату и/или что мои тоже будут где то важные данные в 20 копиях лежать. Уверен взаимоаренда фалового пространства — самый дешовый, надежный и рентабельный способ сохранить информацию в мире.
Крупные компании так же могли бы арендовать файловое пространство в нужных объемах по всем миру. Делать всё автоматически. Любая информация либо закрытая — зашифрованная, делится на блоки оптимального объема и сохраняется в 20-30 (ну посчитать надежность) копиях по всему миру. Открытая же информация вообще не шифруется, и еще можно отслеживать чтобы не было миллиона копий одинаковых, а оставлять по 20-30 копий по всему миру.
Самую важную мировую информацию — научную, историческую, сделать в 100-200 копиях можно и больше по желанию волонтеров готовых хранить часть архива.
Такое хранение хорошо еще тем, что не требует вообще опыта или временных трат, аккуратности и супероборудования надежного.
Да хоть флэшку предоставь. Главный показатель это объем и время хранения и никакой трагедии если сломается или сгорит, ты просто идешь покупаешь новый винт или компьютер и опять подключаешься к системе, тебе опять скинут какой то объем хоть того же, хоть другого, хоть вообще непонятно чего в зашифрованных частях архивов.
Единственно важный показатель — это количество копий одномоментно в разных местах, чтобы он зеркалировался и не опускался ниже какого то критического значения. Если такое происходит — то таким данным приоритет по зеркалированию в первую очередь. Но вряд ли сразу по всему миру 20-30 копий сломаются.
Т е коэффициент для взаимовыручки примерно 1 к 20. Хочешь надежно хранить 1 Гб своей информации вечно — предоставь 20-30 Гб для хранения других. Этот коэффициент можно самостоятельно поднять или опустить от оптимально статистического.
Вот у меня реально где то 10 Гб ну суперважной так скажем информации.
Я готов всегда предоставлять 200 гб для других, чтобы знать что всегда есть 20 копий моей важной информации по всему миру. И даже если пару континентов уйдет под воду, то где то 5-6 копий останется.
Для человечества это единственная возможность хранить данные вечно, не оглядываясь на то какие технологии в какой момент времени есть, и можно ли будет прочитать что то через 100 лет. Это просто непрерывное копирование данных в будущее на том оборудовании которое есть на данный момент.
вы 'изобрели' siacoin
siacoin — это почти стандартное облачное хранилище, только защифрованное и привязанное к блокчейну. Там договора, контракты и штрафы (жесткие условия и обязательства) «если они хранят файл в течение всего срока действия договора». Тут же мы обсуждаем в целом возможность вечного хранения данных (как к этому приблизиться).
Обязательство держать постоянно включенным компьютер и поддерживать его надежность — это опять в сторону профи. Это оттолкнет большинство простых пользователей.
Я же предложил систему, где пользователь в принципе не несет ответственности и обязательств, просто если он более серьезный и внимательно к этому относится (вкладывает усилия), то может получать доход, и даже если просто 8 часов в сутки его комп доступен — то тоже норм. Но и нет проблемы если комп сломался. Нет привязки что ты именно хранишь именно чьи то конкретные файлы по контракту с обязательствами и штрафами.
Идея в том, что децентрализованный алгоритм сам просчитывает, где и сколько копий частей архива хранить чтобы соблюдать максимальную избыточность. Пользователь установивший специальный файловый менеджер, вообще не замечает что у него на компе уменьшается место.
Т е все свободное пространство ему так же доступно, но в момент пока он им не пользуется, там лежат копии частей архивов. Если он что то хочет заполнить в «пустоту» то можно настроить либо с предупреждением что место уменьшится под архивы (а соответственно и его архивы у других бесплатно), либо вообще автоматом это делать.
Т е нет конкретного обязательства хранить файл Х столько то лет с доступом 24/7.
Общий алгоритм сам решит чем заполнить пустое пространство всех компов участников с условиями избыточности, приоритетности (меток надежности и важности информации). Какие то архивы будут дублироваться 10 раз по миру, какие то 1000 раз (в целом от наличия общего свободного пространства). Смысл такой, что все свободное пространство на всех компах мира всегда забито по полной — есть место — значит поднимаем надежность и делаем все на N+5 копий больше по миру. Данные с пометкой особой важности и доступности N+100 копий.
В спец файловом менеджере каждый видит сколько копий его архивов есть по миру, сколько онлайн, сколько в периодической доступности.
Параметры и приоритет данных можно выставлять, от этого будет зависеть цена размещения и/или необходимый объем предоставленного места и времени доступа для других.
Основная идея в том, что если ты способен другим предоставить те же условия что хочешь для своих файлов, то это будет бесплатно до тез пор пока ты предоставляешь, если ты способен больше даже (лучше) условия другим предоставить, чем требуешь для своих архивов — то зарабатываешь. Если хуже то платишь (и то только в тот момент когда один их вариантов). Можно и платить и зарабатывать позже. (зарабатывать время хранения своих на будущее можно).
Цену ввести не в деньгах не в крипте, а именно в комбинированном показателе (объем/время доступности/скорость доступности).
Уверен можно собрать статистику по миру, сколько постоянно свободного дискового пространства есть по миру. Думаю эта цифра сильно не колеблется, а в целом растет. Уверен, что на такой статистике можно рассчитать алгоритм полного постоянного заполнения всего свободного дискового пространства мира максимальным числом копий всего посланого на хранение по приоритету и ценности. Тем более это даже не повысит сильно затраты на энергию для хранения — диски всё равно крутятся. Трафик мировой конечно станет в разы больше. Но мы говорим о супернадежном хранении. Да можно оставить и гарантированных поставщиков дискового пространства в такой сети с обязательствами.
Поверьте, штрафы там мизерные и нестабильный онлайн не приведет к серьезным последствиям.

Без ответственности упадет гарантия хранения и предоставления данных, единственная причина что люди будут оставаться 'на раздаче' — это кнут и пряник, а не только пряник.

Другой разговор что алгоритм определения стоимости хранения (выбора какие ноды использовать) там странный и спасибо там предложена возможность указать в виде фильтра интересные в определенный момент ноды.

Криптовалюта это и есть ваше число на основе формулы, ключевое слово в криптовалюте — это возможность обслуживать подобные формулы децентрализованно, без центра.

siacoin по мне так подходит по всем параметрам, вся работа в тюнинге параметров, к примеру возможность самому определять не только выбор нод но и уровень резервирования (это технически реально просто в интерфейсе нет)

p.s. команда в siacoin плохая, умудрились соскамиться на почти пустом месте, но технически проект хорош
Как это нет кнута… основной кнут — хочешь чтобы твой резерв хранился — предоставь минимум столько же еще места свободного и у себя под чужие резервы (тех кто хранит твой), и доступность по времени (объем времени). Хочешь более надежное хранение своего (с гарантией) 20-30 копий по миру — предоставь 20 -30 объемов свободного места от своего архива.
Это будет очень хорошо мотивировать накапливать [объемо/часо/скорости] может и наперед, (на тем моменты когда не сможешь быть онлайн или на случай поломки и простоя). Вся статистика была бы доступна и предупреждения. Это бесплатный минимум.
Ну а за деньги всё проще, плати комиссии на аукционе.
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Информация

Дата основания
Местоположение
Россия
Сайт
vdsina.ru
Численность
11–30 человек
Дата регистрации
Представитель
Mikhail

Блог на Хабре