Как стать автором
Обновить

Комментарии 24

Покупайте наших слонов! Ждём сравнений через поколения :-)
Все в процессе, работа только начинается)
Там такая боль, что каждый, кто рассказывает что-то хорошее про современные блочные устройства, полки и т.д., однозначно выглядит не как человек, который эту боль знает.

Виснущие enclosures, бешенные прошивки, которые залипают на неожиданных местах, hba, которые тихо ненавидят человечество и гадят по-тихому, ядра, которые способны удалить блочное устройство, оставив программу в дедлоке на отсутствующий диск и сделать новый диск с той же буквой, рейды, которые промахиваются с тримом, файловые системы, херяющие всё, кроме своих метаданных.

На выходе одно: ненависть и боль.
Я думаю Вас заинтересует статья, которая готовится продолжительное время о создание хостинга на Blade c7000, схд, лезвиях и т.д Там будет много интересного, об успехах, проблемах и их решениях.
Да нет там никаких решений, пока enclosure используется. По архитектуре нет. Лучшее, на что могут вендоры надеяться, что их суперсетифицированная прошивка диска сдохнет культурно, а не повесит энкложу целиком. Но это надежда на то, что свинья когда дохнет, не обосрётся. Одна не обосрётся, а второй поплохеет.

Вся существующая sas-топология безнадёжно сломана и рассчитана на кооперативную добросовестность участников. Один засранец — и весь сегмент накрывается женским репродуктивным органом. И никакой multipath не спасёт, потому что засранец по обоим путям и оба накрывает.
Нет желания выплеснуть боль и ненависть на страницы хабра в отдельной статье? У вас-то опыт ого-го, было бы очень интересно почитать.
Есть. К сожалению, там всё очень закрыто. А для статьи-расследования нужны очень конкретные доказательства с конкретными ссылками.
Здравствуйте. Вот, как-то так и есть. Всё очень закрыто и даже опытные пользователи не могут ответить исчерпывающе на вопрос, а, что же такое собственно «валидированный диск». Нужны конкретные доказательства, а собрать их и системно изложить никто пока не смог. Что ж попробуем собрать доказательную базу.
Кстати, есть ещё не удобная для HP (и других) тема, когда под одним партномером скрываются диски разных производителей, т.е. могут быть явные отличия в прошивке, в конструкции и, соотв., в характеристиках. А массивы (рейды) желательно собирать из абсолютно одинаковых дисков, в идеале с одной версией прошивки.
По-моему проблема несколько преувеличена.
Вой поднимают хостеры изобретающие СХД, а в корпорациях стандартные решения работают вполне сносно.
Энтерпрайз обычно заметает всё под ковёр.

Вот из чужого, про IBM: oldmann.livejournal.com/244187.html

Из того, что я видел. У очень уважаемой конторы, занимающейся финансами, было требование иметь tcp на syslog и не про… ть ни одной записи в лог, пусть и ценой остановки основного софта. Писать решили на Нетапп (средней руки). Там же была лаба на vmware'ях. Юзали дедупликацию во всю. 1:200 или выше. И лабу решили почистить. И удалил виртуалки. Всё хорошо, только Нетапп после сделал зю и честно ушёл в таймаут на десять минут потроша потрошки вафла на тему «потереть все ссылки в удаляемых дедуплицированных». Всё хорошо, кроме обвалившейся после 10-минутного таймаута на логах софтинки.

Видел и HP'шные lefthand'ы, которые после неловкого телодвижения превратились в HP'шные же сервера, а где данные при этом отвечать отказывались.

Там тоже боль и ад, только молчаливый.
Подумал, что вы опять про свой скрипт кладущий полки по SAS.
Баги бывают везде, но следование рекомендациям и знание особенностей позволяет минимизировать простой. По ссылке этого не сделали и продолбали массив, с NetApp возможно не стоило мешать business critical приложение с лабами и т.д.
Разумеется. Но тут начинается махровый девопс, который плавно перерастает в in-house dev. (по ссылке про IBM, про нетапп — это я рассказывал).

В хороших решениях нет нужды в специальных лабораториях и гуру, знающих KB наизусть.

А показывал я, что боль у энтерпрайза такая же, только они молчат в тряпочку.
1. По-поводу переплаты. Покупатель не переплачивает за наклейку, как это стараются представить авторы. Вендоры зарабатывают не на платформах, а на опциях и сервисе, т.е. смотреть надо на изделие в целом. Лишите вендора возможности маржеваться на опциях — взлетят цены на головы. Так и так платить будет покупатель. Если хорошо подумать, такая ситуация даже выгодна конечным пользователям, т.к. позволяет не платить за мощности, которые не нужны сейчас, а наращивать их по мере необходимости.
2. По-поводу сервиса. Установка неродных компонентов это потенциальные проблемы с сервисом. Даже если гарантию осуществляет производитель HDD, это лишает конечного пользователя единой точки входа на изделие в целом. Где кончаются обязанности производителя сервера и начинаются обязанности производителя HDD? Решать этот интересный вопрос будет конечник. Надо ли напоминать, что все это в условиях когда час простоя mission critical оборудования это час простоя бизнеса.
3. По-поводу «прошивок». Скажу даже, что их часто вообще нет, если оборудование начального и среднего уровня. А вот что есть, это протестированный производителем компонент. Хотите поработать тестером на примере своего бизнеса? Ваше право
По-поводу переплаты: как ни крути, а всё-таки переплачивает. Мы тут не спорим с политикой вендеров, а рассматриваем реальный способ экономии.
К примеру, HP 1TB 6G SAS 7.2K (605835-B21, 606020-001) средняя цена порядка 25-30 тысяч рублей.
А средняя цена такого же диска: Seagate ST91000640SS 1TB 6G SAS 7.2K — 15 000 рублей (с салазкой -16 000 рублей)
Разница очевидна, особенно если требуется, к примеру 8 дисков.
Для кого-то 80 000 рублей — не деньги, а для малого бизнеса, очень даже приличная сумма. Можно купить даже еще один сервер (или два).
К тому же для каждого диска HP можно найти соответствующий ему диск от Seagate (или другого производителя) — модель диска никто не скрывает.
Тема поднята хорошая, но например NetApp(не удивлюсь что HP делает то же самое) диски предварительно гоняет по 100 часов на стенде, а диск купленый на обычном рынке такого сервиса не имеет. Правда тут появляется вопрос стоимости этих 100 часов. :)
Тут радует одно, в любом случае имеется гарантия на диски.
Главное, чтобы эти 100 часов не сыграли свою роль в последние дни гарантийного срока)
Тут смысл в том, что большая часть отказов HDD происходит в первые 100 часов работы. :)
Ну купи диск, да сам погоняй его 100 часов, хоть двести. Ни кто же не просит сразу в продакшен его пихать?
Можно посмотреть на поддержку диска, и заметить, что HP периодически выпускает новые прошивки, исправляя прелюбопытные баги. А что же делает Seagate, Hitachi? Тихо глючат дальше.
На примере Seagate:

Ищем серийный номер жесткого диска на этикетке и открываем главную страницу сайта Seagate. Далее заходим на «База знаний» и нажимаем строку «Нажмите здесь, чтобы воспользоваться программой проверки серийного номера». Вбиваем номер серийника в соответствующем поле утилиты проверки и как не странно Captcha для подтверждения.

В итоге достаточно взглянуть на строки Result и Action. Фраза Drive is not affected означает, что жесткий диск не нуждается в перепрошивки, а фраза Proceed with Step 4 подразумевает необходимость обновления.
Проверим, есть на примете пачка Хитачи в P2000.
ЕМНИП это только для пары общеизвестных багов.
HP сами ничего не выпускают, это делают производители дисков. Но прошивки не выкладывают в свободный доступ, а распространяются через OEM-партнёров или по запросам в поддержку (так было у HGST).
Почему сразу не купить сервер от местных сборщиков или конструктор на Intel/SMC?
Брендовое железо берут ради сервиса и сертификации, а левая комплектуха всего этого лишает.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий