Как стать автором
Обновить

Комментарии 39

Не успел даже свеженалитый кофе отхлебнуть, как-то внезапно оборвалась статья )
А что дальше рассказывать? Обещал про обычный рабочий день — вот. Про выезды чуть позже ещё расскажу, у нас за последние пару лет новых балалаек накопилось.
Дык байки должны после такого предисловия идти. Или одна, но большая и с моралью.
Замена почти как делле, радует что и российские компании могут предоставить такой качественный суппорт.
Так Dell как раз на этом же складе лежит, и ещё на одном за городом. Коллеги потом подробнее расскажут.
Мне интересно, за что нынче может отвечать сервер на базе Pentium I — сервер-печати? Или, быть может, «продвинутый» роутер?
Пингует ченить, наверное
за какой-нибудь станок или производственную линию на экзотическом софте, установленным экзотической и уже не существующей компанией.

У нас например была WMS система склада на древнем компе, написанная индусами, но удачно работающая на протяжении 6 лет. Благо склад не увеличивался в размерах, то её было более чем достаточно. А внедрение новой системы — несколько десятков миллионов. Так как нужно менять оборудование серверов, кпк и сканеры штрихкодов, обучать персонал. Плюс простой на пуско-наладке. Бизнесу это не нужно, ради новой версии софта. Бизнес хочет прибыль и часто готов мириться с мелкими недочётами.
Ко мне приятель-админ однажды обратился с вопросом — нет ли у меня итальянской Windows 98 (год на дворе стоял этак 2010).
Оказалось, что ему довелось поднимать машину, обслуживающую какой-то итальянский суперпупершиномонтажный комплекс. На обычной винде оно не завелось. Никакие пакеты локализации тоже ситуацию не спасали.

Благо, под рукой оказался старый MSDN, в котором был полный набор всего и вся, включая все локализации всех версий винды. Сделал образ диска, отправил приятелю — завелось.
Два самых частых варианта:
1. Router/firewall на freebsd, напимер, заказчика смысла новую железку покупать не видит.
2. Проприетарный софт — исходников уже нет, только образ машины. Поэтому дешевле сапортить старый пень, чем платить за разработку софта заново.
наверное за то же самое, за что отвечал 10 лет назад, когда он был самым дорогим =)

Например, за обсчёт какой-нибудь задачи, которая не менялась это время. Станок там какой?
Ребятушки, что ж вы так, про музей сказали, а экспонатов не показали.
Ничего вы не понимаете, вызвали человека в процессе фотографирования, поехал в сибирь сервер менять.
Вот, например, что можно найти на складе, но это уже не оборудование резерва. Рабочий.

Интересен другой вопрос. Как комплектуется склад запасных частей. Допустим вы установили 10/100 специфических хранилищ с требованием по замене сутки, сколько будет у вас в резерве? Как просчитывается вероятность одновременного выхода из строя?
Учитывается ли к примеру расположение в одном ДЦ, или регионо (пожар, наводнение). Ну и прочие нюансы такой математики.
Склад запчастей у нас действует более 15 лет. Мы представляем в России многих крупных производителей (например, Dell, HP, EMC, Cisco и пр.), поэтому за это время накоплена большая и довольно точная статистика по выходу из строя различных компонентов. Исходя из нее под конкретные сервисные проекты формируется склад.

Поддерживаем полный резерв. Любая запчасть должна быть всегда на складе. При формировании склада покупаем как запчасти, так и оборудование в сборе. Те, которые чаще всего выходят из строя — как правило это элементы с подвижными частями – жесткие диски, вентиляторы, БП, либо же аккумуляторы, у которых ограниченный срок службы — их кладем с запасом, опять же исходя из количества и статистики.

Исходим из того, что мы не заменяем оборудование, а именно восстанавливаем (меняем запчасти). Поэтому пожар, наводнение в расчетах не учитывается. Да и не было на практике таких масштабных событий. Максимум – подтопление. Но иногда действительно бывают случаи, когда целиком меняется сервер.
Не могли бы вы опубликовать статистику по выходу из строя железа?
Многим будет интересно.
Подозреваю, многие за такие данные готовы были бы отвалить немало денег.
Под склад выделен отдельный кладовщик(и) или по старинке — добавили в нагрузку какому-нибудь админу?
сервер на Pentium I под горячую замену.

Именно под «горячую»? Он у вас включенный стоит с софтом?
А если нет — то это не «горячая», а «холодная» замена.

И, кстати, давно ли вы его включали? Всякие бывают сюрпризы со старой техникой.
Горячая замена – это когда в работающем сервере заменяют компоненты на лету, без выключения. Как минимум – это блоки питания, ещё такой фокус можно проделывать с жесткими дисками, адаптерами, но это уже зависит от конкретной модели сервера. В данном случае этот экземпляр рассматривается только как донор таких запчастей.
«Горячая замена», это когда сервер стоит в запущенном состоянии, с запущенным же софтом, и в случае отказа другого сервера, этот авто- или полуавтомаически вводится в работу нмедленно. Соьственно в этом смысл слова «горячий» (в противоположность«холодный»). А у вас это просто донор запчастей. О чем я и говорил выше.
Когда сервер стоит в запущенном состоянии это «hot standby», а не «hot swap».
Это обычно называют не «горячая замена», а «горячий резерв».
А что будет поставлено в резерв, если задействуют этот резервный монитор (и штатный сломается и не поддастся ремонту)? Найдут что-то современное с таким же разъёмом (как при этом будет тестироваться совместимость с видеорежимами?) или будет меняться принцип резервирования обслуживаемой системы?
Мы попробуем произвести замену вышедшей из строя запчасти, используя складской экземпляр в качестве донора. Не получится — будем искать функциональный аналог.
Например, SQL-щик любит выпить, а кто-то ходит в майке с Симпсонами в минус тридцать, потому что его жена бросила.

Утащил в цитатник.
В любом случае оба таких персонажа могут подвести контору в самый нужный момент, особенно тот, что по синьке. Самое хреновое, что в случае сбоя кому-то придётся ехать в берлогу к этому чуду и грузить это почти бездыханное туловище в свою же повозку для доставки в офис, а после приводить в сознание. Был опыт с такими кадрами — они всю команду/отдел, тянут на дно. Хотя по молодости, было весьма прикольно наблюдать за тем, как такие синяки посылают в лицо при всех CTO, CEO. (был случай: бухой сисоп с похмелюги цапается с утра с Начальником ЦУСа, заходит CEO на шум, при этом ест яблоко. Сисоп поворачивается к CEO и при всех — «А ты давай жуй своё яблоко и иди отсюда». СЕО аж поперхнулся и ничего не смог сказать). Поэтому либо ты просишь этих людей измениться (завязать пить от слова совсем, просить пить только по выходным не прокатывает) либо ищешь им замену.
Не совсем понял про такие жесткие временные рамки-разве крупные системы не создаются с избыточностью, чтобы обеспечивать отказоустойчивость?
Создаются. Но на время поломки они остаются без этой избыточности. А парные аварии – хоть и малая, но вероятность. Для нас же главное, что SLA есть SLA. Задокументировано 4 часа на исправление, значит, надо уложиться.
Как человек, изучавший матстат, теорвер и теор.надежности, верил в крайне низкую вероятность парной аварии… до тех пор, пока 2 независимых сервера не вышли из строя с интервалом 15минут. Мда, но вопрос такой: а как получается укладываться в 4 часа, когда, по слухам, в Москве пробки бывают дольше. А вам же еще на склад, да погрузить, доехать, разгрузить, завести. На вертолете? =) Или просто тогда не укладываетесь в SLA?
Конкретно в Москве метро часто оказывается быстрее автомобиля. Склад у нас — это комната рядом с дежурной сменой, а запчасть — не стойка, если точно понятно, что везти (а из мониторинга много чего понятно), то получается довольно быстро. Комбинация метро и хорошей службы такси часто выручает.
О, я дома кладовку так же организую.
SELECT box_number, block_number FROM storage WHERE item_name LIKE "%банка сгущенки%"
Нобелевскую премию и большую женщину тому, кто придумает полнотекстовый поиск по вещам в реальном мире.
Главное не сказал: статья пронизана изобретательским подходом к людям, а не чисто формальным, как иногда хочется. И именно в дипломатии кроется успех.
А какие есть перспективы уменьшения времени на исправление по SLA? Ну там, например, доставка запчастей реактивными дронами или системы дистанционного телеприсутствия с манипулятором?
Есть два варианта: реалистичный и фантастический. Соответственно, телепортация и регулярный утренний 5-километровый кросс с полной выкладкой.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий