Pull to refresh

Comments 28

UFO just landed and posted this here

Хм, не знал, что удаленно можно менять блоки питания, диски, планки памяти. А также устанавливать новые стойки, укладывать кабель…

а что, работа инженера цод более чем на 70% состоит в заменах комплектующих? что тогда за сервера в этом цод?
Если даже на 1% или на 0.00001% она состоит из замены комплектующих, то это значит, что инженер не может работать удалённо, ведь нельзя оставить на площадке только 1% инженера.
UFO just landed and posted this here
60% не на удалёнке, но они же не круглосуточно на рабочих местах, а 8 из 24 часов, т.е. 20% на местах.
Если без удалёнки было достаточно трёх человек, чтобы один был всегда на месте, то с удалёнкой третья смена — без персонала на месте. А ещё есть инженерные системы — кондиционирование, отопление, водопровод, ДГУ — их теперь будет обслуживать половина землекопа.
А как было раньше, когда инженер третьей смены уходил в отпуск?
Я не инженер обеспечения, но и у нас 24/5 с возможностью 24/6.
Когда кто-то уходит в отпуск, или помогает человек с соседней линии (но это возможно не всегда), или смены по 12 часов (что никому не нравится и увеличивает количество ошибок).
И тут надо отметить, что зарплату надо платить всем и в полном объёме, что добавляет головняка.
Весело, конечно.

Но выбывание на удаленку не выводит человека полностью из игры.

что никому не нравится и увеличивает количество ошибок

Ну и отдельно умиляет резервирование сотрудников под 0%, учитывая российские зарплаты относительно стоимости оборудования — одна лишняя ошибка может привести к потерям, равным годовой зарплате резервного сотрудника. Если в этих ЦОДах также, то там явно проблема не в «карантинных мерах» и «удаленке».

Ясно могут, но что теперь 20% пойдут в отпуск когда работы стало больше.

Я бы читал это иначе. У них все настолько хорошо, что они не держат лишний персонал, и все, кто работает в ДЦ, нужны именно там, а не дома на диване.

Ходили слухи о проблемах в октябре сразу у многих облачных провайдеров — netrack, croc, selectel и других.
Но при этом у Amazon всё стабильно в порядке, с начала пандемии.
Всё-таки дело не только и не столько в переводе инженеров на удалёнку.


P.S. Нагрузка на сеть везде есть, весной были проблемы с каналом из России в Европу, сейчас есть проблемы со скоростью серверов в США из арабских стран. Но справляются все по-разному.

Амазон сделал их essential и все инженеры как ходили так и ходят на работу.
По идее, у них должно быть двойное резервирование по инженерам.
Ну и в то, что 70% инженеров занимается заменой запчастей верится с трудом. Особенно учитывая, что новые проекты в нынешних условиях находятся практически в заморозке. А значит, рабочее время инженеров наоборот высвободилось. Да и вообще, вы хоть раз заходили в какой-нибудь ЦОД, а там одновременно работает 70%+ всех инженеров? Только при пуско-наладке самого ЦОДа, наверное, такое можно наблюдать, и при глобальном сбое. Хотя, во втором случае, это будет вряд ли возможно, потому что пока подтянутся все резервные инженера, первые ликвидаторы пойдут спать.

Скорее всего, как обычно, если директор не видит кто сегодня опоздал и кто постоянно делает перекуры, то, выходит никто и не работает, только зарплату получают.
Ну и всякие офисные слизни, типа аджайл-коучей, подозревают, что при таком раскладе их ненужность может стать более очевидна, а потому нашептывают руководству подобные статьи для Коммерсанта.
Грубо говоря, чтобы на площадке круглосуточно находилось 2 человека, нужно около 10 людей, работающих посменно. Кроме того, если человек не занят заменой запчастей, то это не значит, что он может сидеть дома, т.к. что делать, если всё-таки произойдёт авария, требующая замены? Вот и получается, что есть десятки людей, которых на удалёнку нельзя перевести, хотя в ЦОДе одновременно находится лишь малая часть.
А как происходит замена запчастей?

По мне, так 80% времени уходит на пред- и постустановочные процедуры. Просто тот, кто находится в ЦОДе перестанет их выполнять.
Грубо говоря, заменить сгоревшую PCI карту можно менее чем за полчаса, но сколько уйдет времени на то, чтобы мигрировать сервисы и вернуть их обратно?
Тот же сгоревший БП поменять можно за минуту. А на обновление статуса уходит до пяти (если у вас не какая-то дичайшая система мониторинга).

Понятно, что в каких-то ЦОДах практиковалось «это оборудование числится за вашей командой, сами меняйте», но это ж не прямо такая трагедия, что приведет к «проблемам и сбоям в IT-инфраструктуре многих компаний». Ну поменяет СХДшник сетевой модуль в Циске, ну не катастрофа же.
Я не понимаю этих рассуждений по времени. Если хоть какая-то работа должна выполняться на месте, то человека, её выполняющего нельзя оформить как удалённо работающего, даже если его присутствие требуется 1 секунду в год.

И к слову, производители некоторого оборудования требуют, чтобы любые работы производил сертифицированный специалист, иначе вендор прекращает поддержку. Поэтому не всегда возможно, чтобы цискарь поменял модуль в СХД. Ну и естественно, есть какое-нибудь оборудование электропитания, к которому неспециалисты даже близко подходить не будут, и т.п.
Ну ясно, если вы забыли телефон дома, то вы не сможете позвонить дяде Васе, даже если дома кто-то есть, ведь если контакт-лист не в онлайне, то, очевидно, требуется ваше физическое присутствие дома, чтобы посмотреть номер контакта.

Ну ок, зайдем по-другому. Если я приду в каждый из этих ЦОДов и скажу, что хочу арендовать оборудование на 10 стоек, но хочу выбрать самый надежный ЦОД. И, после того как директор мне распишет как у них все супер отказо- и даже катастрофоустойчиво, я спрошу: «А как увеличатся риски, если половина команды, которая будет отвечать за мои стойки, просто уволится?».

Как думаете, в скольких случаях я не получу ответ «никак»?
Ну ок, зайдем по-другому. Если я приду в каждый из этих ЦОДов и скажу, что хочу арендовать оборудование на 10 стоек, но хочу выбрать самый надежный ЦОД. И, после того как директор мне распишет как у них все супер отказо- и даже катастрофоустойчиво, я спрошу: «А как увеличатся риски, если половина команды, которая будет отвечать за мои стойки, просто уволится?».
Как думаете, в скольких случаях я не получу ответ «никак»?

А риски чего именно? К примеру, если риски случайного вывода из строя оборудования из-за человеческого фактора, то они даже возможно уменьшатся.
Вы и правда думаете у меня есть шанс на такой ответ? Ок. Тогда, я смело сделаю вывод, что проблема этого ЦОДа не в переводе 30% от всех сотрудников на удаленку. А в манере директора управлять путем отказа от ответственности.

Don't ask, don't tell
Это же классика — если я не спросил, то сам и виноват. «Вы же не уточнили, что имеете в виду повышение рисков того, что ваше оборудование…
— выкинут на помойку
— украдут
— зальют мыльным раствором (не водой заметьте, про воду вы спрашивали).»

Ну это детский сад.

Я не должен «угадывать» возможные риски из-за беременности бухгалтера, просто мне показалось, что отказоустойчивость ЦОДа к потере части сотрудников не была достаточно освещена в пламенной речи директора.
Ну это детский сад.

Вы задали довольно абстрактный вопрос о сферическом ДЦ в вакууме, как на него можно что-то ответить не имея вообще никакой информации об этом ДЦ. Может, вообще, из N человек в команде нужен только 1 чтобы обслуживать нормальную работу всего существующего оборудования этого цода вместе с этими 10 стойками, а остальные N-1 нужны для ввода в работу нового оборудования и плановой замены старого оборудования на более новое. То есть в случае ухода N/2 команды, для этих стоек в плане рисков ничего не изменится, измениться только прибыль ДЦ, потому что не меняя те же сервера на более современное железо, они могут потерять клиентов или просто будут платить больше за электроэнергию и охлаждение из-за менее эффективного железа.
Для клиента ЦОД и должен быть сферическим и в вакууме (лучший пример — AWS). Но не важно.

Про N/2 в заявлениях ЦОДов речи не идет. N/2 для команды инженеров это весьма ощутимый удар. Речь о 30% от всех сотрудников. Если взять ваш пример,
остальные N-1 нужны для ввода в работу нового оборудования и плановой замены старого оборудования на более новое

то можно довольно смело предположить, что в этом ЦОДе в такой момент снижаются продажи, а значит этот конкретный ЦОД может отправить на удаленку больше (относительно других ЦОДов) сотрудников отдела продаж. (Вопрос, покроет ли это разницу, но с продажами же связан не только этот отдел.)

А если серьезно, то покажите мне хоть один ЦОД, где инженеры с допуском в серверные помещения составляют хотя бы 50% сотрудников. Не уборщицы, охранники, топ менеджмент («потому что, у топов должен быть доступ!»), а именно инженеры. Я уверен, что любой российский ЦОД может отправить на удаленку 30% сотрудников, не оправив туда ни одного инженера.

Но не все так просто
Многие ЦОДы уже давно отправили большое количество инженеров на удаленку. И если вот эти, плакальщики газеты Коммерсант, не поступят также, то их инженера просто разбегутся в нормальные ЦОДы. Но поскольку, по причинам, указанным мной в первом комменте, эти так не могут, то они пытаются продавить свою идею всем сидеть очно.

Риски выхода оборудования из строя не увеличатся. А вот время выполнения срочных задач, банально, что-то перезагрузить, увеличится. Так же может возрасти время устранения неполадок в самом ЦОД.

Я получу такой ответ от директора ЦОДа?

Что ж, ведь время выполнения перечисленных вами задач не увеличится настолько, что выйдет за рамки SLA, указанного в контракте? Значит все в порядке. Или вы пытаетесь намекнуть, что столь безрассудны, что подпишете что угодно?

Вопрос в том, что ЦОД — это не склад, на котором 100% грузчиков выполняют свою работу на месте, а остальные сотрудники поголовно оформлены в других юрлицах.
В большом ЦОД'е может быть 3 инженера дежурной смены (итого 12 человек с учётом сменности и отпусков), которые заняты чисто заменой оборудования и монтажом, 3-6 сетевиков (им тоже нужно работать посменно), 3-6 людей, отвечающих за виртуализацию, 3-10 менеджеров по продажам, юристы, бухгалтерия, ещё куча сотрудников.
И из всей этой толпы "кровь из носу" в ЦОД'е обязана присутствовать только дежурная смена. Всё остальное делается без проблем удалённо.

Тут сошлись два разных подхода подсчёта количества сотрудников, работающих удалённо:
— математический, если в офисе в каждый момент времени работают не более 70% сотрудников, то всё в порядке,
— бюрократический, если человек приехал в офис на одну минуту в месяц, то он уже не считается работающим удалённо.

Такое мы уже наблюдали весной, когда рассчитывалась надбавка врачам за работу с covid инфицированными. Врачи считали, что если они сталкиваются по работе с инфицированными, то им положена надбавка в полном объёме, а начисляющие органы говорили так: если вы контактировали с больными 20 минут в день из восьми рабочих часов, то и денег вы получите соответственно 1/24 часть.

У кадого своя правда.

Ситуация повторяется и в 2021 году - сегодня 25 июня вышел повтор распоряжения о переводе 30% сотрудников на удаленку. Хотя именно в ЦОДе, на мой взгляд, самая безопасная атмосфера: постоянная вентиляция и малое количество людей (это не проходной двор). Ни один вирус и ни один посторонний человек не зайдет. Все свои, по крайней мере в дата-центре в Тушино, и нет сомнения, что и в других ЦОДах также.

Sign up to leave a comment.

Other news

Change theme settings