Pull to refresh

Comments 6

disaster recovery слезами аукается на этапе разработке крупного отказоустойчивого сервиса. Необходимое зло, для подстраховки от еще большего зла — downtime сервиса
Вылетели ИБП — как следствие, серверы начали греться. Инженер их гасил. В это время по thermal shotdown отключались батареи. Нагрузка падала, всё это остывало, а затем автоматически всё включалось. Опять начинался нагрев.


Почему при вылете (отключении?) ИБП начинает греться сервер? Что отключал инженер — сервер или ИБП? Почему по thermal shUtdown отключались батареи — ведь ИБП уже вылетел?
Потому что в ЦОДе на ИБП завязаны не только серверы, но инженерная инфраструктура, в частности системы кондиционирования. Основной ИБП отключался частями – батарейными блоками. В серверных стойках использовались локальные бесперебойники для аварийного корректного выключения серверов и СХД. Сначала отключились кондиционеры, подключенные к основному ИБП, потом по thermal shutdown начали выключаться серверы из-за отсутствия охлаждения.
Инженер отключал серверное оборудование.
Вылетел не сам ИБП, состоящий из блоков управления и батарейных модулей, которые и начали вылетать, т.е. не могли держать полную нагрузку.
Неисполнение поставщиком обязательств вследствие действия санкций.


Давно такой риск стали рассматривать в России? Пока гром не грянет, мужик не перекрестится…?
Риск неисполнения обязательств рассматривается практически всегда вследствие разных причин, в том числе и санкций.
Но если раньше этот риск рассматривался как маловероятный и не всегда были реальные варианты по защите от него, то в последний год он рассматривается как один из основных, особенно в высокотехнологичных компаниях.
UFO just landed and posted this here
Sign up to leave a comment.