Lumber room
28 March 2012

Очередная авария у Selectel

Пост создан для информации, т.к. На Хабре не нашел подробностей аварии.

Не так давно пришел тикет от Селектел о профилактике на кластере хранилища:

28 марта 2012 c 8:00 до 11:00 планируется проведение профилактических работ на одном из узлов кластера хранилища. На этом хранилище находится один или неколько дисков ваших виртуальных машин. Узнать, какие виртуальные машины будут затронуты работой, можно по uuid SR в свойствах дисков. Работы будут проходить на SR 409127d3-61a1-9c8d-ceb5-486c608c58aa.

В течение работ перерыва не планируется, однако отказоустойчивость может быть снижена.

Приносим извинения за беспокойство.


В результате сегодня сервера облака не работают. Тех поддержка молчала до последнего. И вот наконец, долгожданные новости:

Произошел сбой на одном из хранилищ.
В данный момент, наши специалисты работают над устранением неисправности.
К сожалению, точные сроки решения, пока не известны, вероятнее всего подъём займёт порядка 5 часов.
Данные на виртуальных машинах не пострадают, в худшем случае — откат на 10 минут (консистентный).
Приносим извинения за доставленные неудобства.


На данный момент управление серверами облака, которые на этом SR не доступно. Висит заглушка «Восстановление в пуле Санкт-Петербург (2) в течение 3х часов.»

UPD 13:21 (GMT+2) :
Исчезло уведомление о работах, но машину запустить не удается. Тех.поддержка говорит:

Процесс востановления продолжается, предполагаемое время окончания, чуть больше часа.

-1
1.4k 2
Comments 75