Pull to refresh

Comments 8

Классный подход и было бы интересно принять участие в таком тренинге онлайн.
Впечатления довольно смешанные. По теории — всё отлично, хорошо подано и полезно. Многое знал, но это уже сам виноват :)
По практики — отличный хакатон. Получил огромное удовольствие от решения задач, они хорошо встроены в курс, всё ломается внезапно. Но задачи наглухо синтетические и я не могу представить подобных проблем в реальных условиях.
Не могу представить, что бы SRE/Ops команда полезла в мастер ветку править код приложения на проде, что бы починить аварию.
В общем вся практика выглядит как набор ситуаций, которых могут произойти только при фантастически всратом IT менеджменте.
Но, повторюсь, как хакатон — всё очень круто.
А в чем проблема залезть в мастер если это авария что уже можно говорить о нестандартной ситуации, которая не решается существующими процедурами? Это потом можно провести анализ и написать новую инструкцию для такого рода аварий, но первично они могут произойти и их как-то нужно решить, а не витать в облаках насчёт того что факапы бывают только в плохих компаниях :)
Факапы факапам рознь. В задачах были факапы вида «вы не знаете архитектуру своего приложения, кругом чёрные ящики и один чёрный ящик ВНЕЗАПНО поменял логику взаимодействия с единственным компонентом, к которому вы имеете доступ».
Ну и решение — править код со своей стороны.

Моё главное недовольство тут даже не в том, ВНЕЗАПНО, а в том, что в реальности код приложения был бы не десятки строк, а сотни или даже тысячи. И не зная его, что-то там поправить было бы долго и опасно. Гораздо быстрее и правильнее — срочно пинать разработчиков, причем обоих сервисов.

Это конечно хорошо что sre на всех руки мастера но кмк откатить надо было тот чёрный ящик который внезапно поменял логику и никак иначе.

Откатывать надо тоже с умом. В общем случае релизы не всегда обратно совместимы и надо уточнять у разработчиков, возможно ли откатиться.
А в рамках задачи — о существовании этого чёрного ящика мы узнали только когда он сломался :)
Первым делом мы сломаем самолёты, ну а девушек, а девушек потом

И в оригинале, и в контексте тут не «сломаем».
Only those users with full accounts are able to leave comments. Log in, please.

Information

Founded
Location
Россия
Website
southbridge.io
Employees
51–100 employees
Registered
Representative
Антон Скобин