Mail.ru Group corporate blog
Website development
System Analysis and Design
Development Management
Cloud services
Comments 14
+3
У всех участвующих определена их роль в выкатке, какие задачи делают, за что отвечают.
1. «Выкатку» и откат, конфигурирование и запуск функционала… у Вас делает отдельная/единая команда Администраторов по специальной документации или в 4-6 глаз спецы из Разработчиков (из разных отдельных команд), по ходу получая фидбэк, на ходу фикся баги на соответствующем этапе «выкатки»?
Стараемся довести каждый этап до автоматизма, выкатить откатить, собрать фидбек и катить снова.
2. Есть ли у Вас тестовый ландшафт? Прокатывали ли вы предварительно в нём свою «выкатку» (репетиция работ на каждом этапе согласно составленному плану, включая func- и load- тесты)? или типа после продуманной диаграммы Ганта и прикинутых времязатрат катили изменения прямо в Продуктив (ожидая фидбека пользователей, результатов мониторинга и тестировщицы из отпуска)?
можно выкатить без последствий для прода всё что угодно
3. Каким Вы полагаете примерный уровень зрелости по модели CMMI на площадке, где работаете техническим директором?
Спасибо.
+3

А вы специально в конце добавили Solutions чтобы было солидно и трехбуквенно как у больших мальчиков?


И да, я не верю в невозможность инкрементального деплоя. Все эти трудовые подвиги с ночными деплоями и горящими глазами — это все ненадежно и непродуктивно. В идеале у вас должна была в один момент времени работать рядом старая и новая система авторизации, затем постепенное выпиливание старой.

-2
пришло время приделать к нашей платформе IAM (Identity and Access Management), который обеспечивает единое управление всеми пользовательскими аккаунтами, пользователями, паролями,..
Уважаемый Технический директор, Вы пользовательский аккаунт перечисляет наравне с понятиями о пользователе (логин/идентификатор) и паролем, т.е. для Вас это три несвязанные сущности?
+1
Итак, 15 человек приехало на работу в воскресенье 29 апреля

Почему не вечер субботы, а именно воскресенья? В 6 утра МСК понедельника рабочий день много где в России в разгаре.

Кстати, 29 апреля в этом году был понедельник, опечатка, или история из далекого прошлого?

0
Вероятно, утро поненедельника выбрали, чтобы на проде на пользователях поэксперементировать. Страшно пытаться проанализировать, что и как там происходило.
У них в 05:00 точка невозврата (и 2 часа на откат до 07:00), но Технический директор регистрирует в статье не личное, а типа групповое решение:
04:30. Точка невозврата… Принимаем решение, что выкатка состоялась, откатываться не будем.
Затем, когда завершился даунтайм, вот тебе раз (демонстрируется не личная ответственность, а типа групповая безответственность):
07:00. Проблемы с нагрузкой на API… мы немного неправильно распланировали нагрузку на наше API и тестирование этой нагрузки...
А если бы своевременно не решили бы проблему с узким горлом и она оказалась бы серьёзной, получили бы «выкатку» или аффект пользователей?
Не склонен ли герой статьи к волюнтаристическим решениям и не только?
+2
Получил достаточно много комментариев, постараюсь ответить в одном посте.

По формату статьи. Данная статья предполагалась в формате вольного рассказа для самых широких айтишных масс, без указания какой-то конкретики как по процессам, так и ролям участников команды или архитектурным особенностям. В общем, я считаю переход на личности а данном формате неправильным.

По поводу кусочной доставки кода — да, конечно, это почти всегда можно сделать (хотя я видел ситуации, когда это было практически нереально за разумное время). И мы также могли бы сделать такое, но в данном случае, как я описал в тексте, это сильно бы удлинило переход на новый код, а также создало бы значительные риски расхождения информации между базами данных.

Касательно тестирования в «Итого» я написал, сколько примерно строчек заняло написание тестов, и это только касательно специфичных для миграции, не считая наших обычных автотестов, запускаемых регулярно. По тексту, как мне кажется, тестированию уделено тоже достаточно времени. В общем, можно сказать, что по сути все два месяца состояли из тестирования, иначе как понять, что каждый этап прошёл успешно?

Ну и по датам, выкатка началась 29-го в понедельник в 0:00, собственно мы приехали на работу заранее в воскресенье 28-го, спасибо, поправлю.
0

Спасибо за постмортем, очень интересно было почитать!


А выводы какие на будущее? У меня волосы шевелились, пока читал. Или все норм, так и будете в следующий раз делать?

0
Мне кажется вопрос немного провокационный :)

Ну а общие выводы, как планировать подобные работы, если без них невозможно обойтись, перечислены в последнем пункте.
0
Заслуги или результаты деятельности коллектива во многом зависят от неформального лидера-профи. Можно узнать, кто главный спец, предложивший и обосновавший «выкатку», убедивший в её технологической необходимости руководство, сыгравший в её подготовке и реализации центральную роль? Представьте хотя бы по должности этого скромного человека, стоящего во главе вертикали экспертных компетенций на Вашей площадке или у Вас всё решает best practices алгоритм из последнего пункта, а диаграмма Ганта отвечает за это!?
+1
Клуб анонимных техлидов не одобряет раскрытия своих членов во избежании проблем с дальнейшим трудоустройством.
0
Я ожидал несколько другой ответ, т.е. если есть такой человек, то его прикроют собой, сказав, что это задача поступила типа «сверху», (с которой коллектив каким-то чудом справился).
Only those users with full accounts are able to leave comments. , please.