Pull to refresh
313.56
Skyeng
Крутейшая edtech-команда страны. Удаленная работа

Открытый микрофон от DevOps Deflope, рассказы про инфраструктуру Skyeng и Nvidia и не только

Reading time2 min
Views2.1K
Привет, в следующий вторник на Таганке планируются теплые ламповые посиделки: будет Артем Науменко с рассказом про инфрастуктуру как продукт, Виталий Добровольский с докладом про балансировку кластера Kafka и ведущие профильного подкаста с пока секретной темой для обсуждения. А еще мы ожидаем специального гостя из северной столицы — Виталия Левченко, организатора питерской SRE-тусовки.

UPD. Места в зале закончились, но мы проведем трансляцию на этом канале. Подключайтесь онлайн!

image

А пока есть время, мы поговорили с докладчиками о том, как устроена жизнь SRE-специалистов в их командах и каким компаниям оно вообще нужно.


Артем Науменко и Виталий Окулов, руководители инфраструктуры в Skyeng


— Чем заняты SRE в ваших командах?

— Мы только начинаем привлекать таких людей в штат, чтобы обеспечить бесперебойную работу наших многочисленных проектов: биллинг, CRM и других. У Skyeng разноплановая архитектура, много серверов, разный технологический стек и разные базы данных. Хотим, чтобы SRE вместе с командами разработки планировали и реализовывали изменения в инфраструктуре, занимались автоматизацией работы и пр.

— Какие интересные задачи решает твоя команда?

— Текущий интересный проект — кластеризация упакованных в Docker публичных сервисов компании. Cпланировать и реализовать такое изменение в рамках нескольких проектов может только опытная команда профессионалов.

— Каким компаниям нужно SRE, на ваш взгляд?

— Крупным компаниям, которые ставят стабильность работы сервиса на одно из первых мест, и при этом растут 2-3 раза в год. Как и мы, например)


Виталий Добровольский, системный инженер в Nvidia


— Какие задачи решает твоя команда?

— Наша компания постоянно ищет новые возможности применения GPU в различных областях, поэтому мы экспериментируем с внедрением их в свои процессы. У нас геораспределенная инфраструктура с датацентрами в разных локациях, поэтому многие задачи решаются с прицелом на это. Проекты по интеграции никогда не имеют заранее готового решения — на пути всегда встретятся задачи, требующие нестандартного подхода.

— Чем у вас заняты SRE?

— Мы занимаемся обработкой событий из разных источников для последующей агрегации и визуализации. Operations у нас обеспечивают стабильность и доступность входной шины (мы используем Kafka), обработку сырых данных (YARN, Spark), слоя хранения (HDFS, Hive, ElasticSearch) и слоя визуализации (Kibana, Tableau, OmniSci Immerse). Кроме того, интегрируемся с другими командами и их стеками, для объединения усилий в обработке данных.

— А каким компаниям нужно SRE, на твой взгляд?

— Модель SRE сильно завязана на организационную структуру и карьерные циклы специалистов. Например, практически все специалисты в Google начинают путь с SWE (разработчиков), а когда накопят опыт, из них может формировать SRE-команда, которую подключают к продуктам. Именно поэтому Google назвал этот паттерн DevOps «class SRE implements DevOps». Если у компании есть возможность, а структура бизнеса позволяет формировать SRE-команды и подключать их к продуктам на разных стадиях жизненного цикла, — они могут использовать эту модель. Иначе компании следует внедрять DevOps-практики другим способом. В конце концов и SRE, и DevOps имеют те же цели — построение гибких и отказоустойчивых систем.

p.p.s. Ждем всех, кто хочет и может, на встрече 27 августа к 19 часам, а всех, кто хочет, но не может — в эфире с семи с копейками вечера.
Tags:
Hubs:
+10
Comments2

Articles

Information

Website
www.skyeng.team
Registered
Founded
Employees
1,001–5,000 employees
Location
Россия
Representative
Alisa Kruglova