Pull to refresh

Интервью с Сергеем Белоусовым: реально большие данные

Reading time 9 min
Views 25K


Беседовал: Степан Ильин

Я встретился с Сергеем Белоусовым в восемь утра в одной из московских гостиниц. Понятие дома для него устарело: зачем нужны дома и квартиры, если есть гостиницы? Возможно, именно это острое и нестандартное мышление и помогло ему построить сразу несколько технологических компаний в совершенно разных областях: от разработки Linux-дистрибутива (ASP Linux) и технологий виртуализации (Parallels) до систем хранения и резервирования данных. В какой-то момент основным направлением деятельности стал венчурный фонд Runa Capital, но сейчас фокус его внимания сместился на одну из давно основанных компаний — Acronis.

Возвращение в Acronis


Много лет я не занимался Acronis, но сейчас не­ожиданно пришлось. За эти годы в Acronis несколько раз менялись управляющие команды, но последнее время они не очень хорошо справлялись, и компания росла не так быстро, как могла бы. Так, по-моему, компания легко может вырасти в десять раз и больше. Поэтому я решил вернуться в Acronis.

У любого проекта есть некое внутреннее свойство, как ДНК у человека. Список требований, спецификации, задачи. Это возникает из контекста.

Факты:

  • Трудоголик. Работает в среднем 85-100 часов в неделю.
  • Инвестор. Инвестировал в несколько десятков проектов, будучи старшим партнером венчурного фонда Runa Capital, в том числе в nginx Игоря Сысоева.
  • Физик. Полный набор: выпускник физтеха, кандидат технических наук, почетный доктор МФТИ и обладатель более двухсот патентов.
  • Путешественник. С 2001 года гражданин Сингапура, что очень удобно для перемещения по миру в бесконечных командировках: сингапурцам не нужны визы почти во всех странах мира.
  • Предприниматель. Основал более 20 компаний, в том числе Acumatica и SWSoft, которая превратилась в две всемирно известные компании — Parallels.


Контекст — это окружающая среда. К примеру, если нас с нашей ДНК поселить на Марсе, мы проживем там не­сколько секунд, а то и меньше. Потому что там другой кон­текст.

Менеджмент для проекта — это как интеллект или ЦНС. Если с интеллектом все в порядке, то жить на Марс ты не полетишь.



Acronis была не в своем контексте, не могла нор­мально функционировать. В такую ситуацию ее завел ме­неджмент. Теперь проект нужно возвращать с Марса на Зем­лю. Тем не менее это по-прежнему стабильная и прибыльная компания.

Одной из частей ДНК Acronis всегда была доста­точно сильная команда. Она осталась и сейчас, просто немного «размазалась», но мы почти собрали ее обратно. Это группа людей, которые хорошо разбираются в системах хранения данных. Теперь Acronis нужны сверхзаточенные тех­нологии: сверхбыстрые, сверхэффективные, сверхнадежные.

Знаете, какого размера достигает индустрия швейцарских часов? 25 миллиардов долларов. И швей­царские часы всегда рекламируют на яхтах, в космосе и так далее. Но вы покупаете их и, конечно, никогда не водите с ними яхту в шторм и не ныряете на глубину 200 метров. Но приятно, что у вас есть такая возможность.

Чтобы это было реально, швейцарские инженеры тратят время и силы. Если они утверждают, что их часы работают на глубине 200 метров или в космосе, — это правда. Acronis тоже всегда делала технологии подобного рода. Но сейчас это как раз одна из тех составляющих ДНК, которая поломалась.

Сломать ДНК проекта может менед­жер. Команда, что была в Acronis раньше, не ставила целью затачивать технологии под сложные задачи. Если продолжать пример с ча­сами, менеджер может решить: «О, мы Casio, зачем нам вообще иметь хорошие технологии? Ведь мы продаем дешевые часы, давайте эконо­мить! Будем покупать плохие дисплеи, кварце­вые генераторы, не станем беспокоиться о ПО, не будем добавлять туда никаких свойств. Какая разница, какие у нас будут корпуса?» То есть Casio тоже хоро­шие часы, но это не совершенные технологии. Мы же хотим быть швейцарскими часами. Соответственно, сейчас мы все возвращаем на место.

Взлет storage-систем


Фокус инноваций время от времени перемещается. Иногда фокус смещается к веб-приложениям, иногда возвра­щается обратно к платформам. Сейчас этот центр сдвинул­ся к системам хранения данных. То есть возникло огромное количество стартапов, новых технологий, которые связаны с тем простым фактом, что количество данных стремительно растет.

Нельзя сказать, что мы упустили какие-то тренды. У софтверных компаний, как и у живых существ, есть такое свойство — очень высокий уровень живучести, большой запас прочности. Скажем, убить человека — это непросто. Он живу­чий, его нужно долго мучить.



Когда Acronis начиналась, мы разрабатыва­ли очень хорошие технологии хранения данных, но storage не был трендом. А сейчас это очень большой тренд. Ведь количество данных бесконечно быстро растет. Персональные данные, бэкапы, аналитика — все это надо где-то хранить. В частности, поэтому мне интересно было вернуться в Acronis и работать над этой задачей.

Весь мир, который мы знаем, превращается в данные: они становятся невероятно ценны и важны. Думаю, это лишь вопрос времени, когда ценность данных, ко­торые вы генерируете на компьютере за всю жизнь, превысит вашу собственную ценность.

Сингапур собирается сделать секвентацию всех своих жителей. Население страны, с учетом экспатриантов,
порядка шести миллионов человек. Одна секвенированная ДНК, даже после оптимизации, занимает 22 Гб. Шесть миллионов — это какое-то невероятное количество данных: 6000 * 22 Пб. Система хранения таких данных — очень сложная система. И это только в небольшом Сингапуре. А секвенируют в итоге, очевидно, каждого человека в мире. И не только самих людей, но еще все их вирусы и так далее.

Все системы хранения данных очень сильно поменялись. И маковская HFS, и виндовая NTFS скоро перестанут быть актуальными. Некоторое время назад файловые системы вроде бы перестали эволюционировать вовсе. И вот опять тренд начинает меняться.

Большие объемы данных


Сейчас мы выпускаем на рынок техно­логию Acronis Storage, которую рань­ше использовали только в собственных дата-центрах. Мы ее разработали пять лет назад — и до сих пор пользовались ей только внутри компании. Основные ее свойства — очень высокая надежность, масштабируемость и эффективность.

На больших объемах данных начинают проявляться очень странные эффекты. Например, космические частицы, я не шучу. У каждой системы данных какого-то размера есть сечение. Время от времени из космоса прилетают частицы, которые могут попадать в биты. Если они попадают в очень правильное место бита, он может переворачиваться. Это происходит довольно редко, но чем больше у вас данных, тем чаще это случается. На некоторых системах это происходит почти все время. К примеру, если у вас миллион петабайт, то это постоянная ситуация. Система хранения данных должна быть устойчива к подобному, она не должна ломаться. Поэтому там требуется надежность другого рода.

Масштабируемость тоже очень важна. Даже попытка найти какой-то блок или файл на очень большой системе может быть весьма дорогостоящей операцией. Скажем, в системе на миллион петабайт таблица файлов сама может быть размером с петабайт. И загрузить ее в память, чтобы прочесть, невозможно. Пока не существует памяти в петабайт объемом. Такую таблицу нужно читать принципиально по-другому. И хранить тоже.

Продукция Acronis продается в более чем в 90 странах мира и переведена на 14 языков.

Эффективность имеет не меньшее значение. С таким количеством данных даже небольшие изменения в эффективности имеют огромную ценность. К примеру, система хранения данных может стоить сто миллионов долларов. Тогда изменение ее эффективности на 10% — это выигрыш десять миллионов.

Уровень ошибок в системе хранения данных должен быть в десять раз меньше, чем в операционных системах. ОС может дать сбой, что-то может пойти неправильно, но это не страшно — можно перезагрузиться, поставить апдейт. А если потеряются данные, все — это невозвратимо. Поэтому — низкий уровень ошибок и высокий уровень качества.

Кадровые вопросы


Acronis может сохранить свою ДНК и развиваться, только делая сверхкачественные технологии. А на такое способны только сверхпродвинутые люди, которые хорошо вписываются в команду. Степень надежности должна быть очень большая, и только очень качественные программисты могут разрабатывать такие системы.

Все разработчики и R&D у нас находятся в России. Недавно мы обсуждали с подразделением Ernst & Young в Израиле, которое как раз специализируется на аудите технологических компаний, есть ли программисты в России и сколько их? Но вся идея в том, что много не нужно. Нужно всего несколько — но чрезвычайно высокого качества.

Офисы компании расположены в 18 странах, в том числе в США (Бостон), Германии (Мюнхен), Японии (Токио), Франции (Париж), Великобритании (Лондон), Бельгии (Брюссель), Сингапуре.

Конечно, в Индии или Китае программистов больше, но это не главное — важно качество. Качество имеет ключевое
значение, например, тот же самый nginx написал один человек — Игорь Сысоев. А core-технологию Acronis написало пять человек, они же разрабатывают ее до сих пор. Нам реально нужно найти еще пять таких же. Русскоговорящего населения — более 200 миллионов человек, включая страны СНГ. Наверняка пять человек можно как-нибудь наскрести.

В России мы ищем людей, которые будут архитекторами, продукт-менеджерами, программ-менеджерами и, в основном, senior-программистами. То есть людей, которые будут делать сложные куски кода. Не из России мы привлекаем людей с бизнес-экспертизой. Это либо управляющие большими командами, либо те, кто хорошо понимает в product или user experience (которые ближе к клиенту).



Если человек решил жить в России, то команд, способных предоставить ему возможность написать софт, пользоваться которым будут сто миллионов человек, мало. По пальцам двух рук. Acronis однозначно одна из лучших команд, а теперь мы со Станиславом Протасовым, старшим вице-президентом Acronis по исследованиям и разработкам, сделаем ее лучшей командой. Приятнее написать storage-систему, которую используют сотни миллионов человек, чем, например, софт для пускай даже самого большого банка.

Сейчас в Acronis работает порядка 650 человек, почти половина из которых — разработчики с опытом работы в софтверных компаниях-гигантах.

Про мою роль


Я давно не пишу код, а занимаюсь непосредственно разработкой сложных технологий. Это как дирижирование оркестром. Когда дирижируешь оркестром… умеешь ли ты сам хорошо играть на каком-то инструменте? Умеешь, но никогда не играешь. Основная задача — как-то сдирижировать сложный оркестр, чтобы получился консистентный сигнал. В основном это и есть то, что я делаю.

Кто-то должен дирижировать. В самых успешных компаниях это всегда один человек: в Microsoft это был Билл Гейтс, в Facebook — Марк Цукерберг. Марк не пишет код, но он дирижирует. Эту роль кто-то должен занять. Это как пересадка мозга. Наверное, если бы это был не я, то место должен был занять кто-то другой. Но тогда это должна была быть его компания. Так как компания моя — приходится мне.

У другого человека не будет такого количества мотивации и знания деталей, чтобы он мог дирижировать оркестром. Поэтому в технологии приходится лезть. Но именно в сложные технологии, только это мне по-настоящему интересно.

Тренды


С моей точки зрения, для технической аудитории сейчас существует пять перспективных областей в сложных технологиях.

Большие, массовые системы хранения данных. Это мощный тренд, который подхватывают многие стартапы. Многие из тех, кто ранее разрабатывал старые платформы, перешли в разработку систем хранения. Да, это довольно скучные системы, но это очень большая область: данных становится очень много и они постепенно переезжают в облако. Как я говорил, фокус технологий перемещается. Сейчас он опять сместился, потому что стала важна безопасность, разные алгоритмы по коммуникации, надежность. Надежность накладывается на все, даже на передачу данных. Когда передается очень большое количество данных, то ошибки, присутствующие в любом протоколе, начинают всплывать сильнее. Если у вас сто тысяч пользователей и 0,01% ваших пользователей недовольны, то это не проблема — это лишь сто человек. А если у вас сто миллионов пользователей, а не сто тысяч, то недовольных уже не сто человек, а сто тысяч. Их концентрация в любой временной и пространственной точке достаточно велика.

Big Data. Системы хранения данных и область Big Data связаны, но не напрямую. Если хранишь много данных, необязательно проводить с ними какую-то сверхсложную аналитику. Однако это, как правило, делать приходится.

Виртуальные миры и системы для их создания. Огромное количество людей все больше живут в виртуальном пространстве. Сегодняшние системы создания виртуальных миров — это игры, интерактивные системы развлечения или обучения, виртуальные миры как таковые. Но пока все это кустарные разработки. Существуют какие-то платформы, вроде Kinect, но они не совсем подходят для виртуальных миров. Они все проприетарные. Напоминает времена до интернета, когда был AOL, CompuServe, MSN — у каждого вендора своя платформа. Для разработчика, который хочет создать собственный виртуальный мир, понадобится много платформ и знаний. Это не очень удобно. Идеальный способ создания виртуального мира — это когда ты просто сидишь и говоришь: «Мне бы хотелось, чтобы все было как в Москве, но дома были как в Лондоне, температура воздуха постоянно 30 градусов, дождь шел бы два дня…» То есть если можно было бы рассказать сценарий — и все это появилось бы. На сегодняшний день такого не существует.

Роботы. Роботы — это комбинация железа и софта, но главное значение имеет софт. В человеке основное — это тоже софт. Если софт в человеке выключить, он начинает быть… трупом. Нужно разрабатывать платформы для различных роботизированных систем. Их будет очень много. Самый простой пример — автоматические машины: скоро все или многие машины будут без водителей. Сюда же можно отнести всякие системы слежения, системы управления. Нужно, чтобы была возможность удобно программировать «ум» этих систем, их поведение. Сейчас существует много разных систем, и они довольно неприспособленны для реального использования. Поэтому разработчики используют системы, которые вообще не для этого написаны, — платформенные, системы storage, ОС и так далее. Одна из проблем роботов — общение между собой в реальном времени. Сейчас их системы общения очень медленны, неэффективны. Если они соединены друг с другом, то все неплохо. А если они под водой, где нет Wi-Fi и система передачи данных вытягивает только 1 Кб/с? Если у вас есть группа роботов, очень сложно будет добиться того, чтобы они вели себя как стая рыб. Рыбы друг друга видят, и интерфейс между ними не 1 Кб/с, а, скажем, 1 Мб/с.

Internet of things. Проще говоря, интернет всего. Огромное количество вещей сейчас подключается к интернету. Обычно, когда люди рассказывают про Internet of things, они думают про какие-то подключенные к Сети холодильники. Но Internet of things не обязательно про это. Сюда же попадают системы сигнализации, системы управления данными, управления температурой, а также автомобили и роботы, которые должны общаться друг с другом через какую-то сеть.

Блог компании Acronis на Хабре


Впервые опубликовано в журнале «Хакер» от 11/2013.

Публикация на Issuu.com

Подпишись на «Хакер»




Tags:
Hubs:
+27
Comments 10
Comments Comments 10

Articles

Information

Website
xakep.ru
Registered
Founded
Employees
51–100 employees
Location
Россия