Nutanix corporate blog
System administration
IT Infrastructure
Virtualization
Data storage
June 2017 20

Современные конвергентные технологии на рынке в РФ — попробуем сравнить? «Импортозамещение», Ceph + OpenStack, Nutanix

На сегодняшний день в РФ на IT рынке сложилась крайне интересная ситуация.

Происходят (успешные или не очень — отдельный вопрос) попытки импортозамещения в IT, появилось множество продуктов «made in Russia», особые списки и прочее.

Мы не хотим и не будем говорить о политике, но поговорим о технологиях и ценообразовании.

Сегодня бы хотелось поговорить об одной из наиболее «нагретых» в мире и РФ тематик (крайне выгодной для производителей) — «облачные» платформы для хранения и обработки данных — иными словами СХД, виртуализация, облака и прочее.

image

Для рассмотрения были выбраны три варианта — массово рекламируемые в РФ импортозаместительные продукты и Nutanix, как лидер (или один из лидеров) мирового рынка HCI.

Подавляющее большинство «стеков сделанных в РФ» укладываются в «Openstack + Ceph».

Перефразируя, мы говорим о современном подходе к построению IT инфрастуктур по принципу как делает Amazon, Google, Facebook и другие, но с локальными особенностями.

Как небольшое отступление, еще в 2014 году Gartner сделал прогноз о том, что в 2017 большинство крупнейших / ключевых компаний будут использовать webscale решения, и они оказались правы.

Более половины крупнейших мировых компаний (из Global 100) уже используют WebScale (инфографика — ниже).

Gartner Says By 2017 Web-Scale IT Will Be an Architectural Approach Found Operating in 50 Percent of Global Enterprises

image

Аналитики в целом сходятся в том, что традиционные подходы к построению инфраструктур изживают себя (так называемые «трех-уровневые инфраструктуры» базирующиеся на СХД), причем пере-раздел рынка происходит крайне быстро.

Крайне интересная инфографика и аналитика:

image

Теперь вы понимаете, почему рынок так сильно нагрет даже в РФ и почему «импортозаместители» ведут себя как в анекдоте «тушите свет, они на свет лезут», при этом (мое личное мнение) реальная ситуация с технологиями очень напоминает вот это:

image

На самом деле, речь идет о переразделе многомиллиардных (не в рублях) доходов даже в РФ:
обработка и хранение данных сейчас является ключевой проблемой практически любых бизнесов и организаций в мире, а публичные IT закупки российских компаний составляют сотни миллионов долларов.

Безусловно, существуют другие конкурентные коммерческие западные вендоры, о них мы можем поговорить отдельно.

Суть статьи — понять что реально могут предложить технологически клиенту «российские продукты», является ли импортозамещение в данном случае реальным или бумажным, насколько это все дорого или дешево.

Многие профессионалы знают, что в подавляющем количестве случаев все эти продукты реально не разрабатывались в России, и либо используют ceph + openstack (по ощущению — >95% «импортозамещений»), либо делают вид, что разрабатывают продукт локально, но в реалиях это вполне себе западный программный код.

Один из интересных примеров — как «Лёгким движением руки брюки превращаются в шорты».

Американская компания (бывшая Parallels) Virtuozzo → "Росплатформа" → "СКАЛА-Р"

Дабы избежать любых кривотолков — привожу ссылку на выступление топ-менеджера «Росплатформа», где речь фактически идет о «получении преференций на закупки для российских компаний».

Программный код Virtuozzo принадлежит американской компании.

Версионирование / документация полностью совпадает.
Как вы думаете, какая компания реально продолжает разрабатывать программный код, а какая просто использует выделенный билд-сервер?

image

Если говорить о суммах, то речь идет обычно о проектах от сотен тысяч до многих миллионов долларов, но решения применимы и небольшими компаниями — порог входа в «новый прекрасный мир» (для РФ) — где-то 35$k.

IBS ориентирует свою «Скала-Р» как «с экономической точки зрения платформа СКАЛА-Р может быть интересна компаниям с ИТ-бюджетом от $500 тыс.», что конечно мягко говоря несколько удивляет.



Кстати, позитивные исключения (из массы «готового американского кода») однозначно есть — например хранилища данных Raidix, которые создали специализированное решение для записи и воспроизведения медиа-потоков, причем весьма успешное, но реально не подходящее ни для серьезных проектов построения «корпоративных облаков», ни для хранения generic данных (коллегам просьба не обижаться — но это реально так, если будет желание можем провести сравнение функционала — объясню каких базовых «фич» у вас нет для того чтобы серьезно говорить про облачные enterprise применения).



Сегодня хотелось бы затронуть хотя бы базовые вопросы о технической части решений, но немного поговорим и про ценообразование.

Cпойлер
Как вы уже наверное успели догадаться — за «импортозамещение» надо очень сильно доплачивать, а так-же быть готовыми закрывать глаза на массу «это не бага, это фича».

Замечу также, что основным аргументов «импортозамещателей» по сути зачастую является наличие волшебной бумажки (сертификаций), но опять-же большинству понятно что все это является по сути профанацией.

Невозможно проверить (за обозримое время) на предмет ошибок или закладок программный код (миллионы строк) современного ядра Linux и всего типового окружения (на базе которого работают практически все «замещатели»), не говоря о массе дополнительного кода (ceph, openstack, virtuozzo и тд).

Только ядро Linux приблизилось к 20 миллионам строк кода.

image

Как показывает жизнь, практически все крупнейшие / скандальные дыры в программном коде Linux и типовых библиотек были обнаружены и исправлены не в РФ (включая heartbleed и прочее) — кому интересно, по сути можно взять и посмотреть когда были выпущены патчи к «русским линукс».

Учитывая что ceph и virtuozzo работают на уровне хоста / ядра ОС, это реально является серьезнейшей проблемой надежности и безопасности.

Итак, поехали. Пока — о базовых вещах.

Ceph + Openstack.

Единый продукт как таковой отсутствует, есть масса разрозненных проектов (компонентов Опенстак) в разном статусе — от достаточно качественной разработки до целиком заброшенных.

Ситуация напоминает «рак+лебедь+щука» — коммерческие провайдеры OS любой ценой стараются привязать клиента к своему решению, безболезненная миграция даже между продуктами одного вендора крайне тяжела, между различными — практически нереальна.

image

Основной гипервизор (и фактически единственный применимый для использования в случае ceph) — KVM.

В качестве SDS (программного хранения данных) — реальный вариант для использования — только ceph, отдельный opensource проект.

Теоретически можно использовать ESXi и HyperV через iSCSI, но на практике ввиду отсутствия поддержки VAAI / ODX это является как максимум лабораторным вариантом.

Как отступление, я искренне не понимаю как можно запускать любые проекты на ceph для серьезного применения — достаточно изучить баг-трекер.

Например, для последнего «стабильного» релиза Jewel — около 200 критичных (immediate, urgent, high) ошибок.

Все это мне очень напоминает хождение по минному полю.

Баг Тракер ceph

Напомню, что в конце 2016 года ceph.com «лежал» два дня ввиду падения хранилища на базе ceph. Весьма иронично.

image

Рассказы про то, как «мощные команды русских программистов» (обычно речь идет реально про максимум 3-10 человек) исправили все ошибки ceph и создали русский продукт — оставим на совести продавцов таких решений, но у грамотного IT специалиста должны возникнуть вопросы — почему сотни / тысячи разработчиков основного ceph «не смогли», но у микро-команд из РФ все получилось.

Технологически, в архитектуру заложена масса узких мест — выделенные сервера метаданных, крайне высокие требования к RAM и т.д.

Интересная и актуальная статья на эту тему (как надо устанавливать костыли):

Ceph RBD performance issues

Cудьба Openstack как проекта в целом тоже вызывает много вопросов.

Для начала — пара цитат из блога Мирантис (при том что в 2016 году они например внедряли Опенстак в крупнейшем банке РФ, уже прекрасно осознавая что OS реально «не жилец»):

"Infrastructure Software is Dead"

«Now I’d love to tell you that it’s all because Mirantis OpenStack software is so much better than everybody else’s OpenStack software, but I’d be lying. Everybody’s OpenStack software is equally bad. It’s also as bad as all the other infrastructure software out there – software-defined networking, software-defined storage, cloud management platforms, platforms-as-service, container orchestrators, you name it. It’s all full of bugs, hard to upgrade and a nightmare to operate. It’s all bad.»

На сегодняшний день, практически все ведущие «драйверы» отказались от развития — «Мирантис» уволил массу сотрудников из OpenStack подразделения и открыто признает, что надо уходить на микросервисы, HPE продали полностью подразделение, Rackspace как одна из икон опенстак-движения сделал делистинг с биржи — остался, пожалуй, только RedHat.

Далее поговорим о «бесплатности» таких решений.

Цена на поддержку коммерческого openstack в РФ — в среднем 4-5 тысяч $ (тех самых американских долларов) в год за каждый сервер.

Стоимость OpenStack

Это совпадает с тем, что нам называли в РФ наши клиенты, когда к ним приходил тот же «Мирантис», поэтому можем взять как базу для рассчетов.

Также всегда есть вариант нанять инженеров в свою команду, но для обеспечения нормального функционирования проекта обычно идет речь о нескольких десятках человек минимум — которым надо платить зарплаты. Дополнительная проблема — специалистов найти практически невозможно, даже те кто был (возьмем тот-же Мирантис) уже многие не в РФ (ввиду закрытия московского офиса).

Кстати, коммерческая поддержка openstack обычно не включает в себя поддержку ceph, за нее надо платить отдельно.

Сертификация решений — разброд и шатание, часть локализованных вариантов имеет сертификацию.

Стартовый ПАК — от 45 тысячи долларов США — минимум 6 серверов (3 под ceph, 3 под KVM и OS). Конфигурация реально лабораторная, для промышленного использования требуется разносить сервисы ceph.

Каждый сервер около 5$k (30$k за сервера), плюс поддержка OpenStack (около 5$k за сервер в год).

Virtuozzo / Росплатформа / СКАЛА-Р.

Parallels -> Virtuozzo — по сути, уважаемое, достаточно распространённое решение в узких кругах сервис-провайдеров, заточенное под конкретные задачи (обеспечение работы SP, обычно — недорогих массовых хостингов).

В качестве стека виртуализации ранее использовали свой гипервизор, но в 7-й версии приняли решение переходить на KVM, который при этом "работает на 40% быстрее чем обычный KVM" (сразу вспомнил рекламу про «обычный стиральный порошок :) „)

Частью решения является virtuozzo storage, он же “р-хранилище» — фактически распределенная СХД с массой ограничений (об этом ниже) и минимумом функционала, заточенная конкретно под нужды сервис-провайдинга, о чем упоминается в том числе в документации (на этом фоне крайне интересно позиционирование решения в РФ как универсального).

Готовый ПАК (программно-аппаратный комплекс) из 4-х простых серверов стартует минимально от 7.8 миллионов рублей (~130 тысяч долларов США — за импортозамещение надо платить)

«Cкала-Р» и «Росплатформа» — не совсем ясно, с официального сайта — «Безопасность продукта обеспечивается комплексом средств ИБ и готовностью к сертификации во ФСТЭК.»

Кстати, интересный момент о работе маркетологов в РФ — «Скала» это компьютер, который стоял на Чернобыльской АЭС и в целом участвовал в процессах контроля. Интересно, специально такое название выбрали?

Update: как и ожидалось, пришел представитель «Росплатформа» и начал утверждать, что все выводы неверные, документация старая, никакой связи с американской компанией (параллелс / виртуозо) не осталось.

Господин из «Росплатформа» видимо не в курсе, что у любого документа можно посмотреть PDF теги.

Итого — май 2017 года, документацию делают сотрудники Parallels и Virtuozzo, документация при этом конечно-же свежая.

image

image

image

Nutanix

Создатели рынка HCI / WebScale, лидеры по продажам, масса реализованных проектов практически в любых индустриях.

Как уже писал выше, более половины крупнейших мировых компаний (из Global 100) уже используют Nutanix.

Сертификация в РФ возможна, существуют процедуры, как минимум для одного из крупнейших проектов в РФ был получен ФСТЭК на «периметр».

Получены практически все ключевые сертификации безопасности в мире.

Готовый ПАК в РФ стартует от 35 тысяч долларов США, минимум 3 сервера.

Фактически, вся основная инфографика приложена:
image



Основной технический функционал был собран в сравнительную таблицу, которую в том числе я давал на рассмотрение в «Росплатформа» и IBS. Комментарии они делать отказались, хотя поначалу проявили интерес.

Таблицу по OpenStack + ceph сверял с представителями OpenStack и ceph коммьюнити в РФ.

Говорим только о стабильном функционале, никаких «бета версий» и «технических превью».

В таблице могут быть неточности или ошибки, пишите в комментариях — обязательно или поправим или объясним.

Есть ли какие-то выводы? Их я делать не буду, делайте сами. Информация у вас есть.

СКАЛА-Р / Росплатформа
/ Virtuozzo
Nutanix CEPH + OpenStack
Программная архитектура
В случае работы на уровне хоста / ядра ОС,
потенциальные проблемы безопасности
и отказоустойчивости.
Ядро / хост Изолированный виртуальный контроллер Ядро / хост
“Заточенность” решения Сервис провайдеры Энтерпрайз (корпорации),
правительственные службы,
военные, медицина,
промышленность,
ресурсодобывающие компании,
финансовые структуры.
Сервис провайдеры
HCI (гиперконвергентное) решение.
Дата сервисы и виртуализация
работают на серверах
одновременно.
да да нет
Отсутствие узких мест / точек
отказа (централизованные сервисы,
например cервера метаданных
или сервера управления)
нет да нет
STIG политики (Security Technical Implementation Guide) Отсутствуют, рекомендация производителя — ручной поиск rootkit и обнаружение взломов да Отсутствуют, есть масса разрозненных рекомендаций и методик
Расположение компании, разрабатывавшей основную часть ПО США
(Parallels -> Virtuozzo -> Росплатформы->”СКАЛА-Р”)
США США (основная разработка), производится множеством компаний.
Публично доступны полные исходные коды
Встроенный полноценный мониторинг (все аппаратные и программные компоненты) и самодиагностика Частично,
Скала-Р применяет дополнительные средства мониторинга
да Частично
Интеллектуальный автоматический Data Tiering — перемещение блоков данных между холодным и горячими уровнями в случае изменения частоты запросов к этим данным (“нагрев” или “охлаждение”) нет да нет
Встроенный портал самообслуживания нет да да
Локализация данных VM (data locality) — активные данные VM находятся на том-же сервере где работает виртуальная машина.
Кардинальное ускорение операций чтения и снижение нагрузки на сеть в разы.
нет да нет
Репликация на уровне VM нет да нет
Восстановление целостности данных Ручной запуск в случае потери крупного домена Автоматический старт Автоматический старт
Дедупликация данных нет да нет
Компрессия данных нет да нет
Erasure Code (помехоустойчивое кодирование) нет да да
Поддержка All Flash нет да да
Микс All Flash и Hybrid в едином кластере нет да да
Обработка отказов SSD дисков с метаданными Временная потеря части узлов с данными и долгое восстановление Автоматическая отработка, не влияет на производительность кластера, все узлы с данными продолжают работу Автоматическая отработка, может влиять на производительность кластера
Поддержка VAAI и ODX (протоколы «разгрузки» операций ввода-вывода на систему хранения данных) нет да нет
Поддержка Application Consistent Snapshots (провайдер VSS для Windows Server и имплементация для Linux) нет да нет
Неограниченное количество снапшотов VM, без влияния на производительность и возможностью манипуляций (в т.ч. удаления) снапшотов на любом уровне нет да нет
Теневые клоны (shadow disk) — создание локальной копии дисков VM для кардинальной акселерации загрузки и работы нет да нет
Встроенный бэкап на Amazon / Azure нет да нет
Наличие Best Practice для ключевых типовых приложений (Oracle RAC, MSSQL, Postgres, SAP NetWeaver, MongoDB, Microsoft Exchange, Cisco Unified Communications и другие) нет да нет
Распределенный отказоустойчивый cтек управления (management plane) без использования централизованных баз данных нет да нет
Не требуются выделенные сервера управления нет да нет
Автоматические апгрейды аппаратных прошивок (биос, прошивки дисков и флеш, контроллеры и тд) нет да нет
Прозрачное обновление без перезапуска клиентских сервисов при смене основной версии ПО нет да да
Поддержка гипервизоров KVM (несертифицированные патчи), Virtuozzo (устарел, в новой версии перешли на KVM) AHV (KVM совместим, сертифицирован Microsoft, SAP и другими), XenServer, vSphere, HyperV KVM

Возможно использование vSphere и HyperV с подключением через iSCSI, не рекомендуется для продуктива ввиду отсуствия поддержки VAAI / ODX.

Не является HCI решением.
Поддержка основных стеков виртуализации рабочих мест (VDI) – Citrix, VMware нет Citrix, VMware, Workspot и другие нет
Возможность запуска Microsoft Windows Server с полной поддержкой от Microsoft (SVVP — Server Virtualization Validation Program) Нет, SVVP сертификация присутствует для старой версии американского продукта с другим гипервизором.
Виртуализация Windows Server — на свой страх и риск
Полная SVVP сертификация Есть для RedHat OpenStack и Canonical (Ubuntu) OpenStack, отсутствует для большинства других вариантов.
Контейнерная виртуализация Virtuozzo Docker Docker, LXD
Встроенные бэкапы (без применения стороннего ПО) с пофайловым восстановлением и самообслуживанием нет да нет
Метро кластер (распределённый гео-кластер с синхронной репликацией данных) нет да нет
Встроенная поддержка аварийного мульти-цод восстановления (many to many DR) нет да нет
Поддержка кросс-гипервизорного DR нет да нет
Автоматическая конвертация гипервизора и всех VM на кластере (например, ESXi->AHV/KVM) нет да нет
Встроенный SDN стек с интеграцией в аппаратное сетевое обеспечение нет да да
Поддержка Affinity / Anti-Affinity, для
оптимизации лицензирования ПО.
При отсутствии поддержки
необоснованные лицензионные
затраты могут составлять
миллионы долларов
нет да да
Поддержка RESTful API (стандарт индустрии) нет да да
Бесплатный апгрейд ПО на
новые версии (минорные и глобальные
обновления версий) при наличии
действующей базовой техподдержки
Скала-Р — платно
Росплатформа — бесплатно
Virtuozzo — платно
да да
Ценообразование (для РФ) на готовые коммерческие решения (ПАК — программно аппаратный комплекс) Стартовая цена от 136000$

Кластер минимум из 4-х узлов
Стартовая цена от 35000$

Кластер минимум из 3-х узлов
Стартовая цена от 45000$

Необходимый минимум:
3 сервера ceph, 3 сервера виртуализации, ~5$k в год за каждый сервер виртуализации (поддержка OpenStack). Поддержка ceph не учтена.
Рейтинг удовлетворенности клиентов работой компании Не опубликовано 95%, NPS score 92 Не применимо, масса вендоров
-4
12.8k 37
Comments 93
Top of the day