SAP corporate blog
Big Data
October 2018 15

SAP Data Management Suite как комплекс для работы с Big Data в компаниях

В этом году на конференции SAPPHIRE NOW мы показали новый комплекс решений для работы с большими данными – SAP HANA Data Management Suite. Ранее во многих наших материалах фигурировало название SAP Business Suite – сегодня же мы попробуем немного объяснить, что такое Data Management Suite и зачем он вообще появился в портфолио решений SAP.

Если раньше при разработке решений для управления ресурсами предприятия SAP ориентировался на реализацию стандартных бизнес-процессов (именно так создавался Business Suite), то теперь акцент сместился на управление данными. Для этого нужна специальная платформа – мощная, функциональная, но также гибкая и адаптируемая. Чтобы превратить данные в бизнес-решения или аналитику, сначала необходимо привести их в порядок. Обычно за словом «большие данные» стоит большой объём многообразной, несогласованной информации, поступающей из разных источников и в колоссальных объёмах.

SAP Data Management Suite – это инструмент, который помогает выстраивать процесс управления данными в корпорации. Но также это и платформа для корпоративных бизнес-приложений, которые используют данные компании.



SAP HANA – это ядро архитектуры. С одной стороны, это аналитическое хранилище, которое позволяет предоставлять доступ ко всем корпоративным данным – в том числе и с использованием мульти-температурного хранения данных.

Также SAP HANA может выступать платформой для создания бизнес-приложений, работающих с корпоративными данными. В этом случае HANA предоставляет вам следующий набор функций:

  • сервер приложений
  • инструменты для управления жизненным циклом решений
  • инструменты анализа текста
  • возможность для работы с гео-данными
  • интегрированный математический функционал, который необходим для создания предиктивных моделей и моделей машинного обучения
  • IoT-коннекторы

В результате вы получаете набор инструментов для создания собственного инновационного решения.



Концепция Data Management Suite была анонсирована совсем недавно. Но множество наших клиентов по всему миру и практически во всех отраслях экономики уже используют платформу HANA для реализации различных сценариев. Вот некоторые из них:

  • SAP HANA как высокопроизводительная база данных для приложений SAP, которая совмещает в себе как транзакционные так и аналитические возможности, вычисления в оперативной памяти и позволяет существенно упростить архитектуру решения;
  • SAP HANA как база данных для решений, созданных нашими партнерами (например, Upstream Field Asset Management);
  • Аналитическое хранилище данных. Для этого в HANA есть интеграционные инструменты платформы, быстрота обработки аналитических запросов в оперативной памяти, возможности мульти-температурного хранения данных;
  • Приложения для работы с гео-данными (например, решения по управлению городскими коммуникациями – водоснабжения или канализации, а также решения для сельхозпроизводителей);
  • Для разработки решений с использованием машинного обучения. В платформе HANA есть встроенные предиктивные библиотеки, а также возможности для интеграции языка программирования R, использования TensorFlow. Примеры подобных решений: модели прогнозирования финансовых показателей, управления качеством продукции, прогнозирование ремонтов оборудования;
  • SAP HANA как платформа для разработки IoT-решений. Например, в партнерстве с компанией OSIsoft были разработаны коннекторы, которые позволяют получать и обрабатывать информацию от различных датчиков или сенсоров.

Второй элемент архитектуры – это SAP Data Hub. HANA умеет получать данные из разных источников, но для управление всеми корпоративными данными – а это большой массив информации из разных источников, включая различные производственные системы, Hadoop, сторонние корпоративные хранилища данных – необходимо мощное промышленное ETL-решение.

SAP Data Hub – это комплекс, в котором сосредоточены все связанные задачи: извлечение данных, обработка, преобразование, обогащение, передача данных сервисам-«потребителям». В сервисе есть простой графический интерфейс для построения потоков данных, что помогает управлять сложной инфраструктурой.

Основные направления использования Data Hub:

  • Сценарии для интернета вещей. SAP Data Hub помогает обрабатывать огромные потоки информации, которые поступают с датчиков и хранятся в распределенных системах. Также он позволяет выстроить процесс обработки сырых данных, приведение их к единому формату и уровням агрегации.
  • Решения с использованием Machine Learning. В этом случае мы всегда сталкиваемся с большим количеством данных, как правило, хранимых в Hadoop. В SAP Data Hub есть инструменты для автоматизации процесса вызова и обработки данных их хранилища.
  • Для построения интегрированного хранилища больших данных, в архитектуре которого предусмотрено множество источников данных с различной структурой и скоростью работы

Следующий важный элемент платформы управления корпоративными данными – это средства обработки и хранения Big Data. Для разработки решений с использованием больших данных необходимо иметь не только системы для распределенного хранения структурированных или неструктурированных данных (мы предоставляем такие PaaS-решения на облачной платформе SCP), но также чтобы обеспечить поступление и потоковую обработку этих данных (здесь помогают IoT-сервисы SCP).

Наконец, для быстрого запуска новых решений в продуктивную эксплуатацию в SAP Data Management Suite есть инструмент – Enterprise Architecture Designer. Это приложение для разработки корпоративной ИТ-архитектуры, которое позволяет выстроить оптимальные бизнес-процессы и архитектуру информационных систем, удовлетворяющую тербованиям IT подразделений и бизнеса.

В следующих статьях мы расскажем об отдельных решениях, которые входят в комплекс SAP Data Management Suite.
+6
1.5k 6
Comments 1