Обновить

Data Mart vs Data Warehouse

Чулан
Некоторое время назад я начал разбираться в OLAP и в данном посте хочу проверить правильность собственных мыслей на счет этих двух понятий.

Терминология
Data Mart — витрина данных, в переводе.
Data Warehouse — хранилище данных.
Но дело в том, что оба эти термина могут переводится как Хранилище данных…
Data Mart — срез Data Warehouse.

image
(кликабельно)
Есть два подхода к построению хранилищ данных:
Первый проще, по Кимбелу (Kimball)
image
Тут информация от OLTP системы напрямую попадает в data mart, откуда уже OLAP берет необходимые ему данные. Первый случай очевидно иллюстрирует подход М. Демареста (M.Demarest), который, как говорит Wikipedia:
в 1994 году предложил объединить две концепции и использовать хранилище данных в качестве единого интегрированного источника данных для витрин данных.

Второй, по Инману (Inman), см. книгу.
image
Здесь информация от OLTP сначала попадает в хранилище данных (data warehouse), потом только в data mart, откуда OLAP снова берет необходимую ему информацию.

Мы же адаптируем подход Инмана, который называет хранилищем данных настоящую релиционную бд, тогда как Кимбел — смесь data mart`ов.
Data mart — это база данных, созданная по требованиям моделирования измерений (dimensional modelling) и состоит из таблиц фактов и таблиц измерений.

Data Mart
При реализации системы по методологии Кимбела, фронтендом бд должен выступать data mart, который использует Analysis Services для куба в качестве источника данных
Data Warehouse
image
(кликабельно)
таким образом является сложнее data mart`a, включает в себя не только бд, но и систему поддержки принятия решений и клиент-серверную архитектуру, тогда как data mart по сути является бд, созданной с учетом требований будущих кубов.
Источники:
http://ru.wikipedia.org/wiki/Витрина_данных
http://ru.wikipedia.org/wiki/Хранилище_Данных
Книга Expert Cube Development with Microsoft SQL Server 2008 Analysis Services, на английском

image
которую я перевожу у себя в блоге.
Теги:OLAPdata warehousedata martхранилище данныхвитрина данныхanalysis services
Хабы: Чулан
Рейтинг 0
Количество просмотров 10,3k Добавить в закладки 8
Комментарии
Комментарии 2

Похожие публикации

Business System Analyst (Data Warehouse)
от 3 000 €ExnessЛимассолМожно удаленно
Начальник аналитического отдела (data science)
от 80 000 ₽ТФОМС Свердловской областиЕкатеринбург
Администратор баз данных SQL
от 100 000 ₽Сима-лендЕкатеринбург
Data Engineer
от 200 000 до 300 000 ₽HighTeamМосква
Data Engineer
от 2 000 $MixRankМожно удаленно

Лучшие публикации за сутки