Организация многомерной модели данных
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

В основе многомерной модели данных лежит понятие многомерной матрицы [3, 4]. В связи с тем, что терминология теории многомерных матриц является достаточно устоявшейся и общепринятой, желательно, чтобы терминология OLAP-систем и многомерных баз данных согласовывалась с теорией многомерных матриц.

Под многомерной моделью данных в OLAP-системе будем понимать организацию данных в виде многомерной матрицы, или, иначе, в виде гиперпрямоугольника. Случай гиперквадрата (гиперкуба по терминологии работы [1]) является скорее исключением, чем правилом. Для организации гиперпрямоугольника данных необходимо определить оси координат (индексы) -мерного пространства и данные, располагаемые в узлах сетки гиперпрямоугольника. Значения индексов будем называть также метками на осях координат. Значению  мультииндекса будет соответствовать упорядоченный по осям набор меток. Оси выбираются таким образом, чтобы значение мультииндекса однозначно определяло данные. Данные чаще всего представляет собой строки, аналогичные строкам реляционной таблицы данных, так что мультииндекс является составным ключом этой таблицы. Выбор осей осуществляется для каждой подсистемы OLAP-системы на интуитивном уровне и не представляет трудностей. При описанном способе построения модели данных не нужно выполнять нормализацию таблиц данных, что существенно упрощает процесс проектирования многомерной базы данных по сравнению с реляционной.

При организации осей их наименования можно использовать в качестве начальных значений индексов (начальных меток осей). В этом случае значение  мультииндекса (начало координат) будет указывать на наименования осей, и физически многомерная модель данных будет состоять их двух файлов, один из которых определяет оси с их наименованиями, а другой – данные, соответствующие этим осям.

OLAP-системы, использующие многомерную модель данных, получили название MOLAP-систем, в отличие от ROLAP-систем, использующих реляционную модель данных.

Кроме задач аналитической обработки данных (расчет статистических характеристик, прогнозирование и др.) в MOLAP необходимо решать вопросы манипулирования данными: ввод или загрузка данных, отображение данных (формирование текстовых отчетов), удаление данных. В свою очередь эти операции связаны с такими операциями, как формирование сечений и вращение.

В MOLAP-системе можно организовать ввод данных в интерактивном режиме. Однако в системах, предназначенных для обработки больших объемов данных, это вряд ли целесообразно. Чаще всего данные хранятся в реляционных базах данных, электронных таблицах или в текстовых файлах. В этом случае следует организовать автоматический импорт данных из этих источников. Поскольку эти источники представляют собой двухмерные массивы данных, которые могут быть помещены в определенные двухмерные сечения гиперпрямоугольника, то необходимо формировать сечения в соответствии с определением сечения, приведенным выше, т.е. путем выбора определенных меток осей.

Формирование текстовых отчетов состоит в отображении на бумагу (на плоскость) информации, содержащейся в гиперпрямоугольнике. Это можно сделать путем формирования двухмерной матрицы , -ассоциированной с имеющейся -мерной матрицей . Целесообразно, например, использовать матрицу , -ассоциированную с -мерной матрицей .

Большое разнообразие отчетов можно получить путем вращения данных. Операция вращения представляет собой не что иное, как операцию транспонирования многомерной матрицы в соответствии с некоторой подстановкой, и определяется формулой (3). Важно иметь в виду, что при выполнении операции транспонирования имеющегося гиперпрямоугольника данных необходимо также соответствующим образом переформировать имеющиеся данные. Отчет формируется после выполнения операции вращения.

 

Дата: 2019-02-02, просмотров: 338.