Что такое онлайн-аналитическая обработка?
Онлайн-аналитическая обработка (OLAP) — это программная технология, которую можно использовать для анализа бизнес-данных с разных точек зрения. Организации собирают и хранят данные из нескольких источников данных, таких как веб-сайты, приложения, интеллектуальные счетчики и внутренние системы. OLAP объединяет и группирует эти данные по категориям, чтобы обеспечить практическую информацию для стратегического планирования. Например, розничный торговец хранит данные обо всех продаваемых товарах, такие как цвет, размер, стоимость и местоположение. Розничный торговец также собирает данные о покупках клиентов, такие как название заказанных товаров и общая стоимость продаж, в другой системе. OLAP объединяет наборы данных, чтобы ответить на такие вопросы, как цветные продукты более популярны или как размещение продукта влияет на продажи.
Почему OLAP играет такую важную роль?
Онлайн-аналитическая обработка (OLAP) помогает организациям обрабатывать растущий объем цифровой информации и извлекать из нее выгоду. Некоторые преимущества OLAP включают следующее.
Возможность принимать более обоснованные решения
Предприятия используют OLAP для принятия быстрых и точных решений, чтобы оставаться конкурентоспособными в быстро меняющейся экономической ситуации. Выполнение аналитических запросов к нескольким реляционным базам данных занимает много времени, поскольку компьютерная система выполняет поиск по нескольким таблицам данных. С другой стороны, системы OLAP предварительно рассчитывают и интегрируют данные, чтобы бизнес-аналитики могли быстрее создавать отчеты при необходимости.
Нетехническая поддержка пользователей
Системы OLAP упрощают комплексный анализ данных для нетехнических бизнес-пользователей. Бизнес-пользователи могут создавать сложные аналитические расчеты и создавать отчеты вместо того, чтобы учиться работать с базами данных.
Интегрированное представление данных
OLAP предоставляет унифицированную платформу для маркетинговых, финансовых, производственных и других бизнес-подразделений. Руководители и лица, принимающие решения, могут видеть общую картину и эффективно решать проблемы. Они могут проводить анализ «что если», который показывает влияние решений, принятых одним отделом, на другие области бизнеса.
Что такое архитектура OLAP?
Системы онлайн-аналитической обработки (OLAP) хранят многомерные данные, представляя информацию более чем в двух измерениях или категориях. Двумерные данные включают столбцы и строки, но многомерные данные имеют множество характеристик. Например, многомерные данные о продажах продукции могут состоять из указанных ниже измерений.
- Тип продукта
- География
- Время
Инженеры по обработке данных создают многомерную систему OLAP, состоящую из указанных ниже элементов.
Хранилище данных
Хранилище данных собирает информацию из разных источников, включая приложения, файлы и базы данных. Оно обрабатывает информацию с помощью различных инструментов, чтобы данные были готовы к аналитическим целям. Например, хранилище данных может собирать информацию из реляционной базы данных, в которой данные хранятся в таблицах строк и столбцов.
Инструменты ETL
Инструменты извлечения, преобразования и загрузки (ETL) – это процессы базы данных, которые автоматически извлекают, изменяют и подготавливают данные к формату, подходящему для аналитических целей. Хранилища данных используют ETL для преобразования и стандартизации информации из различных источников перед тем, как сделать ее доступной для инструментов OLAP.
Сервер OLAP
Сервер OLAP – это базовая машина, которая питает систему OLAP. Он использует инструменты ETL для преобразования информации в реляционных базах данных и подготовки их к операциям OLAP.
База данных OLAP
База данных OLAP – это отдельная база данных, которая подключается к хранилищу данных. Инженеры по обработке данных иногда используют базу данных OLAP, чтобы предотвратить нагрузку на хранилище данных анализом OLAP. Они также используют базу данных OLAP для упрощения создания моделей данных OLAP.
Кубы OLAP
Куб данных – это модель, представляющая многомерный массив информации. Хотя визуализировать его в виде трехмерной модели данных проще, большинство кубов данных имеют более трех измерений. Куб OLAP или гиперкуб – это термин для кубов данных в системе OLAP. Кубы OLAP являются жесткими, поскольку вы не можете изменить их параметры и базовые данные после моделирования. Например, если вы добавляете измерение хранилища в куб с измерениями продукта, местоположения и времени, вам придется переделать весь куб.
Аналитические инструменты OLAP
Бизнес-аналитики используют инструменты OLAP для взаимодействия с кубом OLAP. Они выполняют такие операции, как нарезка, нарезка в виде кубов и поворотные операции для получения более глубокого понимания конкретной информации в OLAP-кубе.
Как работает OLAP?
Как работает OLAP?
Онлайн-система аналитической обработки (OLAP) работает путем сбора, организации, агрегирования и анализа данных с использованием указанных ниже шагов.
- Сервер OLAP собирает данные из нескольких источников данных, включая реляционные базы данных и хранилища данных.
- Затем инструменты извлечения, преобразования и загрузки (ETL) очищают, агрегируют, предварительно рассчитывают и сохраняют данные в кубе OLAP в соответствии с указанным количеством измерений.
- Бизнес-аналитики используют инструменты OLAP для запроса и создания отчетов на основе многомерных данных в кубе OLAP.
OLAP использует многомерные выражения (MDX) для запроса куба OLAP. Многомерные выражения – это запрос, подобно SQL, который предоставляет набор инструкций для работы с базами данных.
Какие виды OLAP существуют?
Системы онлайн-аналитической обработки (OLAP) работают по трем основным направлениям.
MOLAP
Многомерная онлайн-аналитическая обработка (MOLAP) включает создание куба данных, представляющего многомерные данные из хранилища данных. Система MOLAP хранит предварительно рассчитанные данные в гиперкубе. Инженеры по обработке данных используют MOLAP, потому что этот тип технологии OLAP обеспечивает быстрый анализ.
ROLAP
Вместо использования куба данных реляционная онлайн-аналитическая обработка (ROLAP) позволяет инженерам данных выполнять многомерный анализ данных в реляционной базе данных. Другими словами, инженеры по обработке данных используют SQL-запросы для поиска и извлечения конкретной информации на основе требуемых измерений. ROLAP подходит для анализа обширных и подробных данных. Однако ROLAP имеет более низкую производительность запросов по сравнению с MOLAP.
HOLAP
Гибридная онлайн-аналитическая обработка (HOLAP) сочетает MOLAP и ROLAP, чтобы обеспечить лучшее из обеих архитектур. HOLAP позволяет инженерам по обработке данных быстро извлекать аналитические результаты из куба данных и подробную информацию из реляционных баз данных.
Что такое моделирование данных в OLAP?
Моделирование данных – это представление данных в хранилищах данных или базах данных онлайн-аналитической обработки (OLAP). Моделирование данных имеет важное значение для реляционной онлайн-аналитической обработки (ROLAP), поскольку оно анализирует данные прямо из реляционной базы данных. Она хранит многомерные данные в виде звезды или снежинки.
Схема «звезда»
Схема «звезда» состоит из таблицы фактов и нескольких таблиц измерений. Таблица фактов – это таблица данных, содержащая числовые значения, относящиеся к бизнес-процессу, а таблица измерений содержит значения, описывающие каждый атрибут в таблице фактов. Таблица фактов относится к таблицам измерений с внешними ключами – уникальными идентификаторами, которые коррелируют с соответствующей информацией в таблице измерений.
В схеме «звезда» таблица фактов соединяется с несколькими таблицами измерений, поэтому модель данных выглядит как звезда. Ниже приведен пример таблицы фактов о продажах продукции:
- Идентификатор продукта
- Идентификатор местоположения
- Идентификатор продавца
- Сумма продаж
Идентификатор продукта указывает системе базы данных получить информацию из таблицы аналитик продукта, которая может выглядеть указанным ниже образом.
- Идентификатор продукта
- Название продукта
- Тип продукта
- Себестоимость продукта
Аналогичным образом идентификатор местоположения указывает на таблицу измерений местоположения, которая может состоять из указанных ниже элементов.
- Идентификатор местоположения
- Страна
- Город
Таблица salesperson может выглядеть указанным ниже образом.
- Идентификатор продавца
- Имя
- Фамилия
- Электронная почта
Схема «снежинка»
Схема «снежинка» является продолжением схемы звезды. Некоторые таблицы измерений могут привести к появлению одной или нескольких дополнительных таблиц измерений. В результате получается форма снежинки при сборке таблиц размеров.
Например, таблица аналитик продукта может содержать указанные ниже поля.
- Идентификатор продукта
- Название продукта
- Идентификатор типа продукта
- Себестоимость продукта
Идентификатор типа продукта соединяется с другой таблицей измерений, как показано в следующем примере.
- Идентификатор типа продукта
- Имя типа
- Версия
- Вариант
Что такое операции OLAP?
Бизнес-аналитики выполняют несколько основных аналитических операций с помощью куба многомерной онлайн-аналитической обработки (MOLAP).
Сводный вид
В сводном виде система онлайн-аналитической обработки (OLAP) суммирует данные по конкретным атрибутам. Другими словами, в таком случае показываются менее подробные данные. Например, вы можете просмотреть продажи товаров по Нью-Йорку, Калифорнии, Лондону и Токио. Операция свертывания предоставит представление данных о продажах на основе таких стран, как США, Великобритания и Япония.
Детализация
Детализация противоположна операции свертывания. Бизнес-аналитики продвигаются вниз в иерархии концепций и извлекают необходимые им детали. Например, они могут перейти от просмотра данных о продажах по годам к их визуализации по месяцам.
Система слайсов
Инженеры по обработке данных используют систему слайсов для создания двумерного представления из куба OLAP. Например, куб MOLAP сортирует данные по продуктам, городам и месяцам. Создавая слайсы, инженеры по обработке данных могут создать таблицу в виде электронной таблицы, состоящую из продуктов и городов за определенный месяц.
Система кубов
Инженеры по обработке данных используют систему кубов для создания меньшего куба из куба OLAP. Они определяют необходимые размеры и строят куб меньшего размера из исходного гиперкуба.
Разворот
Операция разворота включает поворот куба OLAP вдоль одного из его измерений для получения другого взгляда на многомерную модель данных. Например, трехмерный куб OLAP имеет указанные ниже размеры по соответствующим осям.
- Ось X – продукт
- Ось Y – местоположение
- Ось Z – время
После разворота куб OLAP имеет указанную ниже конфигурацию.
- Ось X – местоположение
- Ось Y – время
- Ось Z – продукт
Как OLAP сравнивается с другими методами анализа данных?
Интеллектуальный анализ данных
Интеллектуальный анализ данных – это аналитическая технология, которая обрабатывает большие объемы исторических данных для поиска закономерностей и идей. Бизнес-аналитики используют инструменты интеллектуального анализа данных для выявления взаимосвязей в данных и точного прогнозирования будущих тенденций.
OLAP и интеллектуальный анализ данных
Онлайн-аналитическая обработка (OLAP) – это технология анализа баз данных, которая включает запросы, извлечение и изучение обобщенных данных. С другой стороны, интеллектуальный анализ данных предполагает глубокое изучение необработанной информации. Например, маркетологи могут использовать инструменты интеллектуального анализа данных для анализа поведения пользователей на основе записей о каждом посещении веб-сайта. Затем они могут использовать программное обеспечение OLAP для проверки такого поведения с разных сторон, таких как продолжительность, устройство, страна, язык и тип браузера.
OLTP
Онлайн-обработка транзакций (OLTP) – это технология обработки данных, которая быстро и надежно хранит информацию в базе данных. Специалисты по обработке данных используют инструменты OLTP для хранения транзакционных данных, таких как финансовые отчеты, подписки на сервисы и отзывы клиентов, в реляционной базе данных. Системы OLTP включают создание, обновление и удаление записей в реляционных таблицах.
OLAP и OLTP
OLTP отлично подходит для обработки и хранения нескольких потоков транзакций в базах данных. Однако в таком случае нельзя выполнять сложные запросы из базы данных. Поэтому бизнес-аналитики используют систему OLAP для анализа многомерных данных. Например, специалисты по обработке данных подключают базу данных OLTP к облачному кубу OLAP для выполнения ресурсоемких запросов к историческим данным.
Как AWS помогает с OLAP?
Базы данных AWS предоставляют различные управляемые облачные базы данных, помогающие организациям хранить и выполнять операции онлайн-аналитической обработки (OLAP). Аналитики данных используют базы данных AWS для создания безопасных баз данных, соответствующих требованиям их организации. Организации переносят свои бизнес-данные в базы данных AWS из-за доступности и масштабируемости.
- Amazon Redshift – это облачное хранилище данных, разработанное специально для аналитической онлайн-обработки.
- Служба реляционных баз данных Amazon (Amazon RDS) – это реляционная база данных с функциональностью OLAP. Инженеры по обработке данных используют Amazon RDS с Oracle OLAP для выполнения сложных запросов к размерным кубам.
- Amazon Aurora – это облачная реляционная база данных, совместимая с MySQL и PostgreSQL. Эта система оптимизирована для выполнения сложных рабочих нагрузок OLAP.
Создайте учетную запись AWS и начните работу с технологией OLAP уже сегодня.
Онлайн-аналитическая обработка: дальнейшие шаги
Получите мгновенный доступ к уровню бесплатного пользования AWS.