В чем разница между системами OLAP и OLTP?

Аналитическая обработка онлайн (OLAP) и обработка транзакций онлайн (OLTP) – это системы обработки данных, которые помогают хранить и анализировать бизнес-данные. Можно собирать и хранить данные из нескольких источников, таких как веб-сайты, приложения, интеллектуальные счетчики и внутренние системы. OLAP объединяет и группирует данные, чтобы вы могли анализировать их с разных точек зрения. OLTP надежно и эффективно хранит и обновляет большие объемы транзакционных данных. Базы данных OLTP могут быть одним из источников данных для системы OLAP.

Подробнее об OLAP »

В чем сходство между системами OLAP и OLTP?

Как аналитическая обработка онлайн (OLAP), так и обработка транзакций онлайн (OLTP) представляют собой системы управления базами данных для хранения и обработки больших объемов данных. Для бесперебойной работы им требуется эффективная и надежная ИТ-инфраструктура. Их можно использовать как для запроса существующих данных, так и для хранения новых данных. Обе системы поддерживают принятие решений на основе данных в организации.

Большинство компаний используют системы OLTP и OLAP вместе для удовлетворения своих требований к бизнес-аналитике. Однако подход к управлению данными и его цель существенно различаются в OLAP и OLTP.

Ключевые отличия: OLAP и OLTP

Основная цель аналитической обработки онлайн (OLAP) – анализ объединенных данных, а основная цель обработки транзакций онлайн (OLTP) – обработка транзакций базы данных.

Вы используете системы OLAP для создания отчетов, выполнения сложного анализа данных и выявления тенденций, а системы OLTP – для обработки заказов, обновления запасов и управления счетами клиентов.

Другие существенные отличия включают форматирование данных, архитектуру данных, производительность и требования. Мы также рассмотрим пример того, когда организация может использовать OLAP, а когда – OLTP.

Форматирование данных

Системы OLAP используют многомерные модели данных, поэтому одни и те же данные можно просматривать под разными углами. Базы данных OLAP хранят данные в формате куба, где каждое измерение представляет собой отдельный атрибут данных. Каждая ячейка куба представляет собой значение или меру пересечения измерений.

В отличие от них, системы OLTP являются одномерными и сосредоточены на одном аспекте данных. Они используют реляционную базу данных для организации данных в таблицы. Каждая строка таблицы представляет инстанс сущности, а каждый столбец – атрибут сущности.

Архитектура данных

Архитектура базы данных OLAP отдает приоритет операциям чтения, а не записи данных. Вы можете быстро и эффективно выполнять сложные запросы к большим объемам данных. Доступность – второстепенная проблема, поскольку основным вариантом использования является аналитика.

С другой стороны, архитектура базы данных OLTP отдает приоритет операциям записи данных. Он оптимизирован для рабочих нагрузок с большим объемом записи и может обновлять высокочастотные транзакционные данные большого объема без ущерба для целостности данных.

Например, если два клиента покупают один и тот же товар одновременно, система OLTP может точно регулировать уровень запасов и при этом будет отдавать приоритет хронологически первому покупателю, если товар оказывается последний на складе. Доступность является высоким приоритетом и обычно достигается за счет многократного резервного копирования данных.

Производительность

Время обработки OLAP может варьироваться от минут до часов в зависимости от типа и объема анализируемых данных. Чтобы обновить базу данных OLAP, вы периодически обрабатываете данные большими партиями, а затем сразу загружаете пакет в систему. Частота обновления данных также варьируется в зависимости от системы: от ежедневного до еженедельного или даже ежемесячного.

В отличие от этого, время обработки OLTP измеряется в миллисекундах или меньше. Базы данных OLTP управляют обновлениями баз данных в реальном времени. Обновления быстрые, короткие и инициируются вами или вашими пользователями. Часто используется потоковая обработка вместо пакетной.

Подробнее о потоковых данных»

Подробнее о пакетной обработке »

Требования

Системы OLAP действуют как централизованное хранилище данных и извлекают данные из нескольких хранилищ данных, реляционных баз данных и других систем. Требования к хранению данных варьируются от терабайтов (ТБ) до петабайтов (ПБ). Чтение данных также может быть сопряжено с большими вычислительными ресурсами и требует высокопроизводительных серверов.

В отличие от этого, требования к хранению данных OLTP можно измерять в гигабайтах (ГБ). Базы данных OLTP также можно очистить после загрузки данных в соответствующее хранилище данных OLAP или озеро данных. Однако требования к вычислительным ресурсам для OLTP также высоки.

Пример системы OLAP в сравнении с OLTP

Давайте рассмотрим крупную розничную компанию, которая управляет сотнями магазинов по всей стране. У компании есть огромная база данных, которая отслеживает продажи, запасы, данные о клиентах и другие ключевые показатели.

Компания использует OLTP для обработки транзакций в реальном времени, обновления уровней запасов и управления счетами клиентов. Каждый магазин подключен к центральной базе данных, которая обновляет уровни запасов в реальном времени по мере продажи товаров. Компания также использует OLTP для управления счетами клиентов, например, для отслеживания баллов лояльности, управления платежной информацией и обработки возвратов.

Кроме того, компания использует OLAP для анализа данных, собранных OLTP. Бизнес-аналитики компании могут использовать OLAP для создания отчетов о тенденциях продаж, уровне запасов, демографических характеристиках клиентов и других ключевых показателях. Они выполняют сложные запросы к большим объемам исторических данных для выявления закономерностей и тенденций, которые могут помочь в принятии бизнес-решений. Они определяют популярные продукты в определенный период времени и используют эту информацию для оптимизации бюджета запасов.

Когда использовать OLAP, а когда – OLTP

Аналитическая обработка онлайн (OLAP) и обработка транзакций онлайн (OLTP) – это две разные системы обработки данных, предназначенные для разных целей. OLAP подходит для комплексного анализа данных и составления отчетов, а OLTP – для обработки транзакций и обновлений в режиме реального времени.

Понимание различий между этими системами поможет вам принять обоснованные решения о том, какая система лучше соответствует вашим потребностям. Во многих случаях сочетание систем OLAP и OLTP может быть лучшим решением для предприятий, которым требуется как обработка транзакций, так и анализ данных. В конечном итоге выбор подходящей системы зависит от конкретных потребностей вашего бизнеса, включая объем данных, сложность запросов, время отклика, масштабируемость и стоимость.

Пример архитектуры с использованием сервисов, управляемых AWS

Краткое описание различий: OLAP в сравнении с OLTP

 

Критерии

OLAP

OLTP

Цель

OLAP помогает анализировать большие объемы данных для обеспечения поддержки принятия решений.

OLTP помогает управлять транзакциями в реальном времени и обрабатывать их.

Источник данных

OLAP использует исторические и объединенные данные из нескольких источников.

OLTP использует транзакционные данные в реальном времени из одного источника.

Структура данных

OLAP использует многомерные (в формате кубов) или реляционные базы данных.

OLTP использует реляционные базы данных.

Модель данных

OLAP использует схему «звезда», «снежинка» или другие аналитические модели.

В OLTP используются нормализованные или денормализованные модели.

Объем данных

OLAP предъявляет большие требования к хранению данных. Используйте терабайты (ТБ) и петабайты (ПБ).

OLTP предъявляет сравнительно небольшие требования к хранению данных. Используйте гигабайты (ГБ).

Время ответа

Время отклика OLAP больше, обычно оно исчисляется секундами или минутами.

Время отклика OLTP короче, обычно исчисляется миллисекундами.

Образцы приложений

OLAP хорошо подходит для анализа тенденций, прогнозирования поведения клиентов и определения прибыльности.

OLTP подходит для обработки платежей, заказов и управления данными клиентов.

Как AWS обеспечивает соответствие вашим требованиям к OLAP и OLTP?

Аналитика в Amazon Web Services (AWS) предоставляет различные управляемые облачные сервисы для аналитической обработки онлайн (OLAP) и обработки транзакций онлайн (OLTP). AWS предлагает специально разработанные сервисы, обеспечивающие наилучшую производительность, масштабируемость и низкую стоимость, для перемещения, хранения, аналитики данных и многого другого.

Примеры сервисов AWS, которые могут обеспечить поддержку ваших потребностей в OLAP и OLTP:

  • Amazon Redshift – это облачное хранилище данных, разработанное специально для OLAP.
  • Служба реляционных баз данных Amazon (Amazon RDS) – это реляционная база данных с функциональностью OLAP. Ее можно использовать для выполнения рабочих нагрузок OLTP или с Oracle OLAP для выполнения сложных запросов к размерным кубам.
  • Amazon Aurora – это облачная реляционная база данных, совместимая с MySQL и PostgreSQL, которая может выполнять и рабочие нагрузки OLTP, и сложные рабочие нагрузки OLAP.

Создайте аккаунт AWS и начните работу с OLTP и OLAP уже сегодня.

AWS: дальнейшие шаги

Начать разработку с OLAP
Начать разработку с OLTP