Схема звезда
Схема «звезда» (англ. Star Schema) - это способ организации данных в хранилище данных, при котором центральная таблица фактов связана с несколькими таблицами измерений. Благодаря своей структуре такая модель напоминает звезду, где в центре находится таблица с количественными показателями, а вокруг неё - таблицы, содержащие описательные характеристики.
Схема «звезда» широко используется в бизнес-аналитике, системах BI, OLAP, маркетинговой аналитике и корпоративных хранилищах данных. Она позволяет ускорить выполнение аналитических запросов, упростить построение отчётов и сделать структуру данных более понятной для аналитиков и специалистов по интернет-маркетингу.
Коротко: схема «звезда» - это модель хранения аналитических данных, в которой одна центральная таблица фактов соединяется с несколькими таблицами измерений, содержащими сведения о времени, клиентах, товарах, рекламных кампаниях и других объектах анализа.
Назначение
[править]Большинство операционных баз данных предназначены для быстрого выполнения транзакций: оформления заказов, регистрации пользователей, изменения остатков товаров и других операций.
Однако аналитические задачи существенно отличаются. Маркетологу или аналитику необходимо быстро получить ответы на вопросы вроде:
- Сколько заказов поступило за месяц
- Какая рекламная кампания принесла больше всего продаж
- Как менялась конверсия по регионам
- Какие товары чаще всего покупают новые клиенты
Для подобных запросов используются аналитические модели данных, одной из самых распространённых среди которых является схема «звезда».
Структура
[править]Схема состоит из двух основных типов таблиц.
Таблица фактов
[править]Центральная таблица содержит количественные показатели, которые анализируются.
Например:
- Количество заказов
- Сумма продаж
- Число кликов
- Показы рекламы
- Выручка
- Прибыль
- Конверсии
Каждая запись обычно содержит ссылки на соответствующие измерения.
Таблицы измерений
[править]Окружающие таблицы содержат описательную информацию.
Наиболее распространённые измерения:
- Дата
- Клиент
- Товар
- Рекламная кампания
- Источник трафика
- Устройство
- Регион
- Менеджер
Именно эти таблицы позволяют группировать и анализировать показатели различными способами.
Пример
[править]Предположим, интернет-магазин анализирует эффективность рекламы.
В таблице фактов могут храниться:
- Количество заказов
- Сумма покупки
- Стоимость привлечения клиента
Таблицы измерений будут содержать сведения о:
- Дате покупки
- Рекламной кампании
- Клиенте
- Товаре
- Регионе
- Устройстве пользователя
Благодаря этому аналитик может быстро построить отчёт, например: «Выручка по рекламным каналам за последний квартал среди новых клиентов из Москвы».
Почему схема называется «звезда»
[править]Если изобразить структуру графически, центральная таблица фактов окажется в центре, а таблицы измерений будут располагаться вокруг неё. В результате схема действительно напоминает звезду с расходящимися лучами. Именно отсюда произошло её название.
Значение для интернет-маркетинга
[править]Практически вся современная маркетинговая аналитика основана на объединении различных источников данных.
В схеме «звезда» могут храниться сведения из:
- CRM
- Рекламных кабинетов
- систем веб-аналитики
- Программ лояльности
- CDP
- ERP-систем
- Колл-центров
Это позволяет строить единые отчёты по:
- ROMI
- Customer Lifetime Value
- Стоимости привлечения клиента
- Эффективности рекламных кампаний
- Повторным покупкам
- Сегментам аудитории
- Воронке продаж
Именно поэтому схема «звезда» широко применяется при построении маркетинговых хранилищ данных.
Преимущества
[править]По сравнению со сложными нормализованными моделями схема «звезда» обладает рядом преимуществ.
Она обеспечивает:
- Простую структуру данных
- Высокую скорость аналитических запросов
- Удобство построения отчётов
- Понятность для бизнес-пользователей
- Совместимость с большинством BI-платформ
Во многих случаях аналитики могут самостоятельно строить отчёты без глубокого знания структуры базы данных.
Ограничения
[править]Несмотря на распространённость, схема «звезда» подходит не для всех задач.
К её ограничениям относятся:
- Возможное дублирование данных в таблицах измерений
- Увеличение объёма хранения
- Необходимость регулярного обновления хранилища
- Меньшая гибкость по сравнению с некоторыми другими моделями
Тем не менее для большинства аналитических задач её достоинства значительно превосходят недостатки.
Отличие от схемы «снежинка»
[править]Наиболее близкой моделью является Схема снежинка.
Главное отличие заключается в степени нормализации данных.
| Схема «звезда» | Схема «снежинка» |
|---|---|
| Простая структура | Более сложная структура |
| Минимум соединений таблиц | Больше соединений |
| Быстрее выполняет аналитические запросы | Лучше устраняет дублирование данных |
| Проще воспринимается аналитиками | Требует более глубокого понимания структуры данных |
На практике схема «звезда» используется значительно чаще, особенно в системах бизнес-аналитики.
Распространённые заблуждения
[править]«Схема "звезда" используется только программистами»
[править]Нет. Её активно используют аналитики данных, специалисты по BI, интернет-маркетологи и продуктовые аналитики, работающие с корпоративной отчётностью.
«Это обычная структура базы данных»
[править]Нет. Схема «звезда» предназначена прежде всего для аналитических запросов и отличается от моделей, применяемых в транзакционных системах.
«Она устарела»
[править]Нет. Несмотря на развитие облачных технологий и современных платформ обработки данных, схема «звезда» остаётся одним из наиболее популярных способов организации аналитических хранилищ.
Часто задаваемые вопросы
[править]Где применяется схема «звезда»?
[править]Она используется в корпоративных хранилищах данных, BI-платформах, системах маркетинговой аналитики, финансовой отчётности и аналитике электронной коммерции.
Почему схема «звезда» популярна среди маркетологов?
[править]Она позволяет быстро объединять данные из различных источников и строить сложные аналитические отчёты без необходимости глубоко разбираться в устройстве базы данных.
Что лучше - схема «звезда» или схема «снежинка»?
[править]Выбор зависит от конкретной задачи. Для большинства задач бизнес-аналитики предпочтение отдаётся схеме «звезда» благодаря её простоте и высокой производительности.
