Схема звезда

Материал из Энциклопедия интернет-маркетинга MarketWiki

Схема «звезда» (англ. Star Schema) - это способ организации данных в хранилище данных, при котором центральная таблица фактов связана с несколькими таблицами измерений. Благодаря своей структуре такая модель напоминает звезду, где в центре находится таблица с количественными показателями, а вокруг неё - таблицы, содержащие описательные характеристики.

Схема «звезда» широко используется в бизнес-аналитике, системах BI, OLAP, маркетинговой аналитике и корпоративных хранилищах данных. Она позволяет ускорить выполнение аналитических запросов, упростить построение отчётов и сделать структуру данных более понятной для аналитиков и специалистов по интернет-маркетингу.

Коротко: схема «звезда» - это модель хранения аналитических данных, в которой одна центральная таблица фактов соединяется с несколькими таблицами измерений, содержащими сведения о времени, клиентах, товарах, рекламных кампаниях и других объектах анализа.

Назначение

[править]

Большинство операционных баз данных предназначены для быстрого выполнения транзакций: оформления заказов, регистрации пользователей, изменения остатков товаров и других операций.

Однако аналитические задачи существенно отличаются. Маркетологу или аналитику необходимо быстро получить ответы на вопросы вроде:

  • Сколько заказов поступило за месяц
  • Какая рекламная кампания принесла больше всего продаж
  • Как менялась конверсия по регионам
  • Какие товары чаще всего покупают новые клиенты

Для подобных запросов используются аналитические модели данных, одной из самых распространённых среди которых является схема «звезда».

Структура

[править]

Схема состоит из двух основных типов таблиц.

Таблица фактов

[править]

Центральная таблица содержит количественные показатели, которые анализируются.

Например:

  • Количество заказов
  • Сумма продаж
  • Число кликов
  • Показы рекламы
  • Выручка
  • Прибыль
  • Конверсии

Каждая запись обычно содержит ссылки на соответствующие измерения.

Таблицы измерений

[править]

Окружающие таблицы содержат описательную информацию.

Наиболее распространённые измерения:

  • Дата
  • Клиент
  • Товар
  • Рекламная кампания
  • Источник трафика
  • Устройство
  • Регион
  • Менеджер

Именно эти таблицы позволяют группировать и анализировать показатели различными способами.

Пример

[править]

Предположим, интернет-магазин анализирует эффективность рекламы.

В таблице фактов могут храниться:

  • Количество заказов
  • Сумма покупки
  • Стоимость привлечения клиента

Таблицы измерений будут содержать сведения о:

  • Дате покупки
  • Рекламной кампании
  • Клиенте
  • Товаре
  • Регионе
  • Устройстве пользователя

Благодаря этому аналитик может быстро построить отчёт, например: «Выручка по рекламным каналам за последний квартал среди новых клиентов из Москвы».

Почему схема называется «звезда»

[править]

Если изобразить структуру графически, центральная таблица фактов окажется в центре, а таблицы измерений будут располагаться вокруг неё. В результате схема действительно напоминает звезду с расходящимися лучами. Именно отсюда произошло её название.

Значение для интернет-маркетинга

[править]

Практически вся современная маркетинговая аналитика основана на объединении различных источников данных.

В схеме «звезда» могут храниться сведения из:

Это позволяет строить единые отчёты по:

  • ROMI
  • Customer Lifetime Value
  • Стоимости привлечения клиента
  • Эффективности рекламных кампаний
  • Повторным покупкам
  • Сегментам аудитории
  • Воронке продаж

Именно поэтому схема «звезда» широко применяется при построении маркетинговых хранилищ данных.

Преимущества

[править]

По сравнению со сложными нормализованными моделями схема «звезда» обладает рядом преимуществ.

Она обеспечивает:

  • Простую структуру данных
  • Высокую скорость аналитических запросов
  • Удобство построения отчётов
  • Понятность для бизнес-пользователей
  • Совместимость с большинством BI-платформ

Во многих случаях аналитики могут самостоятельно строить отчёты без глубокого знания структуры базы данных.

Ограничения

[править]

Несмотря на распространённость, схема «звезда» подходит не для всех задач.

К её ограничениям относятся:

  • Возможное дублирование данных в таблицах измерений
  • Увеличение объёма хранения
  • Необходимость регулярного обновления хранилища
  • Меньшая гибкость по сравнению с некоторыми другими моделями

Тем не менее для большинства аналитических задач её достоинства значительно превосходят недостатки.

Отличие от схемы «снежинка»

[править]

Наиболее близкой моделью является Схема снежинка.

Главное отличие заключается в степени нормализации данных.

Схема «звезда» Схема «снежинка»
Простая структура Более сложная структура
Минимум соединений таблиц Больше соединений
Быстрее выполняет аналитические запросы Лучше устраняет дублирование данных
Проще воспринимается аналитиками Требует более глубокого понимания структуры данных

На практике схема «звезда» используется значительно чаще, особенно в системах бизнес-аналитики.

Распространённые заблуждения

[править]

«Схема "звезда" используется только программистами»

[править]

Нет. Её активно используют аналитики данных, специалисты по BI, интернет-маркетологи и продуктовые аналитики, работающие с корпоративной отчётностью.

«Это обычная структура базы данных»

[править]

Нет. Схема «звезда» предназначена прежде всего для аналитических запросов и отличается от моделей, применяемых в транзакционных системах.

«Она устарела»

[править]

Нет. Несмотря на развитие облачных технологий и современных платформ обработки данных, схема «звезда» остаётся одним из наиболее популярных способов организации аналитических хранилищ.

Часто задаваемые вопросы

[править]

Где применяется схема «звезда»?

[править]

Она используется в корпоративных хранилищах данных, BI-платформах, системах маркетинговой аналитики, финансовой отчётности и аналитике электронной коммерции.

Почему схема «звезда» популярна среди маркетологов?

[править]

Она позволяет быстро объединять данные из различных источников и строить сложные аналитические отчёты без необходимости глубоко разбираться в устройстве базы данных.

Что лучше - схема «звезда» или схема «снежинка»?

[править]

Выбор зависит от конкретной задачи. Для большинства задач бизнес-аналитики предпочтение отдаётся схеме «звезда» благодаря её простоте и высокой производительности.

Связанные термины

[править]