Среднее арифметическое

Материал из Энциклопедия интернет-маркетинга MarketWiki

Среднее арифметическое (arithmetic mean) - это статистический показатель, который вычисляется как сумма всех значений в наборе данных, делённая на их количество, и используется для оценки «типичного» значения в распределении метрик.

В интернет-маркетинге среднее арифметическое применяется для анализа среднего чека (AOV), среднего времени на сайте, среднего количества просмотров на пользователя, среднего CPC и других усреднённых показателей эффективности. Например, если за день было 5 заказов на суммы 500, 600, 700, 800 и 10 000 рублей, средний чек составит (500+600+700+800+10000)/5 = 2520 рублей. Однако этот показатель чувствителен к выбросам (аномалиям), что может искажать реальную картину - 80 процентов клиентов потратили около 650 рублей, но среднее показывает 2520 рублей.

Понятие среднего арифметического известно с древних времён, но в маркетинговой аналитике его часто дополняют медианой (серединным значением) и модой (наиболее частым значением) для более точного описания распределения.

Главное

[править]

Среднее арифметическое - это сумма всех значений, делённая на их количество. Если у компании три чека: 100, 200 и 3000 рублей, средний чек будет (100+200+3000)/3 = 1100 рублей, но реальная картина - один большой заказ и два маленьких.

Что такое среднее арифметическое

[править]

Среднее арифметическое - это центральная мера тенденции, показывающая, каким было бы значение каждого элемента, если бы общая сумма распределилась равномерно между всеми элементами набора данных. Формула: X̄ = (x₁ + x₂ + … + xₙ) / n.

В отличие от медианы (которая делит выборку пополам) и моды (наиболее частое значение), среднее арифметическое чувствительно к выбросам - экстремальным значениям, которые могут сильно искажать результат. Поэтому в маркетинговой аналитике его часто используют вместе с другими показателями.

Как работает среднее арифметическое

[править]
  1. Собираются значения метрики за период (например, чеки 5 заказов).
  2. Вычисляется сумма всех значений.
  3. Сумма делится на количество значений.
  4. Полученное значение интерпретируется как «типичное», но с учётом возможных выбросов.
Показатель Значения Сумма Количество Среднее
Средний чек (5 заказов) 500, 600, 700, 800, 10000 12600 5 2520 руб.
Средний чек с исключением выброса 500, 600, 700, 800 2600 4 650 руб.

Преимущества

[править]
  • Простота расчёта и понимания - среднее арифметическое понятно даже нетехническим специалистам.
  • Учёт всех значений - в отличие от медианы, среднее учитывает каждое значение в наборе.
  • Основа для других расчётов - используется в формулах дисперсии, стандартного отклонения, ковариации.
  • Быстрая агрегация - легко вычисляется в любых системах аналитики.

Недостатки

[править]
  • Чувствительность к выбросам - один аномально большой заказ может исказить средний чек.
  • Не показывает распределение - среднее не даёт информации о том, насколько данные разбросаны.
  • Бессмысленно для категориальных данных - нельзя вычислить среднее для пола, цвета, типа устройства.
  • Игнорирует форму распределения - среднее может не соответствовать реальному «типичному» значению при асимметричном распределении.

Где используется

[править]
Сфера Применение
Финансовые метрики AOV, LTV, CAC, ROMI
Метрики эффективности CTR, CR, CPC, CPM
Поведенческие метрики Время на сайте, глубина просмотра, количество страниц за сессию
Оптимизация Усреднение показателей для принятия решений

Сравнение

[править]
Критерий Среднее арифметическое Медиана Мода
Устойчивость к выбросам Низкая (сильно искажается) Высокая Высокая
Учитывает все значения Да Нет Нет
Применимость к искажённым данным Нет (требует нормального распределения) Да Да
Что показывает «Среднее» значение (сумму, делённую на количество) «Типичное» значение (середину ряда) Наиболее часто встречающееся значение
Пример из маркетинга Средний чек (может быть завышен оптовиками) Типичный чек (устойчив к оптовым заказам) Самый частый чек (например, 1000 рублей)

Часто задаваемые вопросы

[править]

Чем среднее отличается от медианы?

[править]

Среднее чувствительно к выбросам, медиана - нет. Если в выборке есть аномально большое значение, среднее «улетит» вверх, а медиана покажет середину распределения. В маркетинге для анализа доходов чаще используют медиану.

Почему среднее может быть обманчиво в маркетинге?

[править]

Потому что распределение клиентов часто асимметрично: 20 процентов клиентов приносят 80 процентов выручки. Средний чек будет выше, чем у 80 процентов клиентов, искажая представление о типичном клиенте.

Какую среднюю величину использовать в аналитике?

[править]

Для метрик с выбросами (доход, LTV) - медиану. Для метрик, где выбросы маловероятны (CTR, время на сайте по сегментам) - среднее арифметическое. Лучший подход - показывать и среднее, и медиану вместе.

Можно ли использовать среднее для категориальных данных?

[править]

Нет. Для категориальных данных (пол, цвет, тип устройства) среднее арифметическое не имеет смысла. Используйте моду (наиболее частое значение) или частотное распределение.

Связанные термины

[править]