Медиана

Материал из Энциклопедия интернет-маркетинга MarketWiki

Медиана (Median) - это статистический показатель, который представляет собой значение, делящее упорядоченный набор данных на 2 равные половины: 50 процентов значений находятся ниже медианы, а 50 процентов - выше, что делает её устойчивой к выбросам (экстремально высоким или низким значениям) и предпочтительной мерой центральной тенденции для распределений, далёких от нормального.

В интернет-маркетинге медиана используется при анализе искажённых данных, где классическое среднее арифметическое может вводить в заблуждение. Например, в наборе данных о зарплатах сотрудников (50 000, 55 000, 60 000, 65 000, 1 000 000 рублей) медиана составит 60 000 рублей (третье значение в упорядоченном ряду), в то время как среднее арифметическое будет искажено выбросом до 246 000 рублей - медиана даёт более реалистичное представление о «типичной» зарплате.

Медиана незаменима при работе с метриками, где разброс значений велик: временем на сайте, стоимостью клика (CPC) по разным ключевым словам, размером чека, временем ответа поддержки. В отличие от среднего, медиана не чувствительна к аномалиям и даёт более реальную картину «типичного» значения.

Главное

[править]

Медиана - это «середина» данных. Если выстроить все числа по порядку, медиана - это то, что окажется ровно посередине. Половина данных больше, половина - меньше.

Что такое медиана

[править]

Медиана - это статистический показатель центральной тенденции, который представляет собой значение, находящееся в середине упорядоченного ряда данных. В отличие от среднего арифметического, которое чувствительно к выбросам (аномально высоким или низким значениям), медиана устойчива к таким искажениям и даёт более реалистичную оценку «типичного» значения.

В статистике существует три основных показателя центральной тенденции: среднее арифметическое (сумма всех значений, делённая на их количество), медиана (серединное значение в упорядоченном ряду) и мода (наиболее часто встречающееся значение).

Как работает медиана

[править]
  1. Все значения в наборе данных упорядочиваются по возрастанию (от меньшего к большему).
  2. Если количество значений нечётное, медианой является значение, которое находится ровно посередине упорядоченного ряда.
  3. Если количество значений чётное, медианой является среднее арифметическое двух центральных значений.
  4. В Excel или Google Sheets используется функция MEDIAN (МЕДИАНА) для автоматического расчёта.
Количество значений Правило расчёта Пример
Нечётное Центральное значение упорядоченного ряда 5, 8, 10, 12, 15 - медиана = 10
Чётное Среднее арифметическое двух центральных значений 5, 8, 12, 15 - медиана = (8+12)/2 = 10

Преимущества

[править]
  • Устойчивость к выбросам - одно аномальное значение не искажает показатель.
  • Реалистичность - даёт представление о «типичном» значении для большинства наблюдений.
  • Простота интерпретации - половина значений выше медианы, половина - ниже.
  • Применимость к искажённым распределениям - не требует нормального распределения данных.

Недостатки

[править]
  • Не учитывает все значения - игнорирует величину отклонений.
  • Менее эффективна для нормальных распределений - при симметричном распределении среднее точнее.
  • Сложнее для дальнейших расчётов - медиану труднее использовать в статистических моделях, чем среднее.
  • Неподходящий показатель для категориальных данных - медиана требует числовых или порядковых данных.

Где используется

[править]
Сфера Применение
Анализ времени на сайте Несколько пользователей, забывших закрыть вкладку, могут сильно завысить среднее время. Медиана показывает типичное время взаимодействия
Стоимость клика (CPC) Одно-два очень дорогих ключевых слова могут исказить средний CPC. Медиана даёт представление о «типичной» цене клика
Анализ зарплат в отрасли Зарплаты топ-менеджеров создают выбросы. Медианная зарплата точнее отражает доход специалиста среднего уровня
Время ответа поддержки Единичные сложные обращения могут сильно увеличить среднее время ответа. Медиана показывает, как быстро решаются «типичные» вопросы
Размер чека (AOV) Крупные оптовые заказы могут искажать средний чек. Медианный чек показывает, сколько тратит «обычный» розничный покупатель

Сравнение

[править]
Критерий Медиана Среднее арифметическое Мода
Устойчивость к выбросам Высокая Низкая (сильно искажается) Высокая
Учитывает все значения Нет Да Нет
Применимость к искажённым данным Да Нет (требует нормального распределения) Да
Что показывает «Типичное» значение (середину ряда) «Среднее» значение (сумму, делённую на количество) Наиболее часто встречающееся значение
Пример из маркетинга Типичный чек (устойчив к оптовым заказам) Средний чек (может быть завышен оптовиками) Самый частый чек (например, 1000 рублей)

Часто задаваемые вопросы

[править]

Когда использовать медиану вместо среднего?

[править]

Всегда, когда в данных есть подозрение на выбросы (аномально высокие или низкие значения). В реальных маркетинговых данных выбросы встречаются часто (крупные оптовые заказы, случайные долгие сессии, боты), поэтому медиана обычно предпочтительнее.

Как медиана связана с квартилями?

[править]

Медиана - это второй квартиль (Q2). Первый квартиль (Q1) отсекает 25 процентов данных снизу, третий (Q3) - 25 процентов сверху. Анализ квартилей даёт более полную картину распределения: Q1 (30 секунд на сайте) - худшие 25 процентов, медиана (2 минуты) - типичный пользователь, Q3 (5 минут) - лучшие 25 процентов.

Как рассчитать медиану в Excel или Google Sheets?

[править]

В Excel используется формула =МЕДИАНА(диапазон), например =МЕДИАНА(A1:A100). В Google Sheets - =MEDIAN(диапазон), например =MEDIAN(B2:B101).

Может ли медиана быть равна среднему?

[править]

Да, если распределение симметричное (например, нормальное распределение - «колокол»). В этом случае оба показателя совпадают. Но в реальных маркетинговых данных распределения часто искажены, и медиана отличается от среднего.

Связанные термины

[править]