Размер выборки

Материал из Энциклопедия интернет-маркетинга MarketWiki

Размер выборки (sample size) - это количество респондентов или наблюдений, отобранных из генеральной совокупности для участия в маркетинговом исследовании, которое определяет статистическую точность и достоверность получаемых результатов.

В интернет-маркетинге размер выборки используется при проведении опросов потребителей, A/B-тестировании, анализе эффективности рекламных кампаний и сегментации аудитории. Например, маркетолог проводит A/B-тест двух вариантов лендинга и рассчитывает, что для статистической значимости при ожидаемом улучшении конверсии на 5 процентов и текущей конверсии 10 процентов необходимо 2000 посетителей на каждый вариант. Правильно рассчитанный объём выборки позволяет распространять выводы исследования на всю целевую аудиторию с заданной погрешностью, избегая при этом избыточных затрат.

Определение размера выборки базируется на законах математической статистики. Ключевое открытие: для репрезентативности важна не доля выборки в генеральной совокупности (1 процент или 10 процентов), а её абсолютное значение. Выборка из 1000 человек даёт погрешность порядка 3 процентов как для страны с населением 5 млн, так и для страны с населением 1.5 млрд.

Главное

[править]

Размер выборки - это количество людей, которых нужно опросить, чтобы их ответы отражали мнение всей целевой аудитории. Чем больше выборка, тем точнее результат, но после 1000-1500 человек точность растёт медленно.

Что такое размер выборки

[править]

Размер выборки - это количество единиц наблюдения (респондентов, покупок, сессий), включённых в исследование. В отличие от сплошного опроса (переписи), который охватывает всех представителей целевой аудитории, выборочное исследование опрашивает только их часть. Ключевое условие - выборка должна быть репрезентативной, то есть её структура должна соответствовать структуре генеральной совокупности по значимым признакам (возраст, пол, регион, доход).

В маркетинговых исследованиях используется два основных типа выборок: вероятностные (каждый элемент совокупности имеет известную вероятность попасть в выборку - случайная, механическая, стратифицированная) и невероятностные (отбор по критериям или доступности - квотная, стихийная, выборка типичных случаев).

Как работает размер выборки

[править]
  1. Определяется генеральная совокупность (кто является целевой аудиторией исследования).
  2. Выбирается требуемая точность (допустимая ошибка, например ±5 процентов) и доверительная вероятность (обычно 95 процентов).
  3. Рассчитывается минимальный размер выборки по статистической формуле.
  4. Проводится сбор данных на выборке рассчитанного объёма.
  5. Результаты распространяются на всю генеральную совокупность с известной погрешностью.
Размер выборки Ошибка при 50/50 (±) Ошибка при 10/90 (±)
50 14 процентов 9 процентов
100 10 процентов 6 процентов
200 7 процентов 4 процента
500 4 процента 2 процента
1000 3 процента 1.5 процента
5000 1 процент 0.5 процента

Преимущества

[править]
  • Экономия ресурсов - опрос 1000 человек вместо миллионов даёт те же выводы при кратно меньших затратах.
  • Предсказуемая точность - статистические методы позволяют рассчитать погрешность до начала исследования.
  • Возможность сегментации - достаточный размер позволяет анализировать подгруппы внутри выборки.

Недостатки

[править]
  • Ошибка выборки - даже при идеальном расчёте результаты всегда имеют статистическую погрешность.
  • Сложность рекрутинга - набрать случайную выборку нужного объёма сложнее, чем кажется.
  • Смещение (bias) - если опрашивать только тех, кто согласился, результаты могут искажаться.

Где используется

[править]
Сфера Применение
Маркетинговые исследования Опросы потребителей, оценка узнаваемости бренда
A/B-тестирование Расчёт минимального объёма трафика для статистически значимых результатов
Аналитика рекламных кампаний Оценка достоверности различий между каналами
Клиентские опросы NPS, CSAT, CES

Сравнение

[править]
Критерий Вероятностная выборка Невероятностная выборка
Репрезентативность Гарантирована (при правильном расчёте) Не гарантирована
Сложность проведения Высокая (требует списка генеральной совокупности) Низкая (опрос доступных респондентов)
Возможность расчёта погрешности Да (статистические формулы) Нет
Применение Исследования, где важна точность Пилотные исследования, быстрые опросы

Часто задаваемые вопросы

[править]

Какой размер выборки считается достаточным?

[править]

Для большинства маркетинговых исследований достаточно 1000-1500 респондентов - это даёт погрешность ±3 процента при доверительной вероятности 95 процентов. Дальнейшее увеличение выборки даёт незначительный прирост точности.

Как размер выборки влияет на точность?

[править]

Чем больше выборка, тем меньше погрешность. Но зависимость не линейная: увеличение выборки в 4 раза уменьшает погрешность только в 2 раза.

Нужно ли учитывать размер страны при расчёте выборки?

[править]

Нет, для случайной выборки важна не доля от населения, а абсолютное количество респондентов. Выборка из 1000 человек работает одинаково для региона с 100 тыс. жителей и для страны с миллиардным населением.

Что такое репрезентативность выборки?

[править]

Репрезентативность - это свойство выборки отражать структуру генеральной совокупности по значимым признакам. Если в генеральной совокупности 50 процентов женщин, то и в выборке должно быть 50 процентов женщин. Нарушение репрезентативности ведёт к смещению результатов.

Связанные термины

[править]