Netflix Prize

Материал из Энциклопедия интернет-маркетинга MarketWiki

Netflix Prize - это открытый конкурс по машинному обучению, проведённый компанией Netflix в 2006-2009 годах с целью улучшить алгоритм рекомендаций (Cinematch) для предсказания пользовательских оценок фильмов. Победитель конкурса, команда BellKor’s Pragmatic Chaos, получила приз в размере 1 миллиона долларов за повышение точности предсказаний на 10,06% по сравнению с базовым алгоритмом.

Для интернет-маркетолога и специалиста по аналитике данных Netflix Prize является историческим событием, которое положило начало эре практического применения машинного обучения в рекомендательных системах, персонализации и продуктовой аналитике. Идеи и методы, разработанные в рамках конкурса, сегодня используются повсеместно: от рекомендаций товаров на маркетплейсах и контента в стриминговых сервисах до персонализированных предложений в email-маркетинге и динамических креативов в рекламе.

Коротко: Netflix Prize - это конкурс, который научил мир персонализации. За 1 миллион долларов участники улучшили алгоритм рекомендаций Netflix на 10%, а разработанные методы (матричная факторизация, ансамбли) до сих пор лежат в основе рекомендаций Amazon, Spotify и YouTube.

История конкурса

[править]
Дата Событие
Октябрь 2006 Netflix объявляет о запуске конкурса. Предоставляет анонимизированный датасет из 100 млн оценок (1-5 звёзд) от 480 000 пользователей к 18 000 фильмов
Июль 2007 Достигнуто улучшение на 8,43%
Октябрь 2007 Улучшение на 9,34%
Апрель 2008 Достигнут порог 10%
Июнь 2009 Команда BellKor’s Pragmatic Chaos достигает улучшения на 10,06% и выигрывает главный приз
Сентябрь 2009 Netflix вручает награду и публикует технические детали решения

Постановка задачи

[править]

Netflix стремился улучшить свой рекомендательный алгоритм Cinematch, который предсказывал, какую оценку (от 1 до 5 звёзд) пользователь поставит фильму на основе его предыдущих оценок и оценок похожих пользователей.

Задача: Улучшить точность предсказаний (RMSE - Root Mean Square Error) на 10% по сравнению с базовым алгоритмом Cinematch.

Метрика Базовый алгоритм (Cinematch) Целевой показатель
RMSE 0,9514 < 0,8563 (улучшение на 10%)

Дагасет

[править]
Характеристика Значение
Количество оценок 100 480 507
Количество пользователей 480 189
Количество фильмов 17 770
Диапазон оценок 1-5 звёзд
Датасет 2,4 ГБ (сжатый)
Тестовый набор 2,8 млн оценок для проверка

Ключевые методы и открытия

[править]
Метод Описание Влияние
Матричная факторизация (Matrix Factorization) Разложение матрицы «пользователь-фильм» на два скрытых пространства: пользовательские факторы (интересы) и фильмовые факторы (жанры, стили). Каждый пользователь и фильм представляется вектором скрытых признаков Стал основой современных рекомендательных систем (ALS, SVD)
Ансамблирование (Ensemble Methods) Объединение десятков моделей (матричная факторизация, Restricted Boltzmann Machines, kNN, регрессия) с разными весами для достижения наилучшего результата Показало, что комбинация разных подходов даёт лучший результат, чем одна идеальная модель
Регуляризация Методы предотвращения переобучения (L2-регуляризация, ранняя остановка) Позволили создавать сложные модели, устойчивые к шуму данных
Асимметричные модели Учёт смещения (bias) пользователей (один ставит в среднем 4, другой - 3) и фильмов (один фильм в среднем 4,5, другой - 2,5) Простое, но очень эффективное улучшение

Влияние на индустрию

[править]
Область Влияние Netflix Prize
Рекомендательные системы Матричная факторизация (SVD, ALS) стала стандартом для построения рекомендаций в e-commerce (Amazon), стриминге (Netflix, Spotify), видео (YouTube, VK Видео)
Машинное обучение Конкурс популяризировал работу с большими данными и показал эффективность ансамблевых методов, что привело к развитию XGBoost, LightGBM и других инструментов
Маркетинговая аналитика Методы персонализации, разработанные для Netflix Prize, используются для сегментации клиентов, прогнозирования LTV, оптимизации рекомендаций в email-маркетинге
Продуктовая аналитика Подходы к предсказанию пользовательских предпочтений легли в основу A/B-тестирования и управления пользовательским опытом (UX)
Открытые данные Конкурс продемонстрировал ценность открытых датасетов для развития индустрии. Позже были проведены конкурсы с аналогичным форматом (Kaggle)

Техническое наследие

[править]
Технология Происхождение Современное применение
ALS (Alternating Least Squares) Развитие матричной факторизации из Netflix Prize Рекомендации в Spark MLlib, Amazon Personalize, Яндекс.Аудитории
SVD++ Расширение SVD с учётом неявной обратной связи (просмотры, клики) Современные рекомендательные системы, учитывающие не только оценки, но и поведение
Ансамбли Комбинация десятков моделей XGBoost, LightGBM, CatBoost - современные инструменты машинного обучения, основанные на ансамблировании деревьев решений
A/B-тестирование Netflix внедрил систему A/B-тестов для оценки рекомендаций после конкурса Стандартная практика для всех цифровых продуктов

Современные рекомендательные системы

[править]
Платформа Технология
Netflix Deep learning, двухбашенные модели (two-tower), персонализированные обложки для каждого пользователя
Spotify Collaborative filtering, NLP для анализа текстов песен и подкастов
Amazon Item-to-item collaborative filtering, персонализация на основе истории покупок и просмотров
YouTube Deep neural networks для рекомендаций видео
Яндекс.Дзен Рекомендательная система на основе поведенческих данных и машинного обучения

Связанные термины

[править]