Рекомендательные системы

Материал из Энциклопедия интернет-маркетинга MarketWiki
(перенаправлено с «Рекомендательная система»)

Рекомендательные системы - это класс алгоритмов машинного обучения и программных решений, предназначенных для предсказания предпочтений пользователя и предложения ему релевантных объектов (товаров, услуг, контента, людей). Они анализируют историю взаимодействий пользователя с системой, данные о похожих пользователях и характеристики самих объектов, чтобы ответить на вопрос: «Что предложить этому пользователю с наибольшей вероятностью его заинтересовать?».

В интернет-маркетинге рекомендательные системы играют ключевую роль, обеспечивая персонализацию пользовательского опыта. Они лежат в основе блоков «Вам может понравиться» на маркетплейсах, ленты рекомендаций в социальных сетях и видеосервисах, а также подборки товаров в email-рассылках. Эффективная рекомендательная система может увеличить конверсию и средний чек на десятки процентов.

Зачем нужны рекомендательные системы

[править]

Рекомендательные системы решают несколько ключевых задач в цифровых продуктах.

Повышение вовлечённости

[править]

Предлагая пользователю релевантный контент (статьи, видео, посты), система удерживает его на платформе дольше. Чем дольше пользователь остаётся, тем больше он вовлечён и тем выше вероятность монетизации.

Увеличение продаж

[править]

В e-commerce рекомендации товаров («с этим товаром покупают», «вы недавно смотрели») напрямую стимулируют дополнительные покупки, повышая средний чек и общую выручку. По разным оценкам, до 30% дохода крупных интернет-магазинов генерируется именно рекомендательными системами.

Персонализация

[править]

Рекомендательные системы создают уникальный опыт для каждого пользователя. Вместо одного и того же каталога для всех, каждый видит «свою» подборку, что повышает лояльность и удовлетворённость.

Решение проблемы информационной перегрузки

[править]

В современном мире выбор слишком велик. Пользователю трудно ориентироваться в тысячах товаров или миллионах видео. Рекомендательная система выступает в роли фильтра, помогая найти именно то, что нужно.

Оптимизация контента

[править]

Для владельцев платформ рекомендательные системы помогают эффективно распределять трафик, показывая пользователям те объекты, которые с наибольшей вероятностью будут востребованы.

Основные типы рекомендательных систем

[править]

Существует несколько подходов к построению рекомендаций, которые часто комбинируются в гибридных системах.

Коллаборативная фильтрация

[править]

Самый популярный и мощный подход. Основан на предположении, что если пользователям А и Б нравились одни и те же объекты в прошлом, то им будут нравиться и другие общие объекты. Проще говоря: «людям со схожими вкусами нравятся схожие вещи».

  • User-based: ищем пользователей, похожих на текущего, и рекомендуем то, что понравилось им, но ещё не видел текущий.
  • Item-based: ищем объекты, похожие на те, которые уже понравились пользователю, и рекомендуем их. (Классический пример: «Вам понравился этот фильм, возможно, вам понравится и этот»).

Плюсы: не требует понимания сути объектов, может находить неожиданные, но интересные рекомендации. Минусы: проблема «холодного старта» (не может ничего рекомендовать новым пользователям или новым товарам), требует много данных о взаимодействиях.

Контентная фильтрация

[править]

Рекомендации строятся на основе характеристик объектов и предпочтений пользователя. Система анализирует, какие свойства объектов нравились пользователю раньше, и ищет объекты с похожими свойствами.

Например, если пользователь смотрел и высоко оценил несколько комедий с определённым актёром, система будет рекомендовать ему другие комедии с этим актёром.

Плюсы: не страдает от проблемы «холодного старта» для новых объектов (их можно рекомендовать на основе их характеристик). Минусы: требует детального описания объектов (метаданных), рекомендации часто получаются предсказуемыми и не выводят за пределы уже известных предпочтений.

Гибридные системы

[править]

Современные рекомендательные системы почти всегда являются гибридными. Они комбинируют несколько подходов, чтобы нивелировать недостатки каждого. Например, коллаборативная фильтрация может дополняться контентной для решения проблемы холодного старта.

Рекомендации на основе знаний

[править]

Используются в сложных предметных областях (например, выбор автомобиля или недвижимости). Система задаёт пользователю вопросы о его потребностях и на основе экспертных правил подбирает подходящие объекты.

Популярное (Most Popular)

[править]

Самый простой тип - рекомендовать всем одно и то же: самые популярные, самые просматриваемые, самые продаваемые товары. Используется как «заглушка» для новых пользователей, о которых ещё нет данных.

Основные компоненты

[править]

Типичная рекомендательная система состоит из нескольких ключевых блоков.

Данные о пользователях

[править]

Вся информация о тех, кому мы рекомендуем:

  • Явные данные: оценки, лайки, дизлайки, отзывы, подписки.
  • Неявные данные: история просмотров, клики, добавления в корзину, время на странице, покупки, поисковые запросы.
  • Демографические данные: возраст, пол, география (используются реже, как вспомогательные).

Данные об объектах

[править]

Информация о том, что мы рекомендуем:

  • Метаданные: название, категория, описание, цена, теги, автор, жанр.
  • Поведенческие данные: как часто объект смотрят, покупают, добавляют в избранное.

Данные о взаимодействиях

[править]

Матрица, связывающая пользователей и объекты. Это основной материал для обучения моделей коллаборативной фильтрации.

Алгоритм ранжирования

[править]

Сердце системы. Модель, которая на основе всех доступных данных предсказывает вероятность того, что пользователь совершит целевое действие с объектом (кликнет, купит, посмотрит). Чем выше предсказанная вероятность, тем выше объект в рекомендациях.

Примеры известных рекомендательных систем

[править]

Классический пример. Netflix использует сложную гибридную систему, которая учитывает огромное количество факторов: что вы смотрели, как долго, в какое время, на каком устройстве, какие жанры предпочитаете, какие актёры вам нравятся. Рекомендации Netflix отвечают за 80% всего просматриваемого на платформе контента.

Пионер в области товарных рекомендаций. Блок «Customers who bought this item also bought» (покупатели этого товара также купили) - классический пример коллаборативной фильтрации. Amazon также активно использует рекомендации на основе истории просмотров.

Ozon / Wildberries

[править]

Крупнейшие российские маркетплейсы активно используют рекомендации: «Вам может понравиться», «С этим товаром покупают», «Вы недавно смотрели». Это критически важный инструмент для увеличения продаж.

Рекомендательная система YouTube отвечает за формирование ленты рекомендованных видео на главной странице и списка «следующее видео». Она учитывает историю просмотров, подписки, лайки, дизлайки и поведение миллионов других пользователей.

Яндекс.Музыка / Spotify

[править]

Музыкальные сервисы используют рекомендации для создания персональных плейлистов («Плейлист дня», «Треки недели»), подбора новой музыки на основе прослушанного.

Метрики качества рекомендательных систем

[править]

Эффективность рекомендаций оценивается с помощью специальных метрик.

Точность (Precision) и полнота (Recall)

[править]

Классические метрики для оценки качества ранжирования. Precision - доля релевантных объектов среди всех рекомендованных. Recall - доля найденных релевантных объектов среди всех существующих релевантных объектов.

MAP@K (Mean Average Precision at K)

[править]

Средняя точность среди первых K рекомендаций. Важно не просто найти релевантные объекты, но и поставить их на верхние позиции.

NDCG@K (Normalized Discounted Cumulative Gain)

[править]

Метрика, учитывающая, что релевантные объекты должны быть наверху списка, и чем выше позиция, тем лучше.

CTR (Click-Through Rate)

[править]

Для рекомендательных систем, где целевое действие - клик, измеряют, как часто пользователи кликают на рекомендованные объекты.

Конверсия и доход

[править]

Бизнес-метрики, показывающие, сколько покупок принесли рекомендации и какой дополнительный доход они сгенерировали.

Разнообразие и новизна

[править]

Важные качественные метрики. Хорошая система не должна зацикливаться на одних и тех же объектах, она должна предлагать разнообразный контент и открывать пользователю что-то новое.

Проблемы и вызовы

[править]

Холодный старт

[править]

Как рекомендовать что-то новому пользователю, о котором ещё нет данных? Или как начать рекомендовать новый товар, который ещё никто не покупал? Решения: рекомендовать популярное, использовать демографические данные, контентную фильтрацию, запрашивать предпочтения при регистрации.

Прозрачность и интерпретируемость

[править]

Пользователям часто важно понимать, почему им рекомендуют тот или иной товар. Пояснения («потому что вы смотрели...») повышают доверие.

Эхо-камера и фильтрующий пузырь

[править]

Система может замкнуть пользователя в узком круге однотипных рекомендаций, не давая ему увидеть что-то новое и разнообразное. Это требует специальных алгоритмов, добавляющих «разнообразия».

Масштабируемость

[править]

Обрабатывать миллионы пользователей и объектов в реальном времени - огромная техническая задача.

Этические вопросы

[править]

Рекомендательные системы могут влиять на поведение людей, формируя их предпочтения и даже мнения. Это накладывает ответственность на разработчиков.

Связанные термины

[править]