Google Hummingbird
Google Hummingbird (Колибри) - поисковый алгоритм Google, представленный в сентябре 2013 года. Алгоритм был разработан для лучшего понимания смысла запросов, а не просто отдельных слов, что позволило Google обрабатывать более сложные и разговорные запросы.
Hummingbird заменил старый алгоритм, работавший с 2001 года, и фактически стал новой поисковой системой на том же индексе. Название символизирует точность и скорость - колибри может зависать на одном месте и быстро перемещаться.
Предпосылки появления
[править]К 2013 году поисковые запросы пользователей значительно изменились по сравнению с началом 2000-х. Люди стали формулировать запросы более естественно, часто целыми предложениями, особенно с распространением голосового поиска на мобильных устройствах.
Старый алгоритм, основанный на анализе отдельных слов, плохо справлялся с длинными разговорными фразами. Например, запрос «где ближайшая кофейня, где можно посидеть с ноутбуком и есть розетки» ставил его в тупик.
Google нужно было перейти от анализа отдельных слов к пониманию целостного смысла запроса.
Как работает Hummingbird
[править]Понимание смысла, а не слов
[править]В отличие от предыдущих алгоритмов, которые в основном искали совпадения ключевых слов, Hummingbird пытается понять, что пользователь имел в виду на самом деле. Он анализирует запрос целиком, а не разбивает его на отдельные слова.
Например, на запрос «где купить iPhone дешево в Москве» Hummingbird понимает, что пользователю нужен магазин в Москве, где продают iPhone по низким ценам. Он не просто ищет страницы, содержащие слова «купить», «iPhone», «дешево», «Москва».
Учёт контекста
[править]Алгоритм учитывает контекст запроса - предыдущие вопросы пользователя, его местоположение, историю поиска. Это позволяет давать более персонализированные и релевантные результаты.
Работа с сущностями
[править]Hummingbird тесно связан с графом знаний Google (Knowledge Graph) - базой данных о сущностях (людях, местах, вещах) и связях между ними. Алгоритм понимает, что запросы о разных сущностях связаны между собой.
Обработка разговорного языка
[править]Алгоритм хорошо работает с запросами, сформулированными естественным языком, как если бы пользователь разговаривал с человеком, а не вводил ключевые слова в поисковую строку.
Основные возможности
[править]Понимание длинных запросов
[править]Hummingbird значительно улучшил обработку длинных, многословных запросов. Теперь поисковик может понять сложную фразу целиком, а не просто найти страницы с отдельными словами.
Работа с предлогами и частицами
[править]Важность предлогов и частиц стала учитываться гораздо точнее. Запросы «книги для детей» и «книги о детях» теперь дают разные результаты, что было проблемой для старых алгоритмов.
Связывание связанных понятий
[править]Алгоритм понимает, что если пользователь ищет «рецепт пиццы», ему также могут быть полезны рецепты соусов, советы по выбору сыра и информация о типах теста.
Улучшение голосового поиска
[править]С ростом популярности голосовых помощников способность обрабатывать разговорные запросы стала критически важной. Hummingbird заложил основу для качественного голосового поиска.
Hummingbird и другие компоненты поиска
[править]Интеграция с Knowledge Graph
[править]Hummingbird активно использует граф знаний Google. Если запрос касается известной сущности (фильма, актёра, достопримечательности), алгоритм может показывать структурированную информацию из графа прямо в выдаче.
Основа для будущих алгоритмов
[править]Hummingbird стал фундаментом, на котором впоследствии строились более сложные системы машинного обучения - RankBrain, Neural Matching, BERT, MUM. Он заложил подход к пониманию смысла, а не просто слов.
Взаимодействие с Panda и Penguin
[править]Hummingbird работал вместе с другими алгоритмами Google. Panda оценивал качество контента, Penguin боролся с неестественными ссылками, а Hummingbird улучшал понимание запросов. Они дополняли друг друга.
Влияние на подход к созданию сайтов
[править]Переход от ключевых слов к темам
[править]Hummingbird способствовал переходу от оптимизации под отдельные ключевые слова к созданию контента по целым темам. Сайты, которые всесторонне раскрывают тему, получили преимущество перед страницами с точными вхождениями ключей.
Важность естественного языка
[править]Тексты, написанные для людей, с разговорными оборотами, стали цениться выше, чем «сеошные» тексты с неестественными формулировками.
Ответы на вопросы
[править]Возросла значимость форматов, отвечающих на конкретные вопросы пользователей. FAQ, статьи-инструкции, подробные гайды стали более эффективными.
Структурированные данные
[править]Микроразметка помогает Hummingbird лучше понимать, о чём страница, и связывать её с сущностями в графе знаний.
Примеры работы
[править]Сложный запрос
[править]Запрос: «какую камеру купить для съемки видео на ютуб чтобы бюджет был до 500 долларов»
До Hummingbird поиск мог просто найти страницы со словами «камера», «купить», «видео», «YouTube», «бюджет», «500 долларов». После Hummingbird алгоритм понимает, что пользователю нужна рекомендация камеры для конкретной задачи с ограниченным бюджетом.
Разговорный запрос
[править]Запрос: «где можно погулять с собакой в центре чтобы было недалеко от метро»
Алгоритм понимает все компоненты запроса: нужны места для прогулок с собакой, в центре города, рядом с метро. Он выдаёт парки, скверы, специальные площадки.
Запрос с неявным смыслом
[править]Запрос: «фрукты которые нельзя есть при диабете»
Hummingbird понимает, что пользователю нужна информация о противопоказаниях, а не просто список фруктов.
Hummingbird сегодня
[править]К середине 2020-х годов Hummingbird уже не воспринимается как отдельное обновление. Принципы, заложенные в него, стали основой всех последующих алгоритмов Google. Понимание смысла запроса - стандарт, без которого невозможно представить современный поиск.
С появлением более мощных систем (BERT, MUM) роль Hummingbird как отдельного компонента снизилась, но его идеи живут в каждом новом алгоритме.
