X-Robots-Tag
X-Robots-Tag - HTTP-заголовок, используемый для передачи инструкций поисковым роботам о том, как следует индексировать содержимое страницы или файла. В отличие от мета-тега robots, который размещается в HTML-коде страницы, X-Robots-Tag передаётся в HTTP-заголовках ответа сервера.
В интернет-маркетинге и SEO X-Robots-Tag используется для управления индексацией не-HTML файлов (PDF, изображения, видео), а также для применения общих правил ко всем страницам сайта или к целым разделам.
Как работает X-Robots-Tag
[править]При запросе страницы или файла сервер отправляет HTTP-заголовки, среди которых может быть X-Robots-Tag. Поисковый робот читает этот заголовок и выполняет указанные директивы.
Синтаксис
[править]X-Robots-Tag может принимать те же значения, что и мета-тег robots.
Основные директивы
[править]index/noindex- разрешить или запретить индексациюfollow/nofollow- разрешить или запретить переход по ссылкамall- разрешить всё (эквивалентно index, follow)none- запретить всё (эквивалентно noindex, nofollow)noarchive- запретить сохранение кэшированной копииnosnippet- запретить показ сниппета в выдачеnotranslate- запретить перевод страницыnoimageindex- запретить индексацию изображений
Указание для разных поисковых систем
[править]Можно задавать разные директивы для разных поисковых систем:
X-Robots-Tag: googlebot: noindexX-Robots-Tag: yandex: noneX-Robots-Tag: bingbot: noindex, follow
Несколько директив
[править]Несколько директив можно указывать через запятую в одном заголовке или в нескольких отдельных заголовках.
Когда использовать X-Robots-Tag
[править]X-Robots-Tag особенно полезен в ситуациях, где невозможно использовать мета-тег robots.
Для не-HTML файлов
[править]Мета-тег robots работает только в HTML-страницах. Для PDF-файлов, изображений, видео, документов Word и Excel необходимо использовать X-Robots-Tag.
Для целых разделов сайта
[править]X-Robots-Tag можно настроить для целых разделов сайта через конфигурацию сервера.
Динамическое управление
[править]X-Robots-Tag можно устанавливать программно в зависимости от условий. Например, для страниц с фильтрами, которые не должны индексироваться.
Переопределение общих правил
[править]X-Robots-Tag может переопределять настройки, заданные в Robots.txt.
Настройка X-Robots-Tag
[править]Способ настройки зависит от сервера и используемых технологий.
В Apache (.htaccess)
[править]# Для всех файлов
Header set X-Robots-Tag "noindex, follow"
# Для конкретных типов файлов
<FilesMatch "\.(pdf|doc|docx|xls|xlsx)$">
Header set X-Robots-Tag "noindex, nofollow"
</FilesMatch>
# Для конкретного раздела
<LocationMatch "^/admin/">
Header set X-Robots-Tag "noindex, nofollow"
</LocationMatch>
В Nginx
[править]# Для всех файлов
add_header X-Robots-Tag "noindex, follow" always;
# Для конкретных типов файлов
location ~* \.(pdf|doc|docx|xls|xlsx)$ {
add_header X-Robots-Tag "noindex, nofollow" always;
}
# Для конкретного раздела
location /admin/ {
add_header X-Robots-Tag "noindex, nofollow" always;
}
В PHP
[править]header("X-Robots-Tag: noindex, follow");
X-Robots-Tag vs Robots.txt vs Мета-тег noindex
[править]Разные инструменты управления индексацией имеют свои особенности.
| X-Robots-Tag | Мета-тег noindex | robots.txt (Disallow) | |
|---|---|---|---|
| Где применяется | HTTP-заголовок | HTML-код страницы | Отдельный файл |
| Для каких файлов | Любых | Только HTML | Любых |
| Робот видит файл | Да | Да | Нет |
| Управление индексацией | Да | Да | Нет (только обход) |
| Гибкость настройки | Высокая (по типу файлов, разделам) | Постраничная | По разделам |
Проверка X-Robots-Tag
[править]Проверить наличие и правильность X-Robots-Tag можно несколькими способами.
Инструменты разработчика браузера
[править]Вкладка Network → просмотр заголовков ответа.
Онлайн-инструменты
[править]Сервисы проверки HTTP-заголовков (например, httpstatus.io, redirectcheck.com).
Командная строка
[править]curl -I https://marketwiki.ru/file.pdf
Яндекс.Вебмастер и Google Search Console
[править]В панелях вебмастеров есть отчёты о проблемах с индексацией, которые могут указывать на неправильное использование X-Robots-Tag.
Типичные ошибки
[править]- Использование X-Robots-Tag для HTML-страниц, где можно использовать мета-тег (не ошибка, но менее стандартно)
- Случайное закрытие от индексации важных страниц или файлов
- Неправильный синтаксис (опечатки в директивах)
- Противоречивые директивы в разных заголовках
- Забытые X-Robots-Tag после завершения тестирования
- Игнорирование регистра в названиях директив
