
Разъяснение сообщений Google Search Console
Действительно, эти уведомления от Google Search Console могут вызывать недоумение, особенно если вы не уверены, что "намеренно" создавали такие ситуации. Давайте разберем каждую из причин, по которым страницы могут не индексироваться, и что с этим делать.
Общий принцип: Google постоянно стремится индексировать только уникальный и наиболее релевантный контент. Если есть несколько версий одной и той же страницы или страница перенаправляется, Google считает, что нет необходимости индексировать каждую из них, чтобы не дублировать информацию в своем индексе.
1. "Страница с переадресацией" (Page with redirect)
Что это значит: Это означает, что когда Googlebot (робот Google) заходит на определенный URL, он получает сигнал (например, HTTP-код 301 или 302), который указывает ему перейти на другой URL. Google не индексирует исходный URL, поскольку "реальный" контент находится по адресу, на который идет переадресация.
Почему это происходит (намеренно и ненамеренно):
Намеренно:
- Изменение структуры URL: Вы изменили URL страницы, и старый URL перенаправляет на новый. Это правильно и необходимо для сохранения ссылочного веса.
- HTTP на HTTPS: Весь трафик с HTTP-версии сайта перенаправляется на HTTPS-версию. Это стандартная практика безопасности.
- С www на без www (или наоборот): Вы выбрали одну каноническую версию домена (например,
site.com
вместоwww.site.com
) и настроили перенаправление. - Объединение страниц: Вы объединили две старые страницы в одну новую и настроили перенаправление со старых на новую.
- Удаление дубликатов: Например, если у вас было
site.com/index.html
, и вы перенаправили это наsite.com/
.
Ненамеренно (что может быть проблемой):
- Ошибки в настройке перенаправлений: Циклические перенаправления, слишком много перенаправлений в цепочке, или перенаправления на неверные URL.
- Плагины/CMS: Некоторые плагины или настройки CMS могут автоматически создавать перенаправления, о которых вы не знаете (например, после изменения заголовков постов).
- Внутренние ссылки: На сайте остались внутренние ссылки на старые, перенаправленные URL. Это не критично, но лучше их обновить, чтобы Google не тратил время на ненужные переходы.
Что делать, если это "неполадка":
- Проверьте URL: Откройте указанный URL в браузере. Куда он перенаправляет? Это ожидаемое поведение?
- Проверьте цепочку перенаправлений: Используйте онлайн-инструменты для проверки перенаправлений (например,
httpstatus.io
или другие SEO-инструменты). Убедитесь, что цепочка не слишком длинная (идеально 1-2 перенаправления) и не содержит ошибок. - Обновите внутренние ссылки: Если вы обнаружили, что на вашем сайте есть ссылки на страницы, которые теперь перенаправляются, обновите эти ссылки, чтобы они указывали непосредственно на конечный URL. Это улучшит краулинговый бюджет и скорость загрузки.
- Убедитесь, что конечный URL индексируется: Если перенаправление намеренное, убедитесь, что страница, на которую идет перенаправление (конечный URL), успешно проиндексирована и появляется в Google.
Вывод по "Странице с переадресацией": В большинстве случаев это нормальное и желаемое поведение. Google просто сообщает вам, что он не индексирует исходный URL, а индексирует конечный URL. Проблема возникает только тогда, когда перенаправление ведет куда-то не туда, или конечная страница сама не индексируется.
2. "Вариант страницы с тегом canonical" (Duplicate, Google chose different canonical than user)
Что это значит: Это самое важное и часто недопонимаемое сообщение. Оно означает, что Google обнаружил несколько страниц с очень похожим или идентичным контентом. Вы либо явно указали одну из них как каноническую с помощью тега rel="canonical"
, либо Google сам выбрал одну из них как каноническую. В этом случае Google решил, что эта конкретная страница (которая показывается в отчете) не является канонической, и, следовательно, не будет ее индексировать.
Вариант "Duplicate, Google chose different canonical than user": Это означает, что вы указали одну страницу как каноническую, но Google по своим алгоритмам посчитал, что другая страница (которую он выбрал сам) является более подходящей канонической версией. Google будет индексировать ту, которую он выбрал.
Почему это происходит (намеренно и ненамеренно):
Намеренно (когда это нормально):
- Фильтры и сортировка на сайте: У вас есть страница товаров
/products
, а затем ее версии/products?color=red
или/products?sort=price_asc
. Вы указали/products
как каноническую для всех этих вариантов. Это правильно. - Пагинация:
/category/page/1/
,/category/page/2/
и т.д. Иногда для страниц пагинации указываютrel="canonical"
на первую страницу. - UTM-метки и сессии: URL с параметрами отслеживания (например,
/article?utm_source=email
). Основная статьяarticle
является канонической. - Разные версии одной страницы:
site.com/page/
иsite.com/page/index.html
. Вы выбрали одну как каноническую. - Дублирование контента по ошибке: Вы случайно опубликовали одну и ту же статью по двум разным URL, а затем исправили это, установив
rel="canonical"
.
Ненамеренно (когда это проблема):
- Технические дубликаты: CMS создает дубликаты (например,
/category/product-name
и/product-name
). - Неправильная настройка CMS/плагина: Плагин SEO по умолчанию указывает неправильный канонический URL, или вы не настроили его должным образом.
- Отсутствие
/
в конце URL: Иногда/page
и/page/
могут восприниматься как разные URL. На сайте должна быть единая структура. - Доступ по HTTP и HTTPS / с www и без www: Если ваш сайт доступен по обоим протоколам или доменам, но
rel="canonical"
не настроен правильно, Google может решить, что эти версии дублируются. - Копирование контента: Вы скопировали контент с другого сайта, и Google распознал оригинальный источник.
Что делать, если это "неполадка":
- Проверьте указанный URL и его контент: Что это за страница? Какой на ней контент?
- Проверьте
rel="canonical"
: Посмотрите исходный код этой страницы (правой кнопкой мыши -> "Просмотр кода страницы" или "Inspect element") и найдите тег<link rel="canonical" href="...">
в секции<head>
.- Куда указывает
href
? Это тот URL, который вы хотели видеть каноническим? - Это самоссылающийся канонический? Если
href
указывает на тот же URL, на котором вы сейчас находитесь, значит, страница считает себя канонической.
- Куда указывает
- Проверьте контент "подозрительных" страниц:
- Сравните контент страницы, которую Google не индексирует, с контентом страницы, которую Google выбрал как каноническую. Они действительно очень похожи или идентичны?
- Если они должны быть разными, но Google считает их дубликатами, вам нужно уникализировать контент или пересмотреть структуру сайта.
- Если они должны быть одинаковыми, и вы правильно указали
rel="canonical"
на предпочитаемую версию, то это нормальное поведение. Google просто сообщает, что он индексирует только одну из этих страниц.
Пример сценария "Duplicate, Google chose different canonical than user":
- У вас есть страница
example.com/product-a
. - У вас также есть страница
example.com/product-a?sort=new
(которая показывает тот же продукт, но с параметром сортировки). - Вы установили
rel="canonical"
наexample.com/product-a?sort=new
на самой этой странице, указывая наexample.com/product-a
. - Google, однако, видит
example.com/product-a
как более чистый и основной URL, и игнорирует ваше предпочтение дляproduct-a?sort=new
. - В отчете вы увидите
example.com/product-a?sort=new
как "Duplicate, Google chose different canonical than user".
Что делать в этом случае:
- Если Google выбрал правильную каноническую: Ничего не делайте. Это означает, что Google согласился с вашей логикой (или пришел к такому же выводу), и индексирует ту версию, которую вы хотели.
- Если Google выбрал неправильную каноническую:
- Перепроверьте
rel="canonical"
: Убедитесь, что он указывает на действительно правильную каноническую страницу. Возможно, вы где-то ошиблись. - Уникализируйте контент: Если Google постоянно выбирает другую страницу, возможно, контент на ваших "неканонических" страницах слишком сильно отличается от того, на что вы указываете как на каноническое, или, наоборот, недостаточно уникален.
- Используйте 301-перенаправление: Если страница, которую Google считает "дубликатом", никогда не должна быть доступна напрямую (например, старая версия продукта), лучше настроить 301-перенаправление на новую, каноническую версию. Это более сильный сигнал для Google, чем
rel="canonical"
.
- Перепроверьте
Вывод по обоим пунктам:
- "Страница с переадресацией": Чаще всего это нормально. Убедитесь, что перенаправление ведет на нужную страницу, и что эта конечная страница индексируется.
- "Вариант страницы с тегом canonical": Это тоже часто нормально, особенно если вы активно управляете дубликатами. Это означает, что Google выбрал (или согласился с вашим выбором) каноническую версию, и не будет индексировать ее дубликаты. Проблема возникает, если Google выбирает не ту страницу, которую вы считаете канонической, или если он считает дубликатом страницу, которая по вашему мнению должна быть уникальной.
Ваша задача:
- Не паникуйте. Эти сообщения не всегда указывают на проблему.
- Зайдите в Google Search Console: Откройте отчет "Индексирование -> Страницы".
- Посмотрите примеры URL для каждой из этих категорий.
- Для каждого URL:
- Используйте инструмент "Проверка URL" в GSC.
- Проверьте, куда ведет перенаправление, или какая страница выбрана в качестве канонической.
- Примите решение:
- Это ожидаемое поведение? (Например, старый URL перенаправляет на новый, или страница с фильтром указывает на канонический продукт) -> Ничего не делайте.
- Это ошибка? (Например, перенаправление ведет на 404, или Google выбрал не ту каноническую страницу, или у вас есть две совершенно разные страницы, которые Google считает дубликатами) -> Устраните ошибку.
Google просто информирует вас о своем процессе индексации. Часто это просто означает, что он успешно разобрался с дубликатами и перенаправлениями, и вам не нужно предпринимать никаких действий. Главное — убедиться, что важные для вас страницы индексируются, а дубликаты и устаревшие URL корректно обрабатываются.