Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

12.03.2021

9522

2м

эксперт по контент-маркетингу

Ольга Коцофане

5 марта на официальном YouTube-канале Google Search Central состоялась видеовстреча Google SEO. На ней была вновь затронута тема дублированного контента. Так, Джон Мюллер рассказал о методе прогнозирования, который Google использует для обнаружения дублей. Он заключается в том, что поисковая система осуществляет поиск дубликатов путем сравнения шаблонов URL. Это позволяет Google сэкономить ресурсы на этапе индексации и сканирования страниц. Однако есть один недостаток такого широкого подхода к поиску дублей. Если URL-адреса нескольких страниц на вашем сайте будут похожи, роботы могут расценить их как дубли и исключить из индекса Google, несмотря на то, что контент на самих страницах будет уникален.

Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

Вот, что говорит Джон Мюллер о методе прогнозирования для поиска дублей:

«С нашей стороны есть несколько уровней, когда мы пытаемся понять, есть ли на сайте дублированный контент. Во-первых, когда мы смотрим на содержимое страницы напрямую и видим, что одна страница имеет одно содержимое, а другая страница — другое содержимое, мы должны рассматривать их как отдельные страницы. Другая вещь — это своего рода более широкий прогностический подход, когда мы смотрим на структуру URL-адресов веб-сайта. Ранее мы видели, что URL-адреса, которые выглядят похожими, имели одинаковое содержание. Затем мы, по сути, изучили шаблон и подтвердили, что URL-адреса, которые выглядят так, совпадают с URL-адресами, которые выглядят вот так.

Теперь даже не глядя на отдельные URL-адреса, мы иногда можем избавить себя от сканирования и индексации и просто сосредоточится на этих предполагаемых или очень вероятных случаях дублирования. И я видел, как это происходило с такими вещами, как города. Наши системы распознают, что то, что вы указываете в качестве названия города, не так актуально для фактических URL-адресов. И обычно мы изучаем такую схему, когда сайт предоставляет много одного и того же контента с альтернативными названиями».

Что делать, если на разных URL-адресах находится дублированный контент?

В качестве ситуации с дублированным контентом, который вынужденно появился на разных URL-адресах, Джон Мюллер из Google привел такой пример:

«Может случиться так, что вы возьмете один город, а затем другой город в одном километре от первого, и страницы событий которые вы показываете для первого города будут точно такими же как и для второго, потому что одни и те же события актуальны для обоих этих мест. Также вы берете город, может быть, в пяти километрах отсюда, и снова показываете точно такие же события. И с нашей стороны, это может легко закончиться ситуацией, когда мы скажем, что мы проверили 10 URL-адресов событий, и этот параметр, который выглядит как название города, на самом деле не имеет значения, потому что мы проверили 10 из них, и он показал тот же контент. Тогда наши системы могут сказать, что, может быть, название города в целом не имеет значения, и мы можем просто проигнорировать его.»

В качестве потенциального решения этой проблемы Джон Мюллер из Google предлагает максимально ограничивать подобные ситуации с наличием дублированного контента.

«Итак, что я бы попытался сделать в таком случае? Посмотреть, есть ли у вас такого рода ситуации, когда присутствует сильное дублирование контента, и попытаться найти способы максимально ограничить это. Это можно сделать, используя что-то вроде rel canonical на странице и сказав: ну, этот маленький город, который находится прямо за пределами большого города; я установлю каноническое значение для большого города, потому что он показывает точно такой же контент.»

Полный ответ Джона Мюллера на видеовстрече:

Выводы

Джон Мюллер подытожил, что не считает описанный аспект дублированного контента большой проблемой. Также он отметил, что за дублированный контент нет никаких штрафов и он не относится к отрицательным сигналам ранжирования. В лучшем случае Google просто не проиндексирует повторяющийся контент. Однако большое количество дублированного контента, которое не связано с локализацией или спецификой темы, все-таки нежелательно.

Также читайте другие статьи в блоге Webpromo:

И подписывайтесь на наш Telegram-канал про маркетинг.