Главная » Блог » Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

12.03.2021

Ольга Коцофане


5 марта на официальном YouTube-канале Google Search Central состоялась видеовстреча Google SEO. На ней была вновь затронута тема дублированного контента. Так, Джон Мюллер рассказал о методе прогнозирования, который Google использует для обнаружения дублей. Он заключается в том, что поисковая система осуществляет поиск дубликатов путем сравнения шаблонов URL. Это позволяет Google сэкономить ресурсы на этапе индексации и сканирования страниц. Однако есть один недостаток такого широкого подхода к поиску дублей. Если URL-адреса нескольких страниц на вашем сайте будут похожи, роботы могут расценить их как дубли и исключить из индекса Google, несмотря на то, что контент на самих страницах будет уникален.

Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

 

Вот, что говорит Джон Мюллер о методе прогнозирования для поиска дублей:

«С нашей стороны есть несколько уровней, когда мы пытаемся понять, есть ли на сайте дублированный контент. Во-первых, когда мы смотрим на содержимое страницы напрямую и видим, что одна страница имеет одно содержимое, а другая страница — другое содержимое, мы должны рассматривать их как отдельные страницы. Другая вещь — это своего рода более широкий прогностический подход, когда мы смотрим на структуру URL-адресов веб-сайта. Ранее мы видели, что URL-адреса, которые выглядят похожими, имели одинаковое содержание. Затем мы, по сути, изучили шаблон и подтвердили, что URL-адреса, которые выглядят так, совпадают с URL-адресами, которые выглядят вот так.

Теперь даже не глядя на отдельные URL-адреса, мы иногда можем избавить себя от сканирования и индексации и просто сосредоточится на этих предполагаемых или очень вероятных случаях дублирования. И я видел, как это происходило с такими вещами, как города. Наши системы распознают, что то, что вы указываете в качестве названия города, не так актуально для фактических URL-адресов. И обычно мы изучаем такую ​​схему, когда сайт предоставляет много одного и того же контента с альтернативными названиями».



 

Что делать, если на разных URL-адресах находится дублированный контент?

В качестве ситуации с дублированным контентом, который вынужденно появился на разных URL-адресах, Джон Мюллер из Google привел такой пример:

«Может случиться так, что вы возьмете один город, а затем другой город в одном километре от первого, и страницы событий которые вы показываете для первого города будут точно такими же как и для второго, потому что одни и те же события актуальны для обоих этих мест. Также вы берете город, может быть, в пяти километрах отсюда, и снова показываете точно такие же события. И с нашей стороны, это может легко закончиться ситуацией, когда мы скажем, что мы проверили 10 URL-адресов событий, и этот параметр, который выглядит как название города, на самом деле не имеет значения, потому что мы проверили 10 из них, и он показал тот же контент. Тогда наши системы могут сказать, что, может быть, название города в целом не имеет значения, и мы можем просто проигнорировать его.»

В качестве потенциального решения этой проблемы Джон Мюллер из Google предлагает максимально ограничивать подобные ситуации с наличием дублированного контента.

«Итак, что я бы попытался сделать в таком случае? Посмотреть, есть ли у вас такого рода ситуации, когда присутствует сильное дублирование контента, и попытаться найти способы максимально ограничить это. Это можно сделать, используя что-то вроде rel canonical на странице и сказав: ну, этот маленький город, который находится прямо за пределами большого города; я установлю каноническое значение для большого города, потому что он показывает точно такой же контент.»



 

Полный ответ Джона Мюллера на видеовстрече:

 

Выводы

Джон Мюллер подытожил, что не считает описанный аспект дублированного контента большой проблемой. Также он отметил, что за дублированный контент нет никаких штрафов и он не относится к отрицательным сигналам ранжирования. В лучшем случае Google просто не проиндексирует повторяющийся контент. Однако большое количество дублированного контента, которое не связано с локализацией или спецификой темы, все-таки нежелательно.

 

Также читайте другие статьи в блоге Webpromo:

И подписывайтесь на наш Telegram-канал про маркетинг.

Последние материалы рубрики

Как предоставить или убрать доступ к файлам в Google Docs....

Google Docs — простой и удобный способ поделиться...

Как заставить Google индексировать ваш сайт: 10 способов

Если сравнивать Google с библиотекой, то...

Что такое SaaS и как это работает

Большинство процессов в современном...

Как интегрировать ChatGPT в Google Sheets? Пошаговая инструкция

ChatGPT — это один из способов оптимизировать рабочие процессы и упростить себе жизнь. Рассмотрим два основных этапа, как правильно...

Остались вопросы?
Наши эксперты готовы ответить на них

Свяжитесь по указанному ниже телефону с нашим менеджером или воспользуйтесь услугой «Перезвонить мне». Мы свяжемся с вами в ближайшее время.

Команда Webpromo реализовывает все задачи, достигая лучших КРІ
Рекомендую Webpromo как надежных партнеров
Кратно выросли показатели прироста органического трафика
Середи многих мы выбрали Webpromo
Каждый участник — мастер своего дела
Ценю Webpromo за гибкость
Команда Webpromo - это как продолжение нашего отдела маркетинга
Спокоен за продвижение своих проектов в интернете

Мы используем cookie-файлы для предоставления вам наиболее актуальной информации.

Продолжая использовать сайт, Вы соглашаетесь с использованием cookie-файлов.