Атрибут rel= «canonical»: что это, зачем нужен и как использовать
04.12.2023
Уникальность контента — фактор ранжирования веб-сайта в поисковике Google. Наличие дубликатов страниц или их частного содержимого негативно влияет на SEO. Фактически снижает рейтинг сайта. Поэтому для формирования корректной структуры сайта и решения проблемы дублирования следует использовать канонические ссылки. Атрибут rel=«canonical» ― инструмент технической навигации, который поможет поисковой системе быстро определить, какая из страниц с подобным содержимым является основной, а какая второстепенна. Далее мы подробно рассмотрим разницу между каноническими страницами и дублями, разберемся в алгоритмах Google и выясним, как использовать атрибут rel= «canonical» для SEO.
Канонические страницы и дубли – какая между ними разница?
Каноническим называется URL страницы, которую Google считает главной среди ее копий. Например, если одна и та же информация размещена по двум URL, таким как example.com?smartphone=1 и example.com/smartphone/1, одна из них будет выбрана Google как каноническая. Если несколько страниц почти идентичны (например, отличаются только параметрами сортировки или фильтрации по цене или цвету товара), Google включает их в одну группу и назначает URL одной из них каноническим. Именно эта страница из группы копий и будет индексироваться.
На сайте может быть несколько страниц с одинаковым или условно одинаковым контентом. Чтобы указать Google, какая из них приоритетна и которую нужно показывать в результатах поиска, добавляют атрибут rel= «canonical». Или если есть страницы, которые малоинформатны — например, страницы фильтров, добавляют канонический атрибут на основную страницу этого фильтра.
Атрибут rel= «canonical» прописывается в разделе head и выглядит следующим образом:
Как Google определяет канонические страницы?
Для определения канонических страниц работы Google используют ряд критериев:
- Протокол. Обычно система предпочитает защищенный протокол (https), а не незащищенный (http).
- Лучший домен. Если вы используете несколько доменов, Google определит лучший для пользователя.
- Качество страницы. Роботы предпочитают оригинальный и ролеватный контент.
- Наличие URL в файле Карты сайта.
- Маркер rel= «canonical». Наличие атрибута указывает на то, что вы самостоятельно определили каноническую страницу. Однако Google может отклонить этот выбор в пользу ссылки, больше соответствующей критериям.
Атрибут rel= «canonical» может использоваться для различных целей, например:
- избегание дублирования контента;
- обеспечение частичного дублирования страниц;
- для устранения автоматического создания дублей для печати;
- для удаления страниц фильтрации с поисковой выдачи.
Кроме того, атрибут применяется, когда трудно реализовать на сайте 301 редирект.
Как определить, какую страницу использовать как каноническую?
Иногда сложно решить, какую страницу следует выбрать основной, а какую — второстепенной. При выборе лучшей страницы для индексации обратите внимание на следующие критерии:
- Посещаемость страницы.
- Наличие внешних и внутренних ссылок, а также их количество.
Как указать каноническую страницу?
Для определения канонической страницы необходимо добавить маркер rel= «canonical» к HTML-коду страницы. Как это должно выглядеть:
В этом случае «https://example.com/a» — это URL-адрес страницы.
Важно: укажите полный адрес страницы, включая «http://» или «https://», чтобы избежать ошибок в HTTP-соединении.
Также необходимо помнить:
- Атрибут rel= «canonical» работает только с HTML-страницами.
- HTTP-заголовок подходит для всех типов страниц и устанавливается на разные сервера.
- Маркер каноникал более авторитетен для Google, чем Sitemap.
Иногда даже атрибут rel= «canonical» не способен «склеить» страницы между собой. Вот несколько причин, по которым так происходит:
- Если у вашего сайта есть версии как с защищенным протоколом, так и незащищенным, маркер не сработает. В таком случае поможет установка постраничного редиректа, который будет перенаправлять пользователей на необходимую версию.
- Когда страницы доступны как с «www», так и без. В этом случае также поможет постраничный редирект.
- Googlebot можете отклонить рекомендации, указанные в атрибуте rel= «canonical», если содержимое страниц существенно разное. Возможное решение — редактирование контента для большей идентичности.
Тег rel= «canonical» объединяет страницы только в том случае, если канонические страницы, выбранные роботом и пользователем, соответствуют друг другу. Есть несколько ситуаций, когда метод решает проблему дублирования максимально эффективно:
- Когда товар имеет несколько URL, а атрибут rel= «canonical» указывает на основную страницу. Например, сочетание продукта со страницы «Распродажа» с главной страницей данного продукта.
- Если страницы имеют параметры get, которые не влияют на содержимое.
Важно: действия Google иногда могут быть неожиданными — даже если вы выбрали определенную страницу, как каноническую, робот предпочтет другую, которая больше соответствует необходимым параметрам. Четко определить причины подобных явлений невозможно, так как все правила базируются на наблюдении и опыте специалистов.
Правила настройки канонических URL
При настройках канонических ссылок часто возникают трудности. Соблюдение ряда простых правил поможет избежать распространенных ошибок:
- Каждая страница должна иметь только одну каноническую ссылку в разделе head.
- Проверьте, индексируется ли каноническая страница.
- Избегайте сложных структур ссылок и не создавайте цепочки канонических URL-адресов.
- При использовании различных методов размещения ссылок с атрибутом каноникал, таких как XML-карта и страницы сайта, ссылки приоритетных страниц должны совпадать.
- Отдавайте предпочтение абсолютным ссылкам, чтобы избежать ошибок в каноническом URL.
Пример:
Не правильно:
Правильно:
Поиск канонических ошибок с использованием Netpeak Spider
Чтобы обнаружить канонические ошибки и убедиться в правильной работе атрибута rel= «canonical», можно воспользоваться инструментом Netpeak Spider. Он полезен в идентификации нескольких видов ошибок:
- канонический тэг, заблокированный в файле robots.txt;
- цепочка канонических ссылок;
- дубликаты канонических URL.
Как провести проверку:
- Запустите программу Netpeak Spider.
- Перейдите к настройкам и выберите «Параметры» на боковой панели.
- Укажите параметры «Canonical» и «Каноническая URL» в разделе «Индексация».
- Введите домен, который хотите проверить, и нажмите «Старт» для начала сканирования.
- После завершения проверки ознакомьтесь с найденными ошибками: для этого перейдите на вкладку «Отчеты» на боковой панели и найдите «Ошибки».
- При необходимости экспортируйте полученные данные для дальнейшего анализа.
Кроме Netpeak Spider, для анализа ошибок можно выбрать и другие сервисы, например, Screaming Frog.
Выводы
Правильная работа с каноническими ссылками — важный аспект оптимизации веб-сайта для поисковых систем, ведь помогает решить проблемы с дублированием страниц и улучшить SEO-показатели. Что важно знать о канонических URL:
- Каноническая страница – это основная версия страницы, которую поисковые системы воспринимают как главную среди подобных.
- Google выбирает каноническую страницу по ряду сигналов: протокола, домена, качества страницы, наличия в файле Sitemap и наличия маркера rel= «canonical».
- Чтобы самостоятельно выбрать каноническую страницу, необходимо использовать атрибут rel= «canonical». Следуйте рекомендациям, чтобы маркер заработал.
- Изменение домена может привести к возникновению проблем с определением канонической URL. В таком случае следует поработать над оригинальностью контента.
- Такие инструменты как Netpeak Spider помогают в поиске канонических ошибок.
Используйте данные из этой статьи, чтобы повысить позиции вашего сайта в поиске и эффективности SEO-стратегии.