Атрибут rel= «canonical»: что это, зачем нужен и как использовать

14.01.2025

259

5м

редактор-журналист

Ольга Сомова

Уникальность контента — фактор ранжирования веб-сайта в поисковике Google. Наличие дубликатов страниц или их частного содержимого негативно влияет на SEO. Фактически снижает рейтинг сайта. Поэтому для формирования корректной структуры сайта и решения проблемы дублирования следует использовать канонические ссылки. Атрибут rel=«canonical» ― инструмент технической навигации, который поможет поисковой системе быстро определить, какая из страниц с подобным содержимым является основной, а какая второстепенна. Далее мы подробно рассмотрим разницу между каноническими страницами и дублями, разберемся в алгоритмах Google и выясним, как использовать атрибут rel= «canonical» для SEO.

Канонічні сторінки

Канонические страницы и дубли – какая между ними разница?

Каноническим называется URL страницы, которую Google считает главной среди ее копий. Например, если одна и та же информация размещена по двум URL, таким как example.com?smartphone=1 и example.com/smartphone/1, одна из них будет выбрана Google как каноническая. Если несколько страниц почти идентичны (например, отличаются только параметрами сортировки или фильтрации по цене или цвету товара), Google включает их в одну группу и назначает URL одной из них каноническим. Именно эта страница из группы копий и будет индексироваться.

На сайте может быть несколько страниц с одинаковым или условно одинаковым контентом. Чтобы указать Google, какая из них приоритетна и которую нужно показывать в результатах поиска, добавляют атрибут rel= «canonical». Или если есть страницы, которые малоинформатны — например, страницы фильтров, добавляют канонический атрибут на основную страницу этого фильтра.

Атрибут rel= «canonical» прописывается в разделе head и выглядит следующим образом:

Атрибут rel= «canonical» виглядає таким чином

Как Google определяет канонические страницы?

Для определения канонических страниц работы Google используют ряд критериев:

Протокол. Обычно система предпочитает защищенный протокол (https), а не незащищенный (http).
Лучший домен. Если вы используете несколько доменов, Google определит лучший для пользователя.
Качество страницы. Роботы предпочитают оригинальный и ролеватный контент.
Наличие URL в файле Карты сайта.
Маркер rel= «canonical». Наличие атрибута указывает на то, что вы самостоятельно определили каноническую страницу. Однако Google может отклонить этот выбор в пользу ссылки, больше соответствующей критериям.

Атрибут rel= «canonical» может использоваться для различных целей, например:

избегание дублирования контента;
обеспечение частичного дублирования страниц;
для устранения автоматического создания дублей для печати;
для удаления страниц фильтрации с поисковой выдачи.

Кроме того, атрибут применяется, когда трудно реализовать на сайте 301 редирект.

Как определить, какую страницу использовать как каноническую?

Иногда сложно решить, какую страницу следует выбрать основной, а какую — второстепенной. При выборе лучшей страницы для индексации обратите внимание на следующие критерии:

Посещаемость страницы.
Наличие внешних и внутренних ссылок, а также их количество.

Как указать каноническую страницу?

Для определения канонической страницы необходимо добавить маркер rel= «canonical» к HTML-коду страницы. Как это должно выглядеть:

Як вказати канонічну сторінку

В этом случае «https://example.com/a» — это URL-адрес страницы.

Важно: укажите полный адрес страницы, включая «http://» или «https://», чтобы избежать ошибок в HTTP-соединении.

Также необходимо помнить:

Атрибут rel= «canonical» работает только с HTML-страницами.
HTTP-заголовок подходит для всех типов страниц и устанавливается на разные сервера.
Маркер каноникал более авторитетен для Google, чем Sitemap.

Иногда даже атрибут rel= «canonical» не способен «склеить» страницы между собой. Вот несколько причин, по которым так происходит:

Если у вашего сайта есть версии как с защищенным протоколом, так и незащищенным, маркер не сработает. В таком случае поможет установка постраничного редиректа, который будет перенаправлять пользователей на необходимую версию.
Когда страницы доступны как с «www», так и без. В этом случае также поможет постраничный редирект.
Googlebot можете отклонить рекомендации, указанные в атрибуте rel= «canonical», если содержимое страниц существенно разное. Возможное решение — редактирование контента для большей идентичности.

Тег rel= «canonical» объединяет страницы только в том случае, если канонические страницы, выбранные роботом и пользователем, соответствуют друг другу. Есть несколько ситуаций, когда метод решает проблему дублирования максимально эффективно:

Когда товар имеет несколько URL, а атрибут rel= «canonical» указывает на основную страницу. Например, сочетание продукта со страницы «Распродажа» с главной страницей данного продукта.
Если страницы имеют параметры get, которые не влияют на содержимое.

Важно: действия Google иногда могут быть неожиданными — даже если вы выбрали определенную страницу, как каноническую, робот предпочтет другую, которая больше соответствует необходимым параметрам. Четко определить причины подобных явлений невозможно, так как все правила базируются на наблюдении и опыте специалистов.

Правила настройки канонических URL

При настройках канонических ссылок часто возникают трудности. Соблюдение ряда простых правил поможет избежать распространенных ошибок:

Каждая страница должна иметь только одну каноническую ссылку в разделе head.
Проверьте, индексируется ли каноническая страница.
Избегайте сложных структур ссылок и не создавайте цепочки канонических URL-адресов.
При использовании различных методов размещения ссылок с атрибутом каноникал, таких как XML-карта и страницы сайта, ссылки приоритетных страниц должны совпадать.
Отдавайте предпочтение абсолютным ссылкам, чтобы избежать ошибок в каноническом URL.

Пример:

Не правильно:

Неправильне використання атрибуту

Правильно:

Правильне використання атрибуту

Распространены ошибки канонизации URL и как их избежать

Неправильная реализация канонических URL может привести к потере позиций в поисковой выдаче, снижению трафика и проблемам с индексацией. Рассмотрим наиболее распространенные ошибки в канонизации URL и способы их избегания:

1. Отсутствие или некорректное использование атрибута rel=«canonical»

Проблема:

Не все дубликаты страниц имеют правильно указанный канонический URL или этот тэг отсутствует вообще. Это приводит к тому, что Google самостоятельно выбирает версию страницы для индексации.

Решение:

Добавьте корректный тег link rel=«canonical» в раздел head HTML-кода страницы.

2. Внутренние ссылки на неканонические URL

Проблема:

Внутренние ссылки ведут на альтернативные странички или дубли вместо канонических. Это затрудняет поисковые системы для определения основной страницы.

Решение:

Убедитесь, что все внутренние ссылки на сайте ведутся именно на канонические URL. Это поможет поисковым системам лучше понимать структуру сайта.

3. Различные канонические URL для одной страницы

Проблема:

Использование различных методов канонизации (например, тег rel=«canonical», файл Sitemap и редиректы) с указанием различных канонических URL для одной страницы. Это создает спорные сигналы для поисковых систем.

Решение:

Все методы канонизации должны указывать на один и тот же URL. Необходимо обеспечить согласованность между тэгами rel=«canonical», файлами Sitemap и настройками редиректов.

4. Канонизация заблокированных страниц

Проблема:

Страницы, указанные как канонические, заблокированы в файле robots.txt или имеют директиву noindex. Это делает невозможным индексацию канонической версии.

Решение:

Нельзя указывать как канонические страницы, которые заблокированы для индексации. Убедитесь, что канонические URL доступны для сканирования и индексации.

5. Использование noindex вместо rel=«canonical»

Проблема:

Иногда для исключения страниц из поиска используют директиву noindex вместо правильного использования rel=«canonical». Это полностью исключает страницу из поиска вместо того, чтобы передать ее вес канонической странице.

Решение:

Используйте тег link rel=«canonical» для передачи веса дублированных страниц канонической, а не директиву noindex. Эта директива применяется только в том случае, если страницу необходимо полностью исключить из индексации.

6. Отсутствие канонизации для URL с параметрами

Проблема:

Страницы с одинаковым контентом, но разными URL-параметрами (например, UTM-метки), создают дубликаты. Это приводит к распылению ссылочного веса.

Решение:

Используйте тег rel=«canonical» для страниц с параметрами, чтобы указать поисковым системам основной URL без параметров.

7. Неправильное использование редиректов

Проблема:

Использование временных редиректив (302) вместо постоянных (301) для дублированных страниц. Это не передает полный ссылочный вес на канонической странице.

Решение:

Для окончательного перенаправления следует использовать 301 редирект, сообщающий поисковым системам о постоянном изменении адреса.

8. Канонизация с помощью Sitemap без rel=«canonical»

Проблема:

Указание канонических страниц только в файле Sitemap без использования тега rel=«canonical». Google воспринимает Sitemap как более слабый сигнал.

Решение:

Совместите использование Sitemap и тега rel=«canonical» для усиления сигнала. Это повышает вероятность того, что выбранная страница будет проиндексирована как основная.

Поиск канонических ошибок с использованием Netpeak Spider

Чтобы обнаружить канонические ошибки и убедиться в правильной работе атрибута rel= «canonical», можно воспользоваться инструментом Netpeak Spider. Он полезен в идентификации нескольких видов ошибок:

канонический тэг, заблокированный в файле robots.txt;
цепочка канонических ссылок;
дубликаты канонических URL.

Как провести проверку:

Запустите программу Netpeak Spider.
Перейдите к настройкам и выберите «Параметры» на боковой панели.
Укажите параметры «Canonical» и «Каноническая URL» в разделе «Индексация».
Введите домен, который хотите проверить, и нажмите «Старт» для начала сканирования.
После завершения проверки ознакомьтесь с найденными ошибками: для этого перейдите на вкладку «Отчеты» на боковой панели и найдите «Ошибки».
При необходимости экспортируйте полученные данные для дальнейшего анализа.

Кроме Netpeak Spider, для анализа ошибок можно выбрать и другие сервисы, например, Screaming Frog.

Выводы

Правильная работа с каноническими ссылками — важный аспект оптимизации веб-сайта для поисковых систем, ведь помогает решить проблемы с дублированием страниц и улучшить SEO-показатели. Что важно знать о канонических URL:

Каноническая страница – это основная версия страницы, которую поисковые системы воспринимают как главную среди подобных.
Google выбирает каноническую страницу по ряду сигналов: протокола, домена, качества страницы, наличия в файле Sitemap и наличия маркера rel= «canonical».
Чтобы самостоятельно выбрать каноническую страницу, необходимо использовать атрибут rel= «canonical». Следуйте рекомендациям, чтобы маркер заработал.
Изменение домена может привести к возникновению проблем с определением канонической URL. В таком случае следует поработать над оригинальностью контента.
Такие инструменты как Netpeak Spider помогают в поиске канонических ошибок.

Используйте данные из этой статьи, чтобы повысить позиции вашего сайта в поиске и эффективности SEO-стратегии.