Атрибут rel= «canonical»: что это, зачем нужен и как использовать
Уникальность контента — фактор ранжирования веб-сайта в поисковике Google. Наличие дубликатов страниц или их частного содержимого негативно влияет на SEO. Фактически снижает рейтинг сайта. Поэтому для формирования корректной структуры сайта и решения проблемы дублирования следует использовать канонические ссылки. Атрибут rel=«canonical» ― инструмент технической навигации, который поможет поисковой системе быстро определить, какая из страниц с подобным содержимым является основной, а какая второстепенна. Далее мы подробно рассмотрим разницу между каноническими страницами и дублями, разберемся в алгоритмах Google и выясним, как использовать атрибут rel= «canonical» для SEO.
Канонические страницы и дубли – какая между ними разница?
Каноническим называется URL страницы, которую Google считает главной среди ее копий. Например, если одна и та же информация размещена по двум URL, таким как example.com?smartphone=1 и example.com/smartphone/1, одна из них будет выбрана Google как каноническая. Если несколько страниц почти идентичны (например, отличаются только параметрами сортировки или фильтрации по цене или цвету товара), Google включает их в одну группу и назначает URL одной из них каноническим. Именно эта страница из группы копий и будет индексироваться.
На сайте может быть несколько страниц с одинаковым или условно одинаковым контентом. Чтобы указать Google, какая из них приоритетна и которую нужно показывать в результатах поиска, добавляют атрибут rel= «canonical». Или если есть страницы, которые малоинформатны — например, страницы фильтров, добавляют канонический атрибут на основную страницу этого фильтра.
Атрибут rel= «canonical» прописывается в разделе head и выглядит следующим образом:
Как Google определяет канонические страницы?
Для определения канонических страниц работы Google используют ряд критериев:
- Протокол. Обычно система предпочитает защищенный протокол (https), а не незащищенный (http).
- Лучший домен. Если вы используете несколько доменов, Google определит лучший для пользователя.
- Качество страницы. Роботы предпочитают оригинальный и ролеватный контент.
- Наличие URL в файле Карты сайта.
- Маркер rel= «canonical». Наличие атрибута указывает на то, что вы самостоятельно определили каноническую страницу. Однако Google может отклонить этот выбор в пользу ссылки, больше соответствующей критериям.
Атрибут rel= «canonical» может использоваться для различных целей, например:
- избегание дублирования контента;
- обеспечение частичного дублирования страниц;
- для устранения автоматического создания дублей для печати;
- для удаления страниц фильтрации с поисковой выдачи.
Кроме того, атрибут применяется, когда трудно реализовать на сайте 301 редирект.
Как определить, какую страницу использовать как каноническую?
Иногда сложно решить, какую страницу следует выбрать основной, а какую — второстепенной. При выборе лучшей страницы для индексации обратите внимание на следующие критерии:
- Посещаемость страницы.
- Наличие внешних и внутренних ссылок, а также их количество.
Как указать каноническую страницу?
Для определения канонической страницы необходимо добавить маркер rel= «canonical» к HTML-коду страницы. Как это должно выглядеть:
В этом случае «https://example.com/a» — это URL-адрес страницы.
Важно: укажите полный адрес страницы, включая «http://» или «https://», чтобы избежать ошибок в HTTP-соединении.
Также необходимо помнить:
- Атрибут rel= «canonical» работает только с HTML-страницами.
- HTTP-заголовок подходит для всех типов страниц и устанавливается на разные сервера.
- Маркер каноникал более авторитетен для Google, чем Sitemap.
Иногда даже атрибут rel= «canonical» не способен «склеить» страницы между собой. Вот несколько причин, по которым так происходит:
- Если у вашего сайта есть версии как с защищенным протоколом, так и незащищенным, маркер не сработает. В таком случае поможет установка постраничного редиректа, который будет перенаправлять пользователей на необходимую версию.
- Когда страницы доступны как с «www», так и без. В этом случае также поможет постраничный редирект.
- Googlebot можете отклонить рекомендации, указанные в атрибуте rel= «canonical», если содержимое страниц существенно разное. Возможное решение — редактирование контента для большей идентичности.
Тег rel= «canonical» объединяет страницы только в том случае, если канонические страницы, выбранные роботом и пользователем, соответствуют друг другу. Есть несколько ситуаций, когда метод решает проблему дублирования максимально эффективно:
- Когда товар имеет несколько URL, а атрибут rel= «canonical» указывает на основную страницу. Например, сочетание продукта со страницы «Распродажа» с главной страницей данного продукта.
- Если страницы имеют параметры get, которые не влияют на содержимое.
Важно: действия Google иногда могут быть неожиданными — даже если вы выбрали определенную страницу, как каноническую, робот предпочтет другую, которая больше соответствует необходимым параметрам. Четко определить причины подобных явлений невозможно, так как все правила базируются на наблюдении и опыте специалистов.
Правила настройки канонических URL
При настройках канонических ссылок часто возникают трудности. Соблюдение ряда простых правил поможет избежать распространенных ошибок:
- Каждая страница должна иметь только одну каноническую ссылку в разделе head.
- Проверьте, индексируется ли каноническая страница.
- Избегайте сложных структур ссылок и не создавайте цепочки канонических URL-адресов.
- При использовании различных методов размещения ссылок с атрибутом каноникал, таких как XML-карта и страницы сайта, ссылки приоритетных страниц должны совпадать.
- Отдавайте предпочтение абсолютным ссылкам, чтобы избежать ошибок в каноническом URL.
Пример:
Не правильно:
Правильно:
Распространены ошибки канонизации URL и как их избежать
Неправильная реализация канонических URL может привести к потере позиций в поисковой выдаче, снижению трафика и проблемам с индексацией. Рассмотрим наиболее распространенные ошибки в канонизации URL и способы их избегания:
1. Отсутствие или некорректное использование атрибута rel=«canonical»
Проблема:
Не все дубликаты страниц имеют правильно указанный канонический URL или этот тэг отсутствует вообще. Это приводит к тому, что Google самостоятельно выбирает версию страницы для индексации.
Решение:
Добавьте корректный тег link rel=«canonical» в раздел head HTML-кода страницы.
2. Внутренние ссылки на неканонические URL
Проблема:
Внутренние ссылки ведут на альтернативные странички или дубли вместо канонических. Это затрудняет поисковые системы для определения основной страницы.
Решение:
Убедитесь, что все внутренние ссылки на сайте ведутся именно на канонические URL. Это поможет поисковым системам лучше понимать структуру сайта.
3. Различные канонические URL для одной страницы
Проблема:
Использование различных методов канонизации (например, тег rel=«canonical», файл Sitemap и редиректы) с указанием различных канонических URL для одной страницы. Это создает спорные сигналы для поисковых систем.
Решение:
Все методы канонизации должны указывать на один и тот же URL. Необходимо обеспечить согласованность между тэгами rel=«canonical», файлами Sitemap и настройками редиректов.
4. Канонизация заблокированных страниц
Проблема:
Страницы, указанные как канонические, заблокированы в файле robots.txt или имеют директиву noindex. Это делает невозможным индексацию канонической версии.
Решение:
Нельзя указывать как канонические страницы, которые заблокированы для индексации. Убедитесь, что канонические URL доступны для сканирования и индексации.
5. Использование noindex вместо rel=«canonical»
Проблема:
Иногда для исключения страниц из поиска используют директиву noindex вместо правильного использования rel=«canonical». Это полностью исключает страницу из поиска вместо того, чтобы передать ее вес канонической странице.
Решение:
Используйте тег link rel=«canonical» для передачи веса дублированных страниц канонической, а не директиву noindex. Эта директива применяется только в том случае, если страницу необходимо полностью исключить из индексации.
6. Отсутствие канонизации для URL с параметрами
Проблема:
Страницы с одинаковым контентом, но разными URL-параметрами (например, UTM-метки), создают дубликаты. Это приводит к распылению ссылочного веса.
Решение:
Используйте тег rel=«canonical» для страниц с параметрами, чтобы указать поисковым системам основной URL без параметров.
7. Неправильное использование редиректов
Проблема:
Использование временных редиректив (302) вместо постоянных (301) для дублированных страниц. Это не передает полный ссылочный вес на канонической странице.
Решение:
Для окончательного перенаправления следует использовать 301 редирект, сообщающий поисковым системам о постоянном изменении адреса.
8. Канонизация с помощью Sitemap без rel=«canonical»
Проблема:
Указание канонических страниц только в файле Sitemap без использования тега rel=«canonical». Google воспринимает Sitemap как более слабый сигнал.
Решение:
Совместите использование Sitemap и тега rel=«canonical» для усиления сигнала. Это повышает вероятность того, что выбранная страница будет проиндексирована как основная.
Поиск канонических ошибок с использованием Netpeak Spider
Чтобы обнаружить канонические ошибки и убедиться в правильной работе атрибута rel= «canonical», можно воспользоваться инструментом Netpeak Spider. Он полезен в идентификации нескольких видов ошибок:
- канонический тэг, заблокированный в файле robots.txt;
- цепочка канонических ссылок;
- дубликаты канонических URL.
Как провести проверку:
- Запустите программу Netpeak Spider.
- Перейдите к настройкам и выберите «Параметры» на боковой панели.
- Укажите параметры «Canonical» и «Каноническая URL» в разделе «Индексация».
- Введите домен, который хотите проверить, и нажмите «Старт» для начала сканирования.
- После завершения проверки ознакомьтесь с найденными ошибками: для этого перейдите на вкладку «Отчеты» на боковой панели и найдите «Ошибки».
- При необходимости экспортируйте полученные данные для дальнейшего анализа.
Кроме Netpeak Spider, для анализа ошибок можно выбрать и другие сервисы, например, Screaming Frog.
Выводы
Правильная работа с каноническими ссылками — важный аспект оптимизации веб-сайта для поисковых систем, ведь помогает решить проблемы с дублированием страниц и улучшить SEO-показатели. Что важно знать о канонических URL:
- Каноническая страница – это основная версия страницы, которую поисковые системы воспринимают как главную среди подобных.
- Google выбирает каноническую страницу по ряду сигналов: протокола, домена, качества страницы, наличия в файле Sitemap и наличия маркера rel= «canonical».
- Чтобы самостоятельно выбрать каноническую страницу, необходимо использовать атрибут rel= «canonical». Следуйте рекомендациям, чтобы маркер заработал.
- Изменение домена может привести к возникновению проблем с определением канонической URL. В таком случае следует поработать над оригинальностью контента.
- Такие инструменты как Netpeak Spider помогают в поиске канонических ошибок.
Используйте данные из этой статьи, чтобы повысить позиции вашего сайта в поиске и эффективности SEO-стратегии.