Аллан Скотт (Allan Scott), инженер программного обеспечения команды индексирования Google, перечислил в блоге Webmaster Central пять наиболее распространенных ошибок, которые допускают вебмастера при использовании атрибута rel=»canonical», а также дал несколько важных советов по применению данного тега.
Прежде всего, представитель поиска напомнил специалистам отрасли о том, что атрибут канонической страницы чётко указывает поисковым роботам, на какой именно экземпляр из набора страниц с похожим содержанием ссылаются дубликаты. При этом, дополнительные свойства адреса (к примеру PageRank) и связанные сигналы (качество входящей ссылочной массы) также переносятся с дублированных страниц на каноническую. В настоящее время атрибут rel=»canonical» поддерживают все ведущие западные поисковые системы: Yahoo!, Bing, и Google.
Однако зачастую применение атрибута rel=»canonical» вызывает у вебмастеров определенные трудности. В свою очередь, ошибки, связанные с указанием канонической страницы могут повлиять и на отображение страниц ресурса в поисковой выдаче.
Чтобы избежать подобных ошибок, специалисты Google рекомендуют придерживаться следующих общих правил при проставлении атрибута rel=»canonical»:
- Большинство дублированных страниц должно содержать ссылки на канонический адрес.
- Важно убедиться в том, что страница, на которую ссылаются при помощи атрибута rel=»canonical» существует, а ее URL — правильный (проверьте не возвращает ли сервер ошибку 404 ).
- Необходимо убедиться в том, что каноническая страница не закрыта для индексации поисковыми роботами.
- Важно четко понимать, какую страницу вебмастер хочет видеть в результатах поиска, именно ее и следует указывать как каноническую (к примеру, если сайт содержит набор страниц с одной и той же моделью товара, различающегося по цвету — целесообразно в качестве канонической указать страницу с наиболее популярным цветом).
- Не стоит забывать о включении атрибута rel=»canonical» в раздел документа кода HTML.
- Важно избегать использования атрибута rel=»canonical» более одного раза для одной страницы. В противном случае поисковик просто-напросто проигнорирует указание атрибута.
Далее Аллан Скотт перечислил 5 основных ошибок, допускаемых вебмасетрами и оптимизаторами при применении атрибута rel=»canonical»:
Ошибка 1. Атрибут rel=»canonical» использован для первой страницы серии пагинации:
Представьте, что статья на вашем сайте имеет несколько страниц:
- example.com/article?story=cupcake-news&page=1
- example.com/article?story=cupcake-news&page=2
- и т.д.
В данном случае страницы 2 и 3 не являются дубликатами, а значит и применение атрибута rel=»canonical» для указания в качестве канонической первой страницы документа будет ошибкой. Данная ошибка может повлечь за собой выпадение страниц 2 и 3 из индекса.
В подобных случаях представители Google рекомендуют использовать атрибут rel=»canonical» для страниц компонента, указывая в качестве канонического, адрес страницы, на которой расположена статья целиком.
Кроме того, при разбиении документа на страницы важно грамотно применять HTML-атрибуты rel=»next» и rel=»prev», позволяющие указать на взаимосвязь между отдельными URL.
Ошибка 2. Абсолютные ссылки записываются как относительные:
Безусловно, rel=»canonical» можно использовать как для абсолютных, так для относительных ссылок, однако Google рекомендует использовать абсолютные ссылки для минимизации возможных ошибок. Если в документе указана базовая ссылка, то все относительные ссылки будут вычисляться на ее основе.
Однако в случаях, когда абсолютные ссылки на каноническую страницу по ошибке записываются как относительные (<link rel=canonical href=“example.com/cupcake.html”/> вместоhttp://example.com/example.com/cupcake.html), алгоритмы могут проигнорировать то, что данная страница была указана в качестве канонической.
Ошибка 3. Если каноническими назначено несколько страниц из набора с похожим содержанием, или атрибут rel=»canonical» использован по ошибке:
Часто специалисты Google наблюдают следующую ситуацию: вебмастер копирует шаблон страницы, забывая при этом изменить значение атрибута rel=»canonical»
Если вы используете шаблоны – не забывайте проверять, не был ли случайно скопирован атрибут rel=»canonical».
Еще одна ошибка вебмастеров, когда каноническими назначается несколько страниц из набора с похожим содержанием. Часто это происходит из-за использования различных плагинов на странице. Код плагина по ошибке встраивается в атрибут rel=»canonical».
Важно понимать, что в обоих случаях алгоритмы Google распознают применение атрибута rel=»canonical» как ошибочное, и не учтут его использование при индексации.
Ошибка 4. Одна из категорий целевой страницы ссылается при помощи атрибута rel=»canonical» на избранную статью:
При таком подходе в индекс попадет только страница со статьёй, сама же страница категории не будет проиндексирована.
Ошибка 5. Атрибут rel=»canonical» используется в разделе документа <body> :
Как уже говорилось выше, атрибут rel=»canonical» должен быть включен в раздел документа кода HTML, при этом он не должен попадать в раздел документа <body>. В противном случае алгоритмы Google не будут учитывать использование данного тега, особенно если он будет показываться обычного текста, или тегов, которые мы обычно присутствуют в разделе <body>.
Дополнительная информация, касающаяся применения атрибута rel=»canonical» доступна на формуе Webmaster Help.