Co to jest link kanoniczny?

Link kanoniczny to tag HTML-owy z atrybutem rel="canonical" lub status odpowiedzi serwera w nagłówku HTTP, który mówi wyszukiwarce internetowej, który adres jest adresem głównym | podstawowym | preferowanym(kanonicznym) przez nas dla danej treści. Link kanoniczny pomaga wyszukiwarką w konsolidacja duplikatów adresów URL, a dzięki temu pomaga zapobiegać w indeksowaniu zduplikowanych adresów i pokazywaniu ich w SERP-ach.

Google na łamach dokumentcji informuje nas, że strony, które łączymy canonicalem nie muszą być takie same. Piszą również, że niewielkie zmiany takie jak nawet sortowanie, filtrowanie indeksów(stron kategorii) nie sprawią, że strona będzie uznana za unikalną pomimo wdrożonego linku kanonicznego.

Dodatkowo Google wspomina, że "strona kanoniczna może znajdować się w innej domenie niż duplikat". Pozwala nam to wskazywać poprawnie duplikaty pr-owych artykułów umieszczanych u partnerów. Należy pamiętać również, że gdy posiadamy wdrożoną wersję AMP strony, to canonical musi być jednak wskazywany do tej samej domeny, w przeciwnym razie raportowane jest to w GSC jako błąd.

Przykład użycia

<link rel="canonical" href="https://optymeo.pl/canonical.html" />

Powyższy przykład pokazuje wyszukiwarce, że chcemy indeksować adres w postaci https://optymeo.pl/canonical.html, że nie chcemy indeksować np. parametrów, które można dopisywać do adresu https://optymeo.pl/canonical.html?zdrodlo=newsletter (pamiętając, że na takim adresie również ma pokazywać się canonical w postaci https://optymeo.pl/canonical.html).

Gdzie w kodzie umieścić rel=canonical?

Link kanoniczny powinien być umieszczony w sekcji head i mieć postać Alternatywną lub dodatkową opcją jest zwrócenie canonicala w odpowiedzi HTTP. Podejście takie umożliwia zwrócenie linku kanonicznego dla plików PDF lub grafiki, które też mogą być duplikowane. Schemat odpowiedzi dla canonicala w nagłówki powinien mieć postać jak w przykładowym linku poniżej:

Link: <https://optymeo.pl/audyt-seo.pdf>; rel="canonical"

Google pierwszy raz wspomniało o możliwości dodawania canonicala w nagłówku odpowiedzi serwera tutaj https://webmasters.googleblog.com/2011/06/supporting-relcanonical-http-headers.html

Link kanoniczny vs Crawling Budget

Linki kanoniczne nie są rozwiązaniem na całe zło duplikacji treści i nie powinien dać nam się zapomnieć z pilnowaniem uporządkowanej i przemyślanej struktury strony, bo co najważniejsze link kanoniczny nie chroni naszej strony przed marnowaniem budżetu podstron, które indeksuje nam GoogleBot. Crawling budget, bo o nim mowa jest kluczowy przy dużych stronach internetowych, przy stronach zgłoszonych do programu Google News, przy stronach na których nam zależy, aby się indeksowały nowe rzeczy i żeby GoogleBot nie marnował swoich przebiegów na zduplikowanych(ale wyciętych canonicalem) podstron.

Indeksowanie stron niekanonicznych

Należy również pamiętać, że link kanoniczny jest tylko sugerowaną informacją, którą wysyłamy do wyszukiwarki. Jeżeli linkujemy do linku niekanonicznego to często Google może wybrać link niekanoniczny i zaindeksować go w wynikach.Możemy sprawdzić w nowej wersji Google Search Console, który adres Google wybrało jako link kanoniczny strony. Informację tę możemy wyfiltrować również w raportach o Stanie naszej strony internetowej. Google oznacza to jako "Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik".

Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik. Zrzut ekranu z Google Search Console/Raport Stan

Najczęstsze błędy podczas wdrażania rel=canonical

rel=canonical w - link kanoniczny powinniśmy implementować w sekcji, umieszczenie tagu z canonicalem w sekcjispowoduje jego ignorowanie.

rel=canonical jako ścieżka względna - link kanoniczny musi zostać podany jako pełny adres z domeną i protokołem. Możliwe jest przecież za pomocą linku kanonicznego wskazywanie preferowanej domeny(subdomeny) czy nawet protokołu, jeżeli z jakiś niezrozumiałych powodów musimy mieć dwa protokoły na zewnątrz(http/https).

Historia linku kanonicznego sięga początku 2009 roku, pierwszy wpis można znaleźć na branżowym blogu Google pod adresem https://webmasters.googleblog.com/2009/02/specify-your-canonical.html