rel=canonical - link kanoniczny

Daniel Wlaźlak 23.09.2024 22:34

Zobacz jakie skomplikowane może być użycie linku kanonicznego. Poniżej pokazuję przykłady użycia linków kanonicznych, nie jest to jednak wytyczna, przeważnie na każdym portalu trzeba wypracować odpowiednią strategię canonicali. Często nie wystarczy dodać link kanoniczny, a trzeba zmienić strategię linkowania wewnętrznego, użyć tagów noindex lub starego i poczciwego robots.txt. Jeśli potrzebujesz zoptymalizować indeksowanie swojej strony, odezwij się do nas. Bierzemy najtrudniejsze przypadki.

Czym jest link kanoniczny?

Link kanoniczny to tag HTML-owy z atrybutem rel="canonical" lub status odpowiedzi serwera w nagłówku HTTP, który mówi wyszukiwarce internetowej, który adres jest adresem głównym | podstawowym | preferowanym (kanonicznym) przez nas dla danej treści. Link kanoniczny pomaga wyszukiwarką w konsolidacja duplikatów adresów URL, a dzięki temu pomaga zapobiegać w indeksowaniu zduplikowanych adresów i pokazywaniu ich w SERP-ach.

Google na łamach dokumentcji informuje nas, że strony, które łączymy canonicalem nie muszą być takie same. Piszą również, że niewielkie zmiany takie jak nawet sortowanie, filtrowanie indeksów(stron kategorii) nie sprawią, że strona będzie uznana za unikalną pomimo wdrożonego linku kanonicznego.

Dodatkowo Google wspomina, że "strona kanoniczna może znajdować się w innej domenie niż duplikat". Pozwala nam to wskazywać poprawnie duplikaty pr-owych artykułów umieszczanych u partnerów. Należy pamiętać również, że gdy posiadamy wdrożoną wersję AMP strony, to canonical musi być jednak wskazywany do tej samej domeny, w przeciwnym razie raportowane jest to w GSC jako błąd.

Przykład użycia linku kanonicznego

<link rel="canonical" href="https://optymeo.pl/canonical.html" />

Powyższy przykład pokazuje wyszukiwarce, że chcemy indeksować adres w postaci https://optymeo.pl/canonical.html, że nie chcemy indeksować np. parametrów, które można dopisywać do adresu https://optymeo.pl/canonical.html?zdrodlo=newsletter (pamiętając, że na takim adresie również ma pokazywać się canonical w postaci https://optymeo.pl/canonical.html).

Czym jest self canonical i dlaczego jest bardzo ważny?

Z indeksowaniem parametrów ściśle związane jest pojęcie self canonical. Self canonical, czyli kanoniczny link do samej siebie, to sytuacja, w której strona wskazuje na własny adres URL jako kanoniczny. Stosuje się go w celu jednoznacznego potwierdzenia wyszukiwarkom, że dana strona jest oryginalnym źródłem treści i powinna być traktowana priorytetowo w przypadku występowania innych, podobnych adresów URL. Dzięki temu unika się nieporozumień w algorytmach wyszukiwarek oraz ryzyka rozproszenia wartości SEO. Self canonical jest szczególnie przydatny, gdy na stronie pojawiają się różne wersje adresów (np. z parametrami URL o których wspomnieliśmy wyżej), które mogą powodować duplikację treści.

Gdzie w kodzie umieścić rel=canonical?

Link kanoniczny powinien być umieszczony w sekcji head i mieć postać Alternatywną lub dodatkową opcją jest zwrócenie canonicala w odpowiedzi HTTP. Podejście takie umożliwia zwrócenie linku kanonicznego dla plików PDF lub grafiki, które też mogą być duplikowane. Schemat odpowiedzi dla canonicala w nagłówki powinien mieć postać jak w przykładowym linku poniżej:

Link: <https://optymeo.pl/audyt-seo.pdf>; rel="canonical"

Google pierwszy raz wspomniało o możliwości dodawania canonicala w nagłówku odpowiedzi serwera tutaj https://webmasters.googleblog.com/2011/06/supporting-relcanonical-http-headers.html

Link kanoniczny vs Crawling Budget

Linki kanoniczne nie są rozwiązaniem na całe zło duplikacji treści i nie powinien dać nam się zapomnieć z pilnowaniem uporządkowanej i przemyślanej struktury strony, bo co najważniejsze link kanoniczny nie chroni naszej strony przed marnowaniem budżetu podstron, które indeksuje nam GoogleBot. Crawling budget, bo o nim mowa jest kluczowy przy dużych stronach internetowych, przy stronach zgłoszonych do programu Google News, przy stronach na których nam zależy, aby się indeksowały nowe rzeczy i żeby GoogleBot nie marnował swoich przebiegów na zduplikowanych(ale wyciętych canonicalem) podstron.

Indeksowanie stron niekanonicznych

Należy również pamiętać, że link kanoniczny jest tylko sugerowaną informacją, którą wysyłamy do wyszukiwarki. Jeżeli linkujemy do linku niekanonicznego to często Google może wybrać link niekanoniczny i zaindeksować go w wynikach.Możemy sprawdzić w nowej wersji Google Search Console, który adres Google wybrało jako link kanoniczny strony. Informację tę możemy wyfiltrować również w raportach o Stanie naszej strony internetowej. Google oznacza to jako "Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik".

Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik. Zrzut ekranu z Google Search Console/Raport Stan

Najczęstsze błędy podczas wdrażania rel=canonical

rel=canonical jako ścieżka względna - link kanoniczny musi zostać podany jako pełny adres z domeną i protokołem. Możliwe jest przecież za pomocą linku kanonicznego wskazywanie preferowanej domeny(subdomeny) czy nawet protokołu, jeżeli z jakiś niezrozumiałych powodów musimy mieć dwa protokoły na zewnątrz(http/https).
Wskazywanie na niewłaściwą stronę: Upewnij się, że tag kanoniczny wskazuje na stronę, którą rzeczywiście chcesz promować, a nie na losowy lub niewłaściwy URL. Wskazanie linku kanonicznego do strony nieistniejącej (strona błędu 404) zadziała tak samo jak 404 na tym artykule.
Brak linku kanonicznego: W przypadku braku linku kanonicznego wyszukiwarki mogą same próbować określić, która wersja treści jest kanoniczna, co nie zawsze jest zgodne z intencją właściciela strony.
Kanonizacja wersji językowych zamiast użycia hreflang - Częstym błędem, szczególnie na stronach wielojęzycznych, jest stosowanie rel=canonical zamiast atrybutu hreflang. Kanonizacja wersji językowych może powodować, że wyszukiwarki zignorują inne wersje strony, uznając je za duplikaty, co skutkuje brakiem widoczności w danym kraju lub regionie. Zamiast tego powinno się używać atrybutu hreflang, aby jasno określić, która wersja strony jest przeznaczona dla danego regionu lub języka.
Zduplikowane lub sprzeczne rel=canonical - W niektórych przypadkach może dojść do zduplikowania lub sprzeczności w zastosowaniu rel=canonical, np. kiedy strona wskazuje na kilka różnych adresów URL. W takim przypadku wyszukiwarki mogą zignorować wszystkie kanoniczne odnośniki lub wybrać niewłaściwy. Ważne jest, aby upewnić się, że każda strona ma jednoznaczny, poprawny znacznik rel=canonical, aby uniknąć pomyłek.
Wielokrotne canonicale - unikaj sytuacji, że canonical wskazuje na inny canonical.

Jak uniknąć błędów podczas wdrażania rel=canonical?

Aby uniknąć powyższych błędów, warto przestrzegać kilku zasad:

Zawsze testuj swoje wdrożenia w narzędziach takich jak Google Search Console, aby sprawdzić, czy znacznik rel=canonical działa poprawnie.
Upewnij się, że adresy kanoniczne są jednolite w całej witrynie – czy to w wersji z „www”, czy „https”.
Jeśli prowadzisz stronę wielojęzyczną, zastosuj atrybuty hreflang do wskazania wersji regionalnych i językowych, zamiast używania kanonizacji.
Unikaj kanonizacji stron dynamicznych oraz paginowanych – zamiast tego zablokuj ich indeksowanie, jeśli są nieistotne z punktu widzenia SEO.
Regularnie sprawdzaj, czy każda strona ma tylko jeden, spójny znacznik rel=canonical, bez zduplikowanych lub sprzecznych wartości.

Poprawne wdrożenie rel=canonical wymaga precyzji i dbałości o szczegóły, jednak jego właściwe zastosowanie znacząco poprawia SEO strony, minimalizując ryzyko błędów indeksacji i rozproszenia wartości rankingowej.

Kiedy nie stosować linku kanonicznego?

Mimo że link kanoniczny jest przydatny w wielu sytuacjach, istnieją przypadki, w których jego stosowanie nie jest zalecane. Przykładem są strony z dynamicznie generowaną treścią, takie jak wyniki wyszukiwania wewnętrznego czy filtrowane kategorie produktów. W takich przypadkach lepszym rozwiązaniem może być użycie znaczników noindex, aby uniknąć indeksowania tych podstron przez wyszukiwarki.

Inną sytuacją, w której link kanoniczny nie jest wskazany, są strony z unikalną treścią, nawet jeśli mają podobny układ lub tematykę. Każda z nich powinna być traktowana jako odrębna strona, a nie kopia.

Linki kanoniczne nie rozwiązują też problemu oddawania/sprzedawania treści do agregatorów treści (np. MSN). Najlepszym rozwiązaniem jest noindex, który uchroni nas przed duplikacją treści oraz przed silniejszą domeną, która może pokazywać się wyżej, niż źródłowy tekst. Cross-domain canonical - bo tak się nazywa link kanoniczny między domenami - nie jest niestety już od dawna skuteczny.

Link kanoniczny ma wiele lat. Historia linku kanonicznego sięga początku 2009 roku, pierwszy wpis można znaleźć na branżowym blogu Google pod adresem https://webmasters.googleblog.com/2009/02/specify-your-canonical.html

Podobne tematy - związane z optymalizacją indeksowania w SEO - do linku kanonicznego to plik robots.txt, problemy z crawling budgetem oraz duplikacja adresów.

Czy ten artykuł był Ci pomocny? Jesteśmy doświadczoną agencją SEO, skontakuj się z nami, jeśli potrzebujesz pomocy ze swoją stroną.

Daniel Wlaźlak

Specjalizuję się w tworzeniu kompleksowych rozwiązań zasięgowych oraz programowaniu. @wlazlak

Spotkajmy się też w moich social media :

Zobacz moje wszystkie artykuły

Zaufali nam:

Współpracuj z nami!

Naszą mocą jest technologia i doświadczony zespół

Przez lata zdobywaliśmy doświadczenie u największych wydawców w Polsce, a teraz zadbamy o rozwój Twojej firmy od strategii wzrostu po wdrożenia na stronach dzięki naszemu własnemu software house'owi. Zaufaj nam, aby osiągać dobre wyniki.