Wykorzystanie link canonical do komunikacji z wyszukiwarką

Stworzenie znacznika canonical miało za zadanie pomóc właścicielom serwisów internetowych w skutecznej walce z duplikacją treści, na którą można zapanować. W krótkim czasie stał on się bardzo skutecznym narzędziem, które z powodzeniem eliminuje większość problemów obniżających widoczność serwisu w naturalnych wynikach wyszukiwania.

Podstawy o znaczniku link canonical

Główna zasada działania znacznika link canonical sprowadza się do tego, że na każdej stronie w serwisie za jego pośrednictwem umieszczana jest informacja pod jakim adresem ma być indeksowana dana treść.

Jeśli wartość w znaczniku canonical jest taka sama jak ta w polu adresowym robot wyszukiwarki będzie indeksował tę stronę, na której się znajduje. Jeśli zawartość tego znacznika jest odmienna to robot powinien przejść na stronę wskazaną w znaczniku. Tutaj ważne jest to, że znacznik canonical nie ma formy nakazu i w pewnych sytuacjach wyszukiwarka może zignorować te informację. Zwykle wtedy kiedy algorytm wykryje, że sposób wykorzystania znacznika może stanowić zagrożenie.

Znacznik canonical umieszczany jest w sekcji HEAD dokumentu HTML i przyjmuje postać:

<link rel="canonical" href="[adres url]" />

Na przykład:

<link rel="canonical" href="http://www.trajdos.pl" />

Znacznik może być wykorzystywany zarówno w obrębie serwisu jaki i pomiędzy różnymi serwisami. Nawet jeśli znacznik jest stosowany w obrębie jednej domeny zalecane jest stosowanie adresów bezwzględnych zamiast względnych, czyli lepiej jest dać adres w postaci:

<link rel="canonical" href="http://www.trajdos.pl/kontakt" />

Zamiast:

<link rel="canonical" href="/kontakt" />

Wiele informacji na temat znacznika link canonical zawierał artykuł w materiałach Google dostępny na stronie https://support.google.com/webmasters/answer/139066?hl=pl. Nie chcę dublować informacji ze strony Google w związku z tym będę skupiał się tylko na tym co według mnie jest najistotniejsze.

Duplikacja treści i stron

Duplikacja treści w Internecie jest zjawiskiem powszechnym i można podzielić je na dwa typy:

  • wynikające z błędów projektowych i niedopatrzeń,
  • wynikające z tego, że ktoś ukradł treści z naszej strony.

W tym drugim wypadku najlepiej zgłosić do Google, że ktoś kradnie treści. Można oczywiście najpierw spróbować poprosić o usunięcie takiej treści lub ograniczenie jej do formy jaką można nazwać cytatem.

Pierwszy przypadek jest dość prosty bo z założenia powinniśmy mieć duży wpływ na to jak działają nasze serwisy. I właśnie takich przypadków dotyczy ten wpis.

Duplikacja treści może przyjmować jedną postaci:

  • ten sam fragment powielany na wielu stronach w serwisie lub na innych naszych lub zaprzyjaźnionych serwisach
  • ta sama treść w całości powielany na wielu stronach w serwisie
  • strona dostępna jest po kilkoma różnymi adresami URL

Powielanie fragmentu treści

Powielania fragmentów treści, szczególnie tekstów, jest powszechne i w wielu wypadkach bardzo trudno go uniknąć. Sztandarowym przykładem takiego powielania jest powtarzanie pierwszego akapitu tekstu na wielu różnych stronach z listami artykułów.

O ile takie powielanie stanowi nie więcej niż 1/3 – 1/4 tekstu nie powinno to powodować problemu. Bo wartość powinna budować pozostała część tekstu. Co oznacza, że czym mniej treści z tekstu jest powielane tym wartość strony tekstu jest lepsza.

Na tę chwilę znacznik canonical w takich sytuacjach jest całkowicie nieprzydatny. Ponieważ odnosi się on do całej strony, a nie tylko do jego części.

Oczywiście da się z tym walczyć, ale to temat na osobny wpis.

Powielanie całej treści

Dość powszechny problem szczególnie w przypadku opisów produktów, które albo są brane od producentów, albo od firm które wyspecjalizowały się w tworzeniu tego typu treści.

W wielu wypadkach powielenie tekstu może mieć też charakter wewnętrzny. Z jakiegoś powodu teksty w całości powtarzają się na wielu stronach serwisu.

Okoliczności w jaki powielane są teksty w całości:

  • na listach wiadomości – brak podziału na wprowadzenie i resztę np. z wykorzystaniem znacznika <more> w WordPress, lub dowolnej innej metody rozdzielenia tekstu na wprowadzenie i rozwinięcie.
  • Jakiś tekst umieszczany jest w kolumnie bocznej lub stopce i powtarza się na praktycznie wszystkich stronach – każda treść powinna mieć tylko jedną stronę w serwisie gdzie pokazuje się w całości. Na innych może pokazywać się jako fragment z linkiem prowadzącym do całości.
  • publikacja w innym serwisie – mamy interesujący tekst i powielamy go na inne strony. Czy to jest nasza strona czy też zaprzyjaźniona to powinniśmy tego unikać. Jeśli już chcemy się pochwalić tekstem to najlepiej opublikować fragment i umieścić link lub na stronie powielającej dać znacznik canonical odsyłający do strony oryginalnej.
  • wiele produktów różnicących się tylko np. kolorem, ale mających dokładnie ten sam zakres funkcji/cech – jeżeli dany produkt oferowany jest w różnych wariantach różniących się mało istotnymi cechami z punktu widzenia algorytmów wyszukiwarki to należy tak projektować stronę, aby produkt miał tylko jedną stronę, ale pokazywał np. dostępne kolory i rozmiary. Oczywiście użytkownik powinien mieć możliwość przechodzenia pomiędzy wariantami, ale każdy z nich powinien wyświetlać znacznik canonical wskazujący na podstawową wersję produktu.

Różne adresy URL

Problem z różnymi adresami URL sprowadza się zwykle do tego, że dokładnie ta sama strona może być wywołana przez różne adresy. Dla Google każdy z nich to osobny twór. Jeśli więc mamy wiele stron traktowanych jako osobne przez Google i każda z nich ma dokładnie te samą treść to żadna z nich nie jest unikalna i przez to wszystkie są traktowane jako mniej wartościowe.

Oczywiście na jakimś tam poziomie Google próbuje sobie z tym poradzić, ale to po naszej stronie leży odpowiedzialność za to, żeby pokazać, która postać jest tą właściwą.

Strona może być dostępna np. pod adresami:

  • http://www.trajdos.pl/kontakt
  • http://trajdos.pl/kontakt
  • https://www.trajdos.pl/kontakt
  • http://www.trajdos.pl/kontakt?conv=123

W takiej sytuacji zastosowanie znacznika Canonical jest najlepszym rozwiązaniem, ponieważ wystarczy wybrać postać podstawową w tym wypadku: http://www.trajdos.pl/kontakt i po prostu na nią odsyłać żądania ze wszystkich innych podanych wariantów.

Problem związany z różnymi adresami często pojawia się w przypadku list produktów, które użytkownik może sortować według różnych kryteriów. Zwykle takiemu zabiegowi towarzyszy pojawianie się w adresie URL parametrów wskazujących na kierunek sortowania, kolumnę według której odbywa się sortowanie itp. W takiej sytuacji znacznik zawsze powinien wskazywać na stronę bazową.

W przypadku list do wykorzystania są jeszcze znaczniki next i prev, ale o nich w przyszłości. Teraz nic się nie stanie nawet jeśli wszystkie strony z danej kategorii zamkną się w jej głównym adresie.

Podsumowanie

Wykorzystanie odpowiednich przekierowań jest niezbędne do zbudowania poprawnie działającego serwisu internetowego. Nie mniej są sytuacje, w których niemożliwe jest ustawienie przekierowania, a konieczne jest wyeliminowanie dublowania treści.

Stworzenie znacznika canonical pozwala na szybkie i skuteczne zabezpieczenie się przed negatywnymi skutkami duplikacji treści.

2 myśli nt. „Wykorzystanie link canonical do komunikacji z wyszukiwarką”

  1. Hej, czy poradzicie co zrobić kiedy mam jeden unikalny opis produktu, który występuje np w 5 wariantach kolorystycznych i co zrobić by google nie traktowało tego jak zdublowana treść?
    Czy i gdzie zastosować canonical?

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *