URL Canoniques : Google donne des conseils pour réparer celles-ci

par | Oct 31, 2024 | SEO

John Mueller de Google a donné un conseil aux référenceurs pour faire en sorte que Google choisisse la bonne URL canonique lorsque la mauvaise a été choisie.

John Mueller de Google a répondu à une question posée sur LinkedIn concernant comment choisir les canoniques dans Google, et a donné des conseils sur ce que les référenceurs et les éditeurs peuvent faire pour inciter Google à prendre la bonne URL.

Mais qu’est-ce qu’une url canonique ?

Lorsque plusieurs URL (adresses de plusieurs pages) pointent sur le même contenu, Google en choisit une, nommée URL canonique, représentative de toutes les autres pages.

Google Search Central a publié une documentation sur les moyens dont disposent les référenceurs et les éditeurs pour signaler une préférence sur l’URL à utiliser. Aucune de ces méthodes n’oblige Google à choisir l’URL préférée, elles servent principalement d’indice.

Il existe trois façons d’indiquer l’URL canonique :

  • Redirection des pages dupliquées vers l’URL préférée (un signal fort)
  • Utiliser l’attribut de lien rel=canonical pour spécifier l’URL préférée (un signal fort)
  • Lister l’URL préférée dans le sitemap (signal faible)

Une partie de la documentation de Google sur la canonisation fait référence à tort à l’attribut rel=canonical en tant qu’élément de lien. La balise de lien, <link>, est l’élément. Le rel=canonical est un attribut de l’élément link. Google appelle également rel=canonical une annotation, ce qui peut être une façon interne pour Google de s’y référer, mais ce n’est pas la bonne façon de se référer à rel=canonical (c’est un attribut HTML de l’élément link).

Il y a deux choses importantes à savoir sur les éléments et les attributs HTML :

  • Les éléments HTML sont les éléments de base qui permettent de créer une page web.
  • Un attribut HTML est un élément qui ajoute plus d’informations sur ce bloc de construction (l’élément HTML).

La documentation HTML du Mozilla Developer Network (une source faisant autorité pour les spécifications HTML) indique que « link » est un élément HTML et que « rel= » est un attribut de l’élément link.

La personne a lu le manuel mais a encore des questions

La personne qui a lu la documentation de Google, qui énumère les trois façons susmentionnées de spécifier une référence canonique, avait encore des questions et les a posées sur LinkedIn.

Dans sa question, il a fait référence à la documentation en utilisant le terme « doc » :

« La documentation mentionnée suggère plusieurs façons de spécifier une URL canonique.

  1. Ajouter une balise dans la section <head> de la page, et une autre, 2. à travers le sitemap,etc.

Donc, si nous considérons seulement le point 2 de ce qui précède.

Ce qui signifie que le sitemap contient techniquement tous les liens canoniques d’un site web.

Google utilise plus de signaux pour la canonisation

La réponse de John Mueller révèle que Google utilise plus de facteurs ou de signaux que ce qui est officiellement documenté.

« Si les systèmes de Google peuvent déterminer que des pages sont suffisamment similaires pour que l’on puisse se concentrer sur l’une d’entre elles, nous utilisons alors les facteurs énumérés dans ce document (et d’autres) pour essayer de déterminer sur laquelle se concentrer ».

Les liens internes sont un facteur canonique

Mueller a ensuite expliqué que les liens internes peuvent être utilisés pour donner à Google un signal fort quant à l’URL à privilégier.

« Si vous avez une préférence marquée, il est préférable de la mettre en évidence en veillant à ce que tous les éléments de votre site expriment cette préférence y compris le lien-rel-canonique dans l’en-tête, les sitemaps, les liens internes, etc. »

« Lorsqu’il s’agit de recherche, le choix de la page sur laquelle les systèmes de Google se concentrent n’a pas tellement d’importance, car elles seraient toutes affichées de la même manière dans la recherche. L’URL exacte affichée est principalement une question pour l’utilisateur (qui peut la voir) et pour le propriétaire du site (qui peut vouloir surveiller et suivre cette URL). »

A retenir

Il n’est pas rare qu’un site très important contienne d’anciens liens internes qui pointent vers la mauvaise URL. Parfois ce ne sont pas d’anciens liens internes qui posent problème mais des redirections 301 d’une ancienne page vers une autre URL qui n’est pas l’URL canonique souhaitée. Rien n’empêche que Google associe alors une URL qui n’est pas celle voulue par l’éditeur.

Si Google choisit la mauvaise URL, on pourra parcourir l’ensemble du site (avec par exemple Screaming Frog) ainsi que les modèles de liens internes et les redirections car le choix de l’URL par Google pourrait bien provenir d’anciens liens internes oubliés en profondeur sur le site ou de chaines de redirection vers la mauvaise URL.

La documentation de Google mentionne aussi que des liens externes pointant vers la mauvaise page s’ils sont plus nombreux que ceux pointant vers le bon choix (la bonne page canonique), peuvent également peser dans le choix par Google du choix de la page canonique, un critère à vérifier pour essayer de comprendre pourquoi Google choisit la mauvaise URL.

En résumé, si les techniques communes de la désignation de la page canonique ne fonctionnent pas, il se peut qu’un lien externe (de préférence en nombre,) un lien interne involontaire ou une redirection oubliée bloquent alors Google au choix de la mauvaise URL, ou comme suggéré par John Mueller une élévation du nombre de liens internes faisant référence à l’URL préférée pourrait amener Google vers le choix de la bonne URL et donc faire ressortir cette URL dans ses pages de résultats.

Marc
Author: Marc

Marc est un passionné de la tech mais également du SEO ou il y évolue depuis 2009.

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Recevoir un devis gratuit

Contact