Tout ce que les propriétaires de sites web doivent savoir sur les URL

par Marc | Oct 9, 2023 | SEA | 0 commentaires

Du protocole HTTPS au nom de domaine de l’éditeur, en passant par la barre oblique de fin de ligne (ou son absence), chaque partie de l’URL d’une page web joue un rôle.

Que vous travailliez dans le domaine de la technologie/des produits, de la croissance de l’audience ou de la rédaction, le sujet des URL a tendance à revenir régulièrement sur le tapis. Quelle est la meilleure URL pour un article ? La présence d’une date dans l’URL est-elle importante ?

Comment créer des URL optimales pour les sections et les balises ? Pouvons-nous changer notre (sous-)domaine ? Autant de questions auxquelles les propriétaires de sites/ Webmasters veulent des réponses faciles.

Les URL optimisées ne jouent qu’un rôle minime dans le classement d’un article dans n’importe quelle stratégie de Google.

Autrefois, les mots-clés dans les URL aidaient les pages à être plus performantes. Aujourd’hui, les mots-clés dans les URL sont un petit facteur de classement, largement dépassé par les facteurs liés au contenu de la page.

Qu’est-ce qu’une URL ?

Une URL est l’adresse web d’une ressource. Cette ressource peut être une page web, une image, un fichier JavaScript, etc. Si l’on peut y accéder via le web, elle a une URL.

Une URL est constituée de plusieurs éléments. Elle commence par le schéma, qui est généralement « https:// » de nos jours. Cela signifie qu’il s’agit d’une ressource web servie par le protocole HTTP avec un cryptage sécurisé activé.

Vient ensuite le nom de domaine « www.referencement-du-pro.com » qui se compose lui-même de trois éléments :

Sous-domaine :

Cet élément est courant mais facultatif. La plupart des sites utilisent le sous-domaine « www », mais de nombreux sites n’ont pas de sous-domaine du tout et utilisent uniquement les domaines de deuxième et de premier niveau.

Domaine de deuxième niveau :

Il s’agit de la partie principale du nom de domaine, qui est généralement mentionnée en même temps que le domaine de premier niveau lorsque nous faisons référence à des sites web.

Domaine de premier niveau :

Cette dernière partie du nom de domaine faisait historiquement référence au type d’organisation (.com pour les entreprises, .org pour les organisations, etc.) et/ou au pays auquel le domaine est associé (.co.uk pour les entreprises commerciales au Royaume-Uni, .nl pour tout site web néerlandais, etc.)

De nos jours, les domaines de premier niveau ne sont pas indicatifs des types d’entreprises, mais restent souvent très pertinents pour le pays que votre site est censé cibler.

Après le domaine, nous avons le chemin de la ressource web, qui consiste généralement en un répertoire (également appelé dossier) et se termine parfois par un nom de fichier.

Parfois, les URL peuvent également contenir des paramètres, qui sont indiqués par un point d’interrogation suivi de la nature du paramètre.

Schéma : HTTP vs HTTPS

La première question qui est posée est de savoir quel schéma utiliser. La réponse est simple : HTTPS.

La différence entre HTTP et HTTPS est une question de sécurité. Un site Web qui utilise le protocole HTTP:// envoie ses données en clair sur le Web, ce qui signifie qu’elles peuvent être interceptées et lues par des acteurs malveillants.

Avec le protocole HTTPS, les données sont cryptées avant d’être envoyées sur le web jusqu’au destinataire, où elles sont ensuite non cryptées. Toute donnée interceptée lors de la traversée du web est un charabia crypté. La communication entre le site web et le destinataire est ainsi plus sûre.

En 2022, presque tous les sites web seront servis par HTTPS. En 2014, Google a commencé à encourager les sites Web à adopter le protocole HTTPS, en en faisant un (petit) facteur de classement.

Maintenant que presque tous les sites Web utilisent HTTPS, ce facteur de classement n’a presque plus de sens. HTTPS devrait être la norme par défaut pour votre site Web. Si votre site est toujours en HTTP, vous vivez essentiellement dans la préhistoire du web et devez envisager de passer sur ce protocole. Les internautes y prêtent également de plus en plus attention notamment si votre site est une boutique en ligne.

HTTP/2 ?

Maintenant, vous avez peut-être entendu parler d’une chose appelée HTTP/2. Il s’agit de la prochaine version du protocole HTTP. Pendant la majeure partie de l’existence du web, nous avons utilisé la version 1.1 du protocole HTTP, et il était temps de la mettre à jour.

En outre, le protocole HTTP/2 est un peu plus rapide que le protocole HTTP/1.1, les ressources d’une page Web étant demandées en vrac plutôt que séquentiellement.

De nombreux sites Web utilisent déjà le protocole HTTP/2. Google a commencé à explorer les sites avec HTTP/2, mais il est important de noter que cela ne confère à votre site aucun avantage en termes de classement.

Au mieux, l’adoption de HTTP/2 peut améliorer légèrement le taux d’exploration de votre site, car Googlebot pourra l’explorer un peu plus rapidement et efficacement.

Les noms de domaines

Le nom de domaine d’un éditeur de presse est plus qu’une simple marque. Votre nom de domaine envoie des signaux forts en matière de ciblage et de pertinence.

Contrairement à la croyance populaire, il n’est plus nécessaire d’avoir des mots clés spécifiques dans votre nom de domaine. Le nom de domaine « en mots clés exacts » ne sera pas mieux classé parce qu’il contient ces mots. C’était le cas dans le web d’avant, mais ce n’est plus un facteur depuis de nombreuses années maintenant.

Mais deux éléments cruciaux de votre domaine déterminent votre succès dans Google Actualités : le domaine de premier niveau (TLD) et le sous-domaine.

Le TLD et le ciblage

Lorsque vous utilisez un TLD générique tel que .com ou .info, Google suppose que vous ne ciblez pas un pays spécifique. Vous pouvez néanmoins indiquer à Google que votre contenu est destiné à un pays spécifique. Dans la « Search Console », dans la section Ciblage international, vous pouvez définir un pays spécifique à cibler.

Si cette option n’est pas configurée, Google ne supposera pas que votre contenu est destiné à un pays spécifique. Il peut néanmoins conclure que votre contenu est géo-ciblé en examinant d’autres indices, tels que la langue de votre contenu, la structure des dossiers, les références hreflang, etc.

Lorsque vous utilisez un domaine de premier niveau de code pays (ccTLD) tel que .mx ou .co.uk, Google supposera toujours que votre contenu est principalement destiné aux utilisateurs de ce pays. Cela n’empêchera pas entièrement votre site d’être classé dans d’autres pays, mais cela entrave fortement votre capacité à être classé en dehors de la version Google du pays ciblé.

Les ccTLD qui sont couramment utilisés comme TLD génériques font exception à cette règle, de sorte que Google ne prend pas en compte le géo-ciblage. C’est le cas par exemple du ccTLD .ms, qui est le domaine de code pays.

Si vous souhaitez vérifier si un TLD est considéré comme générique ou spécifique à un pays, Google tient à jour une liste des TLD qu’il considère comme génériques.

Les sous domaines

Que vous utilisiez un sous-domaine ou non n’a aucune importance pour le référencement. Google ne se soucie pas de savoir si vous êtes www.monsite.com ou seulement monsite.com.

Ce qui importe à Google, c’est la cohérence.

L’inclusion dans l’écosystème des actualités de Google (un sujet controversé de nos jours) est basée sur votre nom de domaine complet, également appelé « nom d’hôte« .

Pour Google, www.referencement-du-pro.com est un site web différent de referencement-du-pro.com. Si vous êtes actuellement inclus dans Google News avec votre site Web www.monsite.com et que vous décidez de modifier la structure de votre site et de déplacer votre contenu d’actualités vers news.monsite.com, vous avez fondamentalement changé de nom de domaine.

Cela signifie que vous perdez votre inclusion dans Google News.

Même avec des redirections 301 en place et une notification de changement d’adresse, il est peu probable que vous soyez inclus dans Google News pour votre nouveau domaine.

Chaque fois que j’ai vu des éditeurs changer une partie de leur nom de domaine qu’il s’agisse simplement du sous-domaine ou d’un changement complet de domaine, ceux-ci perdent toujours leur trafic provenant de Google News.

Lorsqu’ils annulent le changement de domaine et reviennent à l’ancien domaine, le trafic Google News est généralement de retour.

La leçon est donc claire :

si vous obtenez actuellement un bon trafic de Google News, ne changez aucunement votre nom de domaine.

Les dossiers ou répertoires

Les dossiers (aussi appelés répertoires) sont utilisés pour classer votre contenu en sections et sous-sections. En général, le nom d’une section, comme le sport, est directement référencé dans le nom

du dossier : /sport/.

Il est important d’utiliser des noms de dossiers qui reflètent précisément le contenu de la section. L’URL du dossier doit refléter le thème du dossier. Ainsi, n’appelez pas un dossier /sport/ pour l’utiliser ensuite pour rassembler des articles sur la météo ; s’il s’appelle /sport/, il doit contenir des articles sur le sport.

Google souhaite que les URL de vos sections soient statiques. Ainsi, lorsque vous avez une section sur /sport/, ne la changez pas en /sports/. Conservez-la telle quelle, car Google utilise vos pages de section pour découvrir le contenu nouvellement publié.

La modification des URL de vos pages de section peut entraîner une chute spectaculaire du taux d’exploration et de l’indexation de votre site, jusqu’à ce que Google s’habitue à vos nouvelles URL (ce qui peut prendre un certain temps). Ne modifiez donc pas les URL des sections, sauf si vous en avez vraiment besoin.

La hiérarchie des dossiers est facultative

Lorsque vous créez une sous-section qui fait partie d’une section plus grande, par exemple Rugby sous Sport, devez-vous créer le dossier /rugby/ sous le dossier /sport/, de sorte que vous obteniez /sport/rugby/ ?

Ou pouvez-vous simplement utiliser /rugby/ comme un dossier sous le domaine, sans relation parent-enfant ?

La réponse est la suivante : pour le référencement, la différence est minime.

L’inclusion de noms de dossiers dans l’URL peut aider Google à identifier les entités pertinentes qui s’appliquent à la section, mais il n’est pas nécessaire qu’il y ait une relation hiérarchique.

Personnellement, nous préférons les dossiers hiérarchiques (exemple.com/sport/rugby/), mais vous pouvez également utiliser des dossiers racines pour chaque section et sous-section de votre site (exemple.com/sport/ et exemple.com/rugby/). La hiérarchie du dossier peut servir à l’expérience de l’utilisateur, mais elle n’aide ou n’entrave en rien votre référencement.

Les principaux facteurs déterminant la valeur SEO d’une (sous-)section donnée sont le nom de la section (plus précisément le titre <h1> et la balise méta <title>) et les liens internes.

Le nom de la section doit se refléter dans le titre de la page et la balise <title>, afin que Google comprenne quel sujet les articles répertoriés partagent.

Lorsqu’une sous-section comme Rugby fait partie de la navigation supérieure de votre site – idéalement dans le cadre d’un ensemble de liens de sous-navigation contextuels sous l’en-tête Sport , l’URL de la sous-section n’est pas pertinente. Qu’il s’agisse de /sport/rugby/ ou simplement de /rugby/, c’est la proéminence du lien « Rugby » dans votre navigation supérieure qui importe.

Lors d’un Google Webmaster Hangout, John Mueller a déclaré que c’est la profondeur du clic qui compte et non la structure réelle du dossier de l’URL.

J’approfondirai les liens internes dans une prochaine édition de cette newsletter, car il s’agit d’un sujet complexe et très nuancé qui mérite d’être exploré en détail.

Les URL des articles

Alors, qu’est-ce qui fait une URL d’article parfaitement optimisée ?

Les URL des articles doivent-elles contenir des dates ?

Non. Si vous utilisez actuellement des dates dans l’URL de vos articles (comme le fait theguardian.com), vous n’avez pas besoin de les supprimer. C’est bien de les avoir, mais il peut y avoir un petit inconvénient en ce qui concerne le contenu permanent que vous voulez classer au-delà du cycle des nouvelles.

Google ne se soucie pas de la date figurant dans votre URL, mais votre public peut la remarquer et reconnaître un contenu potentiellement dépassé. Il s’agit toutefois d’un risque minime, car la date de « publication » ou de « dernière modification » figurant sur la page est plus susceptible d’être remarquée.

Pour Google, cette date visuelle, associée à l’attribut « dateModified » dans vos données structurées NewsArticle et à l’attribut <lastmod> dans vos sitemaps XML, joue un rôle beaucoup plus important. La date figurant dans l’URL est négligeable.

Il y a un avantage à avoir des dates dans vos URL : il est beaucoup moins probable que vous créiez un jour une URL d’article en double. Lorsque vous couvrez régulièrement le même type d’histoire (comme un événement sportif entre deux équipes qui s’affrontent chaque saison), la date dans l’URL vous évite de recréer par inadvertance une URL existante pour un article plus récent.

Les URL des articles doivent-elles avoir une structure de dossier ?

Cet élément est facultatif, mais il peut être utile. Google aime que les entités pertinentes mentionnées dans un article soient reflétées dans l’URL. Pour reprendre l’exemple du rugby, si vous écrivez un article sur l’équipe nationale de rugby d’Irlande, il est utile d’avoir les mots « rugby » et « ireland » dans l’URL de l’article.

Que ce soit sous la forme de (sous-)dossiers ou dans le nom de fichier de l’article (également connu sous le nom de « slug ») n’a pas d’importance, tant qu’ils figurent dans l’URL complète de l’article.

N’oubliez pas que, de nos jours, Google est très doué pour comprendre les synonymes. Pour Google, « Irlande rugby » et « rugby irlandais » sont pratiquement identiques.

Vous pouvez facilement le vérifier :

il vous suffit d’effectuer une recherche sur Google avec les deux expressions et vous verrez probablement des résultats très similaires dans les SERPs normales et dans les carrousels.

Il peut y avoir des différences subtiles, car un changement de formulation peut entraîner une légère variation de l’intention de recherche. De plus, certains sites Web sont mieux optimisés sur le plan de la mise en page pour les autres formulations. Cependant, en règle générale, les résultats affichés par Google pour des formulations légèrement différentes mais ayant la même signification se chevauchent largement.

L’URL peut-il être différent du titre ?

Oui, tant qu’ils transmettent le même sens. Votre URL peut être une copie exacte du titre de l’article, ou une formulation totalement différente du même message général.

Mais l’URL et le titre doivent correspondre sur le plan thématique. Le titre a une fonction d’actualité : il signale le contenu de l’article. L’URL sert le même objectif.

Si l’on reprend mon exemple précédent, pour un article dont l’URL est la suivante, les deux titres suivants sont parfaitement acceptables.

Qu’en est-il des extensions de fichiers comme .html ?

Cette question peut être pertinente si vous avez un site Web qui utilise encore des extensions comme .php ou .html à la fin de l’URL d’une page Web.

La technologie web moderne ne nécessite plus d’extensions de fichiers. Que votre article se termine par .html ou par un slash (ce qui, techniquement, en fait un dossier), ou qu’il se termine sans aucune notation, cela n’a pas vraiment d’importance. Tous ces modèles d’URL fonctionnent, et ils peuvent tous être aussi performants dans Google.

La seule réserve à noter ici est que la cohérence est importante. Si vous avez un article qui peut être consulté avec ou sans .html, vous créez des problèmes de contenu dupliqué.

Il en va de même pour les barres obliques de fin de ligne. Ces deux URL sont en fait deux pages différentes, du point de vue de Google :

La barre oblique de fin de ligne rend l’URL différente et incitera Google à la traiter comme un article distinct.

Une simple balise rel=canonical n’est pas vraiment suffisante pour traiter ce type de duplication. Que vous utilisiez le format .html, des barres obliques ou rien du tout n’a pas d’importance pour le référencement ; Google les traite tous de la même manière.

Mais vous aurez toujours intérêt à mettre en place des redirections automatiques de votre version non préférée vers la version préférée ou à afficher une erreur 404 Not Found sur la version non préférée de l’URL.

Vos liens internes et vos sitemaps XML doivent toujours faire référence à vos URL préférées, et uniquement à celles-ci.

Pouvez-vous utiliser des paramètres dans les URL des articles ?

Vous pouvez, mais vous ne devriez pas. Dans la documentation du centre des éditeurs concernant les redirections, Google déconseille spécifiquement l’utilisation du paramètre « ?id= » dans les URL de vos articles.

Cela concerne les redirections, mais le même concept peut s’appliquer aux URL dans l’ensemble de l’écosystème des actualités de Google. Bien que les URL avec des paramètres puissent être explorées et indexées, et souvent bien classées, je pense qu’elles ne sont pas particulièrement utiles.

Les URL paramétrées sont souvent moins riches en mots clés et plus alambiquées. Pour moi, il n’y a aucun avantage à utiliser des paramètres dans les URL de vos articles, et seulement des inconvénients.

Un site de publication qui utilise des URL avec des paramètres est souvent le signe d’une pile technologique dépassée. Les paramètres ne sont pas nécessairement le problème en soi, mais ils indiquent des approches de développement qui ne sont tout simplement pas propices à la création de sites Web optimisés et performants.

Dans le domaine du commerce électronique, je suis beaucoup plus indulgent à l’égard des paramètres d’URL, car ils peuvent jouer un rôle important dans la navigation et le filtrage.

En revanche, dans le domaine de l’information, il est difficile d’imaginer un cas d’utilisation où les paramètres apportent une quelconque valeur ajoutée, et facile de penser à des cas où les paramètres ajoutent une complexité inutile et des points de défaillance.

Par conséquent, en règle générale, évitez d’utiliser des paramètres dans les URL de vos articles.

Devriez vous changer les URL de votre site ?

Comme je l’ai dit au début, une URL est l’adresse d’une ressource Web. Pour les articles d’actualité, l’URL est l’identifiant unique que Google utilise pour décider si la page doit être explorée ou non.

Si une nouvelle URL est différente d’une URL existante, ne serait-ce que par un seul caractère, Google l’interprétera initialement comme une nouvelle page qui doit être explorée et indexée.

C’est pourquoi la modification des URL est une tactique si controversée. Lorsque vous modifiez l’URL d’un article après que celui-ci a été exploré et indexé, vous créez en fait un article entièrement nouveau.

Cela peut être une chose tout à fait valable :

lorsque le contenu de l’article a suffisamment changé pour justifier un nouvel article, vous changez le titre et le republiez avec une nouvelle URL. Il sera traité comme un nouvel article, et sera classé indépendamment de l’article original.

Dans ce cas, l’ancienne URL doit être redirigée vers la nouvelle. Cela permet à Google de canoniser les signaux de classement sur la nouvelle URL et vous empêche d’être classé avec un article périmé.

Mais c’est l’un des rares contextes dans lesquels la modification des URL est une bonne chose. Dans presque tous les autres cas, la modification des URL existantes est généralement une mauvaise idée. Dans la plupart des cas, il est essentiel de ne pas changer les URL au risque de casser vos pages mais également de perdre votre trafic associée à la perte de votre chiffre d’affaires.

Le problème de la modification des URL

Lorsque vous modifiez l’URL d’une page, vous créez effectivement une nouvelle page. Cette page doit ensuite être explorée, indexée et évaluée par les systèmes complexes de Google afin de déterminer ce qui doit être classé, le cas échéant.

Même avec des redirections en place, la consolidation des signaux de classement sur la nouvelle URL n’est pas un transfert parfait. Une page dont l’URL existe depuis de nombreuses années peut avoir accumulé de nombreux signaux de classement historiques, tels que des liens anciens provenant d’autres sites Web.

Lorsque vous modifiez l’URL et créez une nouvelle page à classer par Google, ces signaux de classement historiques peuvent ne pas être transférés à la nouvelle URL. Il se peut que Google doive à nouveau explorer ces anciens liens avant que leur valeur soit associée à la nouvelle URL par le biais de la redirection, ce qu’il ne fera peut-être jamais. Ou, même si Google explore à nouveau ces anciens liens, la valeur de classement de ces liens sera diminuée car ils proviennent d’articles plus anciens qui sont maintenant descendus profondément dans les archives du site de liaison.

Enfin, il existe une théorie selon laquelle une certaine mesure du PageRank (ou de l’équité des liens, ou quel que soit le nom qu’on lui donne) est perdue lors d’une redirection. Au fil des ans, Google a donné des informations contradictoires à ce sujet, bien que récemment ils semblent s’être mis d’accord sur le fait qu' »aucune valeur de lien n’est perdue dans une redirection », ce qui me laisse un peu sceptique, je l’admets.

Quoi qu’il en soit, le conseil est le même : ne changez pas d’URL pour un élément de contenu indexé à moins d’avoir une bonne raison de le faire.

C’est pourquoi les migrations de sites sont une entreprise si délicate. Changer la pile technologique d’un site signifie souvent changer les URL des pages, ce qui peut causer toutes sortes de problèmes de référencement, en particulier pour les éditeurs de presse.

URL et votre classement

Les URL sont un sujet de discussion sans fin, mais en fin de compte, tout le monde veut savoir dans quelle mesure elles constituent un facteur de classement. D’après mon expérience, les URL ne sont qu’un petit facteur de classement, bien en bas de la liste.

Pour les articles, je considère que ce sont les principaux facteurs de classement spécifiques aux actualités, classés par ordre d’importance.

Je considère l’URL comme un facteur de classement assez faible. Il est vrai que cette liste serait très différente pour les facteurs de classement habituels, non liés aux actualités. Mais pour les actualités, l’URL de l’article n’est pas une priorité et vous ne devez pas consacrer trop d’efforts à sa mise au point.

Vous souhaitez davantage de renseignements sur les URL ? Faites appel à notre agence de référencement Referencement Du Pro® afin de mettre en place une stratégie SEO gagnante.