rel=”canonical” 标签 est utilisé pour informer les moteurs de recherche “quelle URL est la version canonique de ce contenu”, afin d’éviter la dispersion du poids (autorité).
Dans le SEO Google, on l’utilise en ajoutant dans la
de la page.
Les données montrent que les sites de commerce électronique qui ont correctement implémenté la balise Canonical, ont vu le taux d’indexation de leurs pages de liste de produits augmenter en moyenne de 28 %, et le nombre de fois que les robots d’exploration (crawlers) ont exploré les URL en double a diminué de 40 % à 60 % ;
Les sites d’actualités, après avoir consolidé des articles similaires grâce à la balise canonique, ont vu le nombre moyen de clics de recherche pour leur contenu principal augmenter de 19 %.
Cependant, une enquête actuelle a révélé que seulement 31 % des sites web utilisent cette balise 100 % correctement (les erreurs courantes comprennent : pointer vers une mauvaise URL, non-conformité inter-protocole/domaine, empilement de plusieurs balises, etc.).

Table of Contens
TogglePourquoi utiliser la balise canonical
Lors de l’exploration quotidienne par le moteur de recherche Google, plus de 65 % des sites web rencontrent des problèmes de contenu dupliqué dus à une conception de structure d’URL non optimale.
Cela se manifeste par :
- Le même article est accessible via des URL avec des paramètres (comme ?utm_source=xxx)
- Des suffixes de répertoire (comme /page/ et /page/index.html)
- Différents sous-domaines (comme www et non-www)
John Mueller de Google a mentionné à plusieurs reprises dans des sessions de questions-réponses officielles que lorsque le moteur de recherche découvre que “plusieurs URL présentent un contenu hautement similaire ou complètement identique”, il est confronté au dilemme de “à laquelle des URL attribuer le poids”.
Une page de produit de commerce électronique peut générer une douzaine d’URL différentes en raison de filtres de couleur ou de paramètres de tri ; un article de presse peut être poussé vers plusieurs rubriques, créant plusieurs liens d’entrée.
L’utilisation de la balise canonical indique clairement aux moteurs de recherche : “Bien que ce contenu puisse être vu via plusieurs URL, veuillez concentrer le poids et le classement sur l’URL que je spécifie“.
Comment le contenu dupliqué affecte le SEO
Le contenu dupliqué en soi n’entraîne pas directement de pénalité de moteur de recherche (Google a clairement indiqué qu’il “ne pénalise pas un site pour la simple duplication de contenu”), mais il conduit à la dispersion du poids.
Lorsque le même contenu est accessible via plusieurs URL, le moteur de recherche les traite comme des “pages différentes” séparément.
Par exemple, un article original est présenté via les 4 URL suivantes :
https://example.com/articlehttps://example.com/article?source=newsletterhttps://example.com/article#commentshttps://www.example.com/article(version avec www)
Sans identification canonique, le moteur de recherche pourrait explorer ces 4 URL simultanément et calculer séparément l’autorité d’indexation pour chacune d’elles.
Cependant, le besoin de recherche de l’utilisateur n’a essentiellement besoin que d’une seule réponse, et finalement, le classement des 4 versions pourrait être faible (car le poids est dispersé), ou même une seule d’entre elles pourrait être indexée par chance, tandis que les autres versions restent longtemps dans un état de “non-indexé” ou de “faible classement”.
Dans les sites de commerce électronique, une page de détail de produit peut générer en moyenne 8 à 12 URL dupliquées en raison de paramètres (tels que ?size=XL, ?color=red). La proportion d’exploration de ces pages par les robots peut atteindre 15 % à 20 % du total des explorations (qui devraient être allouées à de nouvelles pages plus précieuses).
Pour les sites d’actualités, le contenu poussé vers plusieurs rubriques (telles que “Dernières nouvelles”, “Tendances de l’industrie”, “Recommandations populaires”) peut générer 3 à 5 URL d’entrée différentes pour un seul article.
Un cas plus concret : avant de normaliser les URL, le taux d’indexation des pages de liste de produits d’un site de commerce électronique de taille moyenne n’était que de 62 % (c’est-à-dire que seulement 62 pages sur 100 étaient indexées par Google et pouvaient participer au classement) ;
En ajoutant la balise canonical aux pages de liste avec paramètres (telles que ?category=shoes&sort=price), pointant vers l’URL de base sans paramètres (telle que /shoes), le taux d’indexation est passé à 81 % après 3 mois, et le trafic de recherche organique des produits correspondants a augmenté de 17 %.
Il ne s’agit pas de “supprimer les doublons”, mais de “désigner la version faisant autorité”
De nombreux webmasters ont une mauvaise compréhension de la balise canonical, pensant qu’elle est “utilisée pour supprimer les pages en double”.
En réalité, sa fonction principale est d’« indiquer aux moteurs de recherche : parmi les multiples URL présentant le même contenu, laquelle doit être la version que vous devez indexer, et classer en priorité »
Lorsque vous ajoutez le code suivant dans la partie <head> d’une page :
link rel=“canonical” href=“https://example.com/URL_canonique” />
Vous envoyez un signal clair aux moteurs de recherche : “Bien que ce contenu (par exemple, /article?source=email avec des paramètres) soit également accessible, je souhaite que vous concentriez son poids et ses opportunités de classement sur cette adresse : https://example.com/URL_canonique”.
Selon la documentation officielle de Google et l’observation des données d’exploration réelles :
- Niveau d’exploration : Les moteurs de recherche exploreront toujours toutes les versions des pages (y compris les URL avec paramètres et répertoires), mais ajusteront leur “degré d’importance” pour ces pages en fonction de la balise canonical. Par exemple, les URL avec paramètres peuvent être explorées, mais le robot ne les visitera pas aussi fréquemment ni ne les indexera aussi profondément que la version canonique.
- Niveau d’indexation : Si le contenu de plusieurs URL est hautement similaire (taux de duplication supérieur à 80 %), le moteur de recherche inclura généralement la version canonique dans l’index. Les autres versions pourraient ne pas être indexées séparément, ou même si elles le sont, elles ne participeront pas à la compétition pour le classement principal.
- Niveau de poids : Lorsqu’un lien externe pointe vers l’une des versions en double de l’URL, le moteur de recherche, guidé par la balise canonical, “transférera” ou “associera” cette partie du poids du lien externe à la version canonique (bien que le transfert ne soit pas à 100 %, l’effet est très proche dans la plupart des cas).
Prenons un scénario réel : un article sur un site de blog est publié simultanément dans deux rubriques, “Recommandé sur la page d’accueil” et “Chronique technique“, générant deux URL :
https://example.com/home/recommend/123(entrée Recommandé sur la page d’accueil)https://example.com/tech/article/123(entrée Chronique technique)
Le contenu des deux est entièrement identique, mais l’URL de la recommandation de la page d’accueil, ayant un trafic plus important, a attiré quelques liens externes.
Sans la balise canonical, le moteur de recherche pourrait considérer ces deux pages comme des contenus indépendants, et bien que l’URL de la recommandation de la page d’accueil ait des liens externes, son potentiel de classement pourrait être inférieur à celui de la chronique technique car son positionnement n’est pas assez vertical (les recommandations de la page d’accueil sont généralement des contenus mixtes).
Si l’équipe technique ajoute la balise canonical aux deux pages, pointant vers https://example.com/tech/article/123, qui correspond mieux au sujet du contenu, le moteur de recherche saura clairement : “La version faisant autorité de ce contenu est l’URL de la chronique technique”, et le poids du lien externe de la recommandation de la page d’accueil sera également associé, augmentant la compétitivité de classement de cette page pour les “mots-clés techniques associés”.
Que se passe-t-il si la balise Canonical n’est pas utilisée
Le budget d’exploration des robots est gaspillé
Le “nombre d’explorations quotidiennes” alloué par le moteur de recherche à chaque site web est limité (appelé “budget d’exploration”), la priorité étant donnée à l’exploration des pages importantes (telles que la page d’accueil, les pages de contenu à haute fréquence de mise à jour).
Si le site web a un grand nombre d’URL dupliquées (par exemple, une page de détail de produit de commerce électronique avec 10 paramètres de tri, générant plus de 1000 URL différentes), le robot consommera une partie du budget sur ces pages “de contenu identique mais d’URL différentes”, entraînant une baisse de la fréquence d’exploration des nouvelles pages qui doivent réellement être explorées (comme les produits nouvellement lancés, les nouvelles mises à jour).
Les données montrent qu’une analyse des journaux des robots d’un site de commerce électronique de vêtements a révélé que les pages de produits en double avec paramètres (telles que ?size=M, ?color=blue) occupaient 22 % du volume total d’exploration, et le taux de rebond de ces pages atteignait 85 % (les utilisateurs recherchent un produit spécifique et n’entrent pas par une URL avec paramètres).
Lorsque ce site a ajouté uniformément la balise canonical aux pages de détail des produits (pointant vers l’URL de base sans paramètres), la fréquence d’exploration des pages de produits de base par le robot a augmenté de 30 %, et le temps d’indexation des nouveaux produits est passé de 7 jours en moyenne à 3 jours.
Version d’indexation confuse, classement instable
Sans identification canonique, le moteur de recherche peut choisir aléatoirement une URL comme “version d’affichage par défaut”, mais ce choix n’est pas fixe.
Par exemple, lorsqu’un utilisateur recherche un mot-clé, il voit parfois la version avec www (https://www.example.com/page), parfois la version sans www (https://example.com/page), et parfois même la version avec des paramètres (https://example.com/page?from=social).
Exemple : la page “Contactez-nous” d’un site web de services locaux existe simultanément en deux versions : https://example.com/contact et https://example.com/contact-us (contenu entièrement identique), sans balise canonical définie. Google a indexé ces deux URL à différents moments, ce qui fait que lorsque les utilisateurs recherchent “Service de réparation ville XX Contact”, ils voient parfois la première version mieux classée, et parfois la seconde.
Lorsque l’utilisateur clique et arrive sur une version non principale (comme contact-us), le taux de conversion peut diminuer en raison de différences de conception de la navigation (par exemple, l’absence de bouton de rendez-vous en ligne).
Par la suite, ce site web a ajouté la balise canonical aux deux versions, pointant vers https://example.com/contact. Après 3 mois, le classement de cette page a augmenté, et le taux de clic de recherche (CTR) a augmenté de 11 %.
Dispersion du poids des liens externes
Si plusieurs versions dupliquées de l’URL sont liées par des sites externes (par exemple, quelqu’un utilise une URL avec paramètres lors de la republication du contenu, ou de nouveaux liens sont générés lors de la poussée vers les pages de rubriques), mais que ces liens externes pointent vers différentes adresses, le moteur de recherche ne peut pas fusionner automatiquement le poids.
Comparaison des données : l’article “Stratégie de préparation aux examens post-universitaires” d’un site web éducatif a été republié par 5 sites externes. 3 d’entre eux pointaient vers la version sans paramètres (https://example.com/guide/kaoyan), et 2 pointaient vers la version avec paramètres (https://example.com/guide/kaoyan?from=partner).
Sans la balise canonical définie, le moteur de recherche associerait ces 5 liens externes à différentes URL. Après que le site web a ajouté la balise canonical à toutes les versions (pointant vers la version sans paramètres), le trafic de recherche organique de cette page a augmenté de 24 % en 6 mois.
Syntaxe et écriture de base de la balise canonical
Environ 32 % des pages placent la balise canonical dans la partie <body> (au lieu de la zone <head> requise), 19 % des valeurs de l’attribut href manquent du protocole complet (par exemple, n’écrivent que example.com au lieu de https://example.com), et 15 % des pages pointent vers différentes “versions canoniques” parmi plusieurs URL en double (provoquant la confusion du moteur de recherche).
D’un point de vue technique, la balise canonical est essentiellement une simple balise de lien HTML, mais sa position (doit être dans), son format de syntaxe (doit suivre strictement les spécifications HTML) et l’URL vers laquelle elle pointe (doit correspondre exactement au contenu réel et être accessible) sont cruciaux.
Les données montrent que lorsque la balise canonical est déployée conformément à l’écriture standard (c’est-à-dire placée en haut de
, utilisant un protocole HTTPS complet, pointant vers une URL canonique unique et correcte), la probabilité que les moteurs de recherche reconnaissent et appliquent correctement la balise dépasse 95 % ;Alors que pour les pages avec une écriture incorrecte, environ 60 % de l’intention canonique n’est pas adoptée par les moteurs de recherche, ce qui entraîne la persistance des problèmes de contenu dupliqué.
Par exemple, lorsqu’un site de commerce électronique ajoute la balise canonical à une page de détail de produit (comme la version avec paramètres ?color=red), l’omission de l’en-tête de protocole (écrit //example.com/product ou example.com/product) empêche Google de résoudre correctement l’URL cible.
Structure syntaxique standard
La syntaxe complète de la balise canonical n’est qu’une ligne de code HTML : link rel=“canonical” href=“https://www.example.com/URL_complète_de_la_page_canonique” />
Cette ligne de code est composée de 3 parties principales, toutes indispensables et dans un ordre fixe :
Type de balise : <link>
- Ceci est la balise utilisée en HTML pour définir la relation entre le document et une ressource externe. La balise canonical est un type de “relation de lien” et doit utiliser
<link>comme structure de base.
Attribut : rel="canonical"
relest un attribut requis de la balise<link>, utilisé pour expliquer la relation entre le lien actuel et le document actuel. Lorsque sa valeur est définie surcanonical, elle indique clairement aux moteurs de recherche : “Cette balise définit la version canonique (faisant autorité) du contenu de la page actuelle”.
Attribut : href="URL"
hrefest un autre attribut requis de la balise<link>, utilisé pour spécifier l’adresse web exacte de la version canonique. Cette URL doit être complète et accessible, incluant le protocole (http ou https), le domaine (www ou non-www), le chemin et les paramètres (si nécessaire).
Par exemple:
- Écriture correcte :
href="https://www.example.com/products/shoes" - Erreur 1 (manque de protocole) :
href="//www.example.com/products/shoes"(le navigateur peut compléter automatiquement, mais le moteur de recherche pourrait ne pas résoudre avec précision) - Erreur 2 (manque de domaine) :
href="/products/shoes"(chemin relatif, le moteur de recherche ne sait pas de quel site web il s’agit) - Erreur 3 (faute d’orthographe) :
href="https://www.exaple.com/products/shoes"(domaine mal orthographié, pointant vers une page inexistante)
Autres détails :
- Cette balise doit se terminer par
/(si l’URL elle-même nécessite une barre oblique finale), mais dans la plupart des cas, les moteurs de recherche modernes sont plus tolérants quant à la présence ou non d’une barre oblique (tant que la norme est cohérente). - La balise doit être écrite sur une seule ligne (les sauts de ligne peuvent entraîner des erreurs dans certains outils d’analyse, bien que les moteurs de recherche puissent généralement corriger automatiquement).
- La partie de fermeture de la balise est
/>(balise auto-fermante, la norme HTML5 permet d’omettre le/final, mais il est recommandé de le conserver pour assurer la compatibilité).
Pourquoi elle doit être dans
Parce que lors de l’exploration d’une page, le robot d’exploration du moteur de recherche analyse en priorité le contenu de la zone <head> (surtout les informations meta, le titre, la balise canonique et autres “instructions de contrôle”), puis traite le contenu réel dans le <body>.
Si la balise canonical est incorrectement placée à l’intérieur du <body> (par exemple, imbriquée dans un paragraphe d’article ou le code du pied de page), le moteur de recherche ignorera la balise <link rel="canonical"> dans le <body>.
Autres compléments :
- Une page ne peut avoir qu’une seule balise canonical (s’il y en a plusieurs, le moteur de recherche ne reconnaîtra généralement que la première, les autres seront ignorées).
- Cette balise ne peut pas être imbriquée à l’intérieur d’autres balises (par exemple, elle ne peut pas être placée dans
<div>ou<script>). - Pour les pages générées dynamiquement (par exemple, via des langages backend comme PHP, Python, etc.), il faut s’assurer que le moteur de template insère correctement la balise canonical dans la zone
<head>lors de la sortie HTML (généralement contrôlé par des variables de template).
5 Erreurs les plus courantes
Erreur 1 : Pointer vers une mauvaise URL (la version canonique ne correspond pas au besoin réel)
- Phénomène : La balise canonical pointe vers une URL dont le contenu n’est pas totalement identique (ou n’est pas le même contenu du tout). Par exemple, la page de détail d’un produit (affichant des chaussures rouges) a une balise canonical pointant vers la page des chaussures blanches.
- Conséquence : Le moteur de recherche concentrera le poids selon l’instruction erronée sur une page non pertinente, entraînant une baisse du classement du contenu principal.
- Correction : Vérifiez le contenu réel de la page actuelle et assurez-vous que l’URL dans href pointe vers la version canonique qui “affiche un contenu entièrement identique” (par exemple, utilisez l’URL de base sans paramètres de manière uniforme, ou la page de rubrique qui correspond le mieux à l’intention de recherche de l’utilisateur).
Erreur 2 : Manque d’en-tête de protocole (écrit uniquement le domaine ou utilise un chemin relatif)
- Phénomène : Le code est écrit
href="//example.com/page"(chemin relatif au protocole) ouhref="/page"(chemin relatif). - Conséquence : Le moteur de recherche pourrait ne pas être capable de résoudre avec précision l’adresse complète de l’URL cible (surtout dans les cas de protocole croisé ou de domaine croisé), ce qui entraîne l’échec de l’intention canonique.
- Correction : Utilisez toujours le protocole complet + domaine + chemin, au format
href="https://www.example.com/page"(protocole https recommandé pour garantir la sécurité).
Erreur 3 : Conflit entre l’URL avec paramètres et la version canonique
- Phénomène : La version sans paramètres d’une page de liste de produits (
https://example.com/products) est la version canonique, mais la version avec paramètres (telle quehttps://example.com/products?sort=price) ne pointe pas correctement vers elle, mais pointe vers une autre URL avec des paramètres différents (telle que?sort=date). - Conséquence : Plusieurs versions avec paramètres pointent les unes vers les autres ou vers différentes URL, créant un “canonique en boucle” ou une dispersion du poids.
- Correction : Unifiez la balise canonical de toutes les URL avec paramètres pour qu’elles pointent vers la version de base sans paramètres (ou la version de tri/filtrage la plus couramment utilisée), en veillant à ce que toutes les versions variantes pointent vers la même adresse canonique.
Erreur 4 : Balise placée à l’intérieur du
- Phénomène : Lors de l’édition de la page via l’interface d’administration du CMS, le code canonical est collé par erreur dans la zone de contenu de l’article (partie <body>), au lieu de la zone
<head>du template du site web. - Conséquence : Le robot d’exploration du moteur de recherche pourrait ignorer la balise, ce qui entraîne une mauvaise canonisation des pages dupliquées.
- Correction : Contactez l’équipe technique pour vérifier le fichier de template (comme header.php de WordPress, theme.liquid de Shopify) et assurez-vous que la balise canonical est sortie dans la balise
<head>du HTML.
Erreur 5 : Empilement de plusieurs balises canonical
- Phénomène : En raison d’une erreur de template ou d’une addition manuelle, plusieurs balises
<link rel="canonical">apparaissent sur une page (par exemple, pointant simultanément vers /page et /page/). - Conséquence : Le moteur de recherche ne reconnaît généralement que la première balise, les balises suivantes sont ignorées, ce qui peut entraîner une confusion de l’intention canonique.
- Correction : Vérifiez le code, supprimez les balises canonical superflues et assurez-vous qu’il n’y a qu’une seule instruction canonique par page.
Différence entre canonical et autres balises (comme noindex, redirection 301)
La balise canonical est “désigner la version faisant autorité d’un même contenu” (conserver toutes les URL, mais concentrer le poids), la balise noindex est “interdire aux moteurs de recherche d’indexer la page actuelle” (autoriser l’exploration mais pas l’affichage), et la redirection 301 est “rediriger de manière permanente l’ancienne URL vers la nouvelle URL” (transfert complet du trafic et du poids).
Différences fondamentales entre canonisation, interdiction et redirection
Balise canonical (balise de canonisation) : Utilisée pour les “scénarios multi-URL pour un même contenu”, le but est d’indiquer aux moteurs de recherche “ces pages ont en fait le même contenu, mais vous devez vous concentrer uniquement sur cette URL que j’ai spécifiée (version canonique), et concentrer le poids ici”.
- Scénarios typiques : Pages de détail de produits de commerce électronique avec paramètres (tels que ?color=red et ?color=blue), articles de presse poussés vers plusieurs rubriques (tels que “Dernières nouvelles” et “Tendances de l’industrie”), URL mobiles et PC séparées mais contenu identique.
Balise noindex (balise d’interdiction d’indexation) : Utilisée pour les “scénarios où l’exploration est autorisée mais l’affichage est interdit”, elle indique aux moteurs de recherche “vous pouvez explorer cette page, mais ne l’ajoutez pas à l’index des résultats de recherche”.
- Scénarios typiques : Pages de gestion interne (telles que les pages de connexion, les pages de statistiques backend), pages d’événements temporaires (qui n’ont pas besoin de classement après l’événement), pages de contenu de faible valeur (telles que les versions imprimables, les pages de conversion simplifié/traditionnel).
Redirection 301 (redirection permanente) : Utilisée pour les “scénarios où le contenu a été déplacé de manière permanente”, elle redirige automatiquement les utilisateurs et les moteurs de recherche de l’ancienne URL vers la nouvelle URL via la configuration du serveur (comme les fichiers .htaccess ou les règles Nginx). Le poids de l’ancienne URL (y compris le classement, les liens externes, la confiance des utilisateurs) est progressivement transféré à la nouvelle URL, et finalement l’ancienne URL pourrait ne plus être visitée (mais la redirection reste efficace).
- Scénarios typiques : Changement de domaine du site web (par exemple, migration de example.com vers newexample.com), ajustement de la structure d’URL (par exemple, passage de /old-product/ à /products/new-product/), fusion de plusieurs anciennes pages en une seule nouvelle page.
| Outil | Autorise l’exploration | Autorise l’indexation | Change l’URL | Objectif principal |
|---|---|---|---|---|
| canonical | ✅ Autorise | ❌ Suggère de ne pas indexer (mais pourrait toujours indexer) | ❌ Ne change pas | Concentrer le poids de plusieurs contenus identiques sur la version canonique |
| noindex | ✅ Autorise | ❌ Interdit | ❌ Ne change pas | Empêcher la page d’apparaître dans les résultats de recherche |
| Redirection 301 | ❌ Redirection automatique | ❌ Ancienne URL non indexée | ✅ Redirige vers la nouvelle URL | Transférer le poids et le trafic de l’ancienne URL vers la nouvelle adresse |
4 Exemples de scénarios courants comparant leur utilisation
Scénario 1 : Le même contenu a plusieurs URL (comme les pages de produits avec paramètres)
- Problème : La page de détail du produit est accessible via
https://example.com/productethttps://example.com/product?color=red, le contenu est entièrement identique. - Outil correct : canonical. Ajoutez la balise canonical à l’URL avec paramètres (
?color=red), pointant vers l’URL de base sans paramètres (https://example.com/product), indiquant aux moteurs de recherche “la version faisant autorité de ce contenu est la page sans paramètres”. - Pourquoi ne pas choisir noindex/301 : noindex empêcherait l’indexation de la page avec paramètres (mais elle pourrait toujours être explorée), cependant, l’utilisateur pourrait y accéder via ce lien, et le moteur de recherche aurait toujours besoin de déterminer quelle est la version principale ; la redirection 301 forcerait l’utilisateur et le robot d’exploration à rediriger, mais l’utilisateur pourrait avoir besoin d’accéder par différents paramètres (par exemple, pour comparer différentes couleurs), ce qui n’est pas adapté à une redirection forcée.
Scénario 2 : Une page n’a plus besoin d’apparaître dans les résultats de recherche (comme une page d’événement expirée)
- Problème : Une page d’événement promotionnel (
https://example.com/promo) est terminée, mais elle peut toujours être visitée par les utilisateurs via des signets ou des liens externes, et elle n’a pas besoin de classement. - Outil correct : noindex. Ajoutez la balise
<meta name="robots" content="noindex">dans le<head>de la page d’événement (ou configurez via le CMS), autorisant les moteurs de recherche à explorer la page (par exemple, pour vérifier l’historique de l’événement), mais ne l’autorisant pas à entrer dans l’index. - Pourquoi ne pas choisir canonical/301 : canonical ne peut pas résoudre le problème de “ne pas faire apparaître la page” (il concentre juste le poids) ; la redirection 301 nécessite de spécifier une nouvelle URL (mais la page d’événement n’a pas d’adresse correspondante), et l’utilisateur pourrait avoir besoin d’accéder à la page d’origine pour consulter des informations historiques.
Scénario 3 : Le site web change de domaine ou ajuste la structure d’URL (comme la migration d’anciennes pages de produits)
- Problème : Une ancienne page de produit (
https://old.example.com/item1) a été migrée de manière permanente vers une nouvelle adresse (https://new.example.com/products/item1), et le poids de lien externe d’origine et les habitudes de visite des utilisateurs doivent être conservés. - Outil correct : Redirection 301. Configurez via le serveur (comme le fichier .htaccess d’Apache) pour que, lorsque l’utilisateur ou le robot d’exploration accède à l’ancienne URL, il soit automatiquement redirigé vers la nouvelle URL. Le classement et le poids des liens externes de l’ancienne URL seront progressivement transférés à la nouvelle URL.
- Pourquoi ne pas choisir canonical/noindex : canonical ne peut pas réaliser la redirection de trafic (l’utilisateur resterait sur l’ancienne URL) ; noindex empêcherait l’indexation de l’ancienne URL, mais le poids des liens externes ne serait pas transféré, et l’utilisateur ne pourrait pas accéder au nouveau contenu via l’ancien lien.
Scénario 4 : URL mobiles et PC séparées (comme m.example.com et www.example.com)
- Problème : Le même contenu a des URL séparées pour mobile (
https://m.example.com/page) et PC (https://www.example.com/page), le contenu est entièrement identique. - Outil correct : Utilisez canonical en priorité (pointant vers l’URL PC), ou coopérez avec la conception réactive pour unifier l’URL. Si l’URL mobile est une entrée nécessaire (par exemple, les utilisateurs ont l’habitude d’accéder via m.example.com), vous pouvez ajouter la balise canonical sur la page mobile pointant vers l’URL canonique PC, tout en redirigeant certaines anciennes URL mobiles vers l’URL PC via 301 (facultatif).
- Pourquoi ne pas choisir noindex : noindex empêcherait l’indexation de la version mobile ou PC, ce qui pourrait empêcher de répondre aux besoins de recherche de certains utilisateurs (par exemple, les utilisateurs mobiles ne verraient pas le contenu adapté lors de la recherche).
Comment écrire le code ? En quoi la logique d’effet est-elle différente ?
Balise canonical : Code HTML, dépend de l’analyse du moteur de recherche
- Écriture du code : Ajoutez
<link rel="canonical" href="https://URL_canonique" />dans la partie<head>de la page à canoniser (comme décrit dans la section précédente).
Logique d’effet : Lorsque le moteur de recherche explore la page, il lit cette balise et enregistre “la version canonique de cette page est XXX”, puis donne la priorité à la version canonique lors du calcul du classement et de l’attribution du poids. Cependant, les autres versions de la page peuvent toujours être explorées (sauf si d’autres restrictions s’appliquent).
Balise noindex : Méta balise HTML ou En-tête de réponse HTTP, dépend du respect des règles par le robot d’exploration
- Écriture du code : Généralement ajouté dans le
<head> de la page <meta name="robots" content="noindex"> (applicable dans la plupart des cas), ou le serveur renvoie l’en-tête de réponse HTTP X-Robots-Tag: noindex (applicable aux pages dynamiques).Logique d’effet : Le moteur de recherche détectera cette instruction lors de l’exploration de la page. S’il confirme que la page répond aux conditions noindex (par exemple, ce n’est pas une page de spam), il ne l’ajoutera pas à l’index. Cependant, la page sera toujours explorée (sauf si l’exploration est bloquée par robots.txt), et l’utilisateur peut y accéder via un lien direct.
Redirection 301 : Configuration du serveur, redirige le trafic de force
Écriture du code : Mise en œuvre via la technologie du serveur, par exemple :
- Serveur Apache : Ajoutez
Redirect 301 /old-page https://example.com/new-pagedans le fichier .htaccess ; - Serveur Nginx : Ajoutez
return 301 https://example.com/new-page;dans le fichier de configuration ; - Système CMS (comme WordPress) : Configurez la règle de redirection via un plugin (comme Redirection).
Logique d’effet : Lorsque l’utilisateur ou le moteur de recherche accède à l’ancienne URL, le serveur renvoie automatiquement le code d’état 301 et redirige vers la nouvelle URL, la barre d’adresse du navigateur affichera la nouvelle adresse. Le poids de l’ancienne URL sera progressivement transféré à la nouvelle URL (généralement quelques semaines à quelques mois), et finalement l’ancienne URL pourrait ne plus être directement visitée (mais la fonction de redirection est conservée).






