C'est quoi le contenu dupliqué ou le duplicate content ?
C'est quoi le contenu dupliqué ?
Le duplicate content se produit lorsque par exemple en recopie un article d'un site tiers dans le but d’avoir plus de contenu de qualité et par conséquent plus de trafic. Ces deux pages ont le même contenu mais des URL différentes, le moteur de recherche va indexer la page qu’il juge la plus pertinente. Mais il arrive aussi souvent, de manière involontaire, qu’un site internet contient de contenu dupliqué. Exemple, un même article sur le site accessible via plusieurs URL. Ca peut être tout bêtement via liens suivant: Yoomweb.com/article1 et Yoomweb.com/article1/. Vu d’un moteur de recherche, les deux pages ont des URL différentes, et le même contenu.
Les contenu dupliqués peuvent nuire au classent d'un site internet. C'est pour clea, il faut mentionner au moteurs de recherche l'URL préférées pour l'indexation via une balise Rel=Canonical, appelé URL Canonique.
C'est quoi une URL canonique ?
L’URL canonique (canonical URL) est une balise permettant d’indiquer à un moteur de recherche, lorsque plusieurs contenus ayant des URL différentes mais des contenus identiques sont présents, quelle est l’URL « principale » à prendre en compte pour l’indexation, évitant ainsi de laisser le soin au moteur de choisir à votre place et de vous pénaliser au classement.
5 erreurs courantes avec la balise Rel = canonical:
Ajouter un un lien rel=canonical dans votre page Web est un signal fort aux moteurs de recherche indiquant votre url préférée pour l’indexation dans le cas ou vous avez plussieurs pages ayant le même contenu. Les moteurs de recherche vont indexer une page parmi elles.
Le lien canonique est soutenu par plusieurs moteurs de recherche, y compris Yahoo!, Bing et Google. Le lien rel=canonical consolide l’indexation de plusieurs pages en doubles ou ayant le même contenu. Vous devez choisir l’url que vous voulez avoir dans les résultats de recherche. Le lien rel=canonical peut vous causer plusieurs problèmes s’il est mal configuré. C’est mieux de ne pas l’utiliser si vous ne savez pas ce que vous êtes entrain de faire, une chance que Google l'ignore dans la majorité des cas quand il doute d'une mal configuration.
Le lien canonique est utilisé d’une part par les moteurs de recherche pour afficher la page approprié aux internautes et aussi pour indexer seulement une page parmi plusieurs ayant le même contenu. Le contenu dupliqué peut vous nuire dans votre référencement naturel. Google par exemple, donne une pénalité aux sites ayant un contenu dupliqué.
Il n’est pas toujours facile de connaitre nos pages dupliquées. Certain outils ou CMS mal configurés peuvent vos créer des pages dupliquées sans que vous le sachiez. Il existe plusieurs outils sur le marché vous permettant d’identifier vos pages dupliquées, l’outil Google pour le webmaster est le meilleur pour moi, en plus il est gratuit (à part qu’il appartient au roi de la recherche sur Internet).
Meilleures pratiques d'utilisation des liens canonique web Rel = canonical:
- Une grande partie du contenu de la page double doit être présent sur la version canonique. Si les pages sont similaires mais elles contiennent un contenu différent ne sont pas dupliquées d’après Google.
- Assurez vous que la cible de votre lien canonique pointe sur une vraie page qui existe, pas une rreur 404 par exemple.
- Vérifiez que le rel = canonical cible ne contient pas de balise meta robots noindex ou bloqué par le robot.txt
- Assurez-vous que vous préférez vraiement afficher la page cible dans les moteurs de recherche que la page dupliquée.
- Inclure le lien rel = canonical soit dans le <head> de la page ou l'en-tête http. Pour les utilisateurs des CMS comme Joomla ou Wordpess, il exite des extensions, il existe des extensions pour gérer les contenus dupliqués.
- Ne spécifiez pas plus d'un URL canonique pour une page. Lorsque plus d'une est spécifiée, tous les rel = canonical sont ignorées par les moteurs de recherche.
Les erreurs à ne pas faire dans les URL canonique :
Erreur 1: Assigné un URL canonique à la première page d'une série paginée
Imaginez que vous avez un article qui s’étend sur plusieurs pages:
La signalisation d’une URL canonique de la page 2 ou 3 à la page 1 n’est pas une bonne pratique. Si vous le faites, les pages 2 et 3 ne seront pas indexées. Google voit trois pages différentes car leur contenu est différent.
Erreur 2: Spécifier des URL relatives au lieu des absolues.
<link href="/YoomWeb.com/articles" rel="canonical" />
Ou
<link href="//articles" rel="canonical" />
Au lieu de
<link href="http:// YoomWeb.com/articles " rel="canonical"
Si vous faites ca, Google va tout simplement l’ignorer et vous restez avec votre contenu dupliqué.
Erreur 3: déclarations involontaires ou multiples de rel = canonique
Parfois, les webmasters désignent des URL canoniques par erreur. Comme un copier coller sans modification par exemple.
Un autre problème est lorsque les liens canonique sont multiples mais vers des URL différentes. Cela arrive souvent avec des plugins installés et mal configurés via des CMS. Google va ignorer ces liens . Quand vous installez un plugin ou une extension pour gérer les URL Canoniques, vérifiez quelques pages en regardant le code.
Erreur 4: Mettre un URL canonique dans la catégorie vers un article de cette même catégorie
Exemple, vous avez un site qui contient des catégories et des articles comme le cas de la majorité des sites. Si le contenu de votre catégorie (description) ressemble à votre premier article affiché et vous faites un canonique de la catégorie vers cet article. La page catégorie sera ignorée par les moteurs de recherche. Si vous souhaitez que les utilisateurs soient en mesure de trouver à la fois la page de catégorie et de l'article, il est préférable de ne rien mettre.
Erreur 5: L’ajout de lien canonique dans la balise <body>
La balise rel = canonical devrait apparaître seulement dans la section <head> d'un document HTML. Le lien est ignoré par les moteurs de recherche s'il est en body>.
Conclusion
Pour désigner un URL canonique logique :
- Vérifiez que la plupart du contenu principal d'une page apparaît également dans la page canonique. Pas seulement quelques phrases ou mots.
- Vérifier que rel = canonical est spécifié qu'une seule fois (voire pas du tout) et dans le <head> de la page.
- Vérifiez que le URL canonique pointe vers une page existante avec le bon contenu (ie, pas un 404 ou soft 404).
- Éviter de spécifier les URL canonique entre les catégories et les articles (pages).
Comment rédiger des contenus de qualité ?:
- Qu'est-ce que le contenu SEO ? Comment écrire du contenu qui se classe
- SEO Copywriting : 12 conseils simples pour un meilleur contenu et des classements plus élevés
- Comment rester créatif avec une stratégie de contenu basée sur le référencement ?
- Est-il possible de créer des backlinks pour le SEO sans contenu ?
- Pourquoi votre stratégie SEO a besoin d'un contenu long ?
- Comment créer un contenu SEO convaincant et de qualité: 4 éléments