Le contenu dupliqué, c'est quoi ?
Appelé Duplicate content en anglais, il s'agit d'un contenu identique que l'on retrouve sur plusieurs pages de sites internet.
Les moteurs de recherche indexent / référencent les pages des sites internet du monde entier. Lorsqu'ils détectent des contenus identiques, ils les filtrent et ne font apparaître dans leur résultat que le contenu original ou celui le plus digne de confiance.
Pour autant, les pages contenant du duplicate content ne sont pas désindexées. On les retrouve dans les moteurs de recherche et elles conservent leur PageRank (Mise à jour : ancien indicateur SEO développé par Google, il n'existe plus).
Il existe un seuil de tolérance pour Google, à partir duquel il considère qu'un site comporte du contenu dupliqué : il est à d'environ 70%.
Les différents types de duplicate content
Il existe 2 types de contenu dupliqué :
- Le contenu dupliqué interne
On parle de duplicate content interne lorsqu'un même contenu se retrouve sur un même site internet, sur 2 pages différentes. Il est très fréquent d'en trouver sur des sites e-commerce.
- Le contenu dupliqué externe
Dans ce cas, on retrouve un même contenu sur 2 sites internet (ou plus) différents. Il s'agit souvent de plagiat.
Éviter le contenu dupliqué pour un site e-commerce
Les sites e-commerce sont fortement exposés au phénomène de duplicate content : lorsqu'une description produit est reprise par de multiples sites pas exemple.
Il convient alors de définir des descriptions originales de vos produits, comprendre : différentes de celles fournies par le fournisseur de vos produits, par exemple.
Les descriptions doivent être travaillées. Et au delà de cela, les descriptions doivent être différentes entre les produits eux-mêmes.
Les méta titres et méta descriptions doivent également être différentes
Le sujet du contenu dupliqué ne s'arrête pas uniquement au contenu éditorial.
2 autres éléments de vos pages doivent également être uniques : c'est le cas des balises titres et des méta descriptions.
Toutes les pages doivent avoir une balise titre différente. Et il en est de même avec la méta description.
De l'importance des URLs canoniques
Lorsque 2 pages sont exactement identiques ou bien que leur contenu est partiellement similaire, il va falloir indiquer aux moteurs de recherche laquelle des 2 pages fait référence à l'autre. Ainsi, Google comprendra que l'une des pages est la principale, qu'il n'y a pas de doublon et donc pas d'erreur.
Comment procéder concrètement ? Dans la page secondaire, il faut rajouter une balise HTML dans l'entête afin d'indiquer l'URL canonique à Google. Ainsi, Google prendra en compte cette URL canonique dans ses résultats de recherche. Le duplicate content est alors évité.
Il existe des outils et algorithmes qui peuvent détecter le contenu dupliqué en calculant notamment un taux de similarité. Vous pouvez par exemple utiliser Copyscape, Web SEO Analytics ou Plagspotter, parmi d'autres.
Vous comprenez maintenant pourquoi le contenu dupliqué est à éviter - et même à bannir - et que le fait d'écrire du contenu original est primordial pour le bon référencement d'un site internet !
Vous souhaitez être accompagné par des experts ? Découvrez les prestations de notre agence SEO.