Si vous arrivez sur ce blog pour la première fois, vous serez peut-être intéressés par mon guide de 36 pages sur le référencement : je vous explique comment référencer votre blog en 20 étapes.
Pour télécharger gratuitement ce guide, cliquez ici.
Vous serez redirigé sur un autre onglet et pourrez continuer votre lecture ensuite sur cette même page.
Eviter le duplicate content pour mieux référencer son blog
Après le nofollow, on va voir un autre terme technique qui joue sur le référencement de votre blog : le duplicate content.
Qu’est-ce que c’est ? Quand est-ce qu’on fait du duplicate content ? Pourquoi faut-il l’éviter et comment l’éviter ? C’est ce qu’on va voir tout de suite.
Qu’est-ce que le duplicate content ?
Appelé contenu dupliqué en Français (pas besoin de Google Trad pour ça ! ^^) , le duplicate content est du texte que l’on trouve en double sur un même site ou à travers plusieurs sites différents.
C’est un concept utilisé dans le référencement naturel car les moteurs de recherche tels que Google pénalisent les sites n’ayant pas du contenu unique.
Cela peut être du texte copié-collé mot pour mot, mais est également considéré comme duplicate content une copie avec quelques mots modifiés. Que ce soit dans un paragraphe ou une page entière, Google voit tout !
Dans quel cas peut-on avoir du duplicate content ?
Il y a 2 types de contenu dupliqué :
- Le contenu non malveillant : il s’agit de copies faites par le même auteur sur son propre blog ou même ailleurs.
- Le contenu malveillant : ce sont les copies générées avec intention de « nuire » et qui ne permet pas à Google de faire correctement son référencement.
1. Le contenu non malveillant :
- Dans les archives ou catégories de votre blog :
Il faut savoir que pour Google, une page présente une url unique. Si plusieurs url ont le même texte, c’est considéré comme du duplicate content. Ainsi, les articles qui s’affichent à la fois dans leur propre url, les archives ou bien les pages de catégories ou de mots-clés sont considérés comme des doublons.
Si on prend l’exemple de cet article :
- il est présent à cet url : https://www.trucsdeblogueuse.com/duplicate-content-referencement/
- mais aussi dans la catégorie Trafic de blog : https://www.trucsdeblogueuse.com/categorie/trafic/
- et dans les tags Google (https://www.trucsdeblogueuse.com/mot-cle/google/), Référencement (https://www.trucsdeblogueuse.com/mot-cle/referencement/) et Trafic (https://www.trucsdeblogueuse.com/mot-cle/trafic-2/),
- Si j’avais créé des pages d’archives pour Août 2014, ça aurait fait une copie en plus.
Cela fait une possibilité de 5 copies du même texte, si je n’avais pas mis des extaits dans les pages d’archives et catégories/tags.
- Sur votre page d’accueil :
Certains d’entre vous affichez vos articles entiers sur la page d’accueil au lieu des extraits, cela donne alors à Google des url différentes pour un même texte : l’url de l’article et l’url de l’accueil.
- Lorsqu’il y a plusieurs versions d’un même site, par exemple sur ordinateur (desktop) et mobile, ou bien des versions imprimables :
Quand un site a une version mobile, cela se passe ainsi : lors de la connexion au site, un robot détecte le type de support et s’il reconnaît un mobile ou une tablette, on présente au visiteur une version différente du site « normal ».
Le site normal est du type www.trucsdeblogueuse.com et le site mobile du type m.trucsdeblogueuse.com ou www.trucsdeblogueuse.mobi
Comme vous commencez à le comprendre, on a des url différentes donc c’est du duplicate content.
Contrairement au site mobile, un site responsive permet d’être lu sur tous les types de supports sans changer d’url (comme c’est le cas pour mon blog, il n’a donc pas de version m.trucsdeblogueuse.com ou .mobi).
Une autre version possible d’une page est la page que l’on peut imprimer, vous avez déjà dû voir sur certains sites un lien « Version imprimable » qui est le double de l’original sans les menus ou images etc.
- Un article publié plusieurs fois sur des sites différents par le même auteur :
Cela peut être un article-invité que vous avez écrit chez un blogueur et que vous publiez aussi chez vous.
Ou bien un article publié sur un premier blog, puis le même qui apparaît sur un second blog appartenant à vous car vous aviez décidé de faire une migration de blog sans effacer le premier.
2. Le contenu malveillant :
Le terme « malveillant » est utilisé par Google lui-même dans ses recommandations sur le duplicate content. Il considère que c’est malveillant car la duplication a pour intention de nuire directement ou indirectement. Les copies nuisent à la fois :
- l’auteur réel du texte qui retrouve son contenu sur un site sans son accord,
- le lecteur qui va lire plusieurs fois la même chose sur des sites différents pour une même requête, donc qui ne lui apportent aucune valeur ajoutée,
- Google qui ne pourra pas présenter des résultats de recherche pertinents aux internautes.
On en trouve 2 types :
- Le plagiat :
Certains « blogueurs » (qui n’en sont pas en vrai) copient des articles de blogs existants pour avoir du contenu sur le leur sans avoir à écrire une seule ligne de texte. Seules les touches Ctrl, C et V vont leur servir sur leur clavier.
- Les méthodes de référencement abusif :
Avant les mises à jour récentes de Google, on voyait des référenceurs utiliser abusivement à leur avantage les critères d’indexation. Ils avaient plusieurs sites leur appartenant et :
- ils dupliquaient le même contenu sur plusieurs sites pour que seuls leurs sites soient sur les premiers résultats de recherche,
- quand Google a commencé à pénaliser les sites ayant des doublons, ils dupliquaient le contenu des concurrents cette fois-ci, pour que le site du concurrent soit pénalisé et ne soit plus indexé dans les résultats de recherche.
Il faut vraiment être tordu (ou un génie ?) pour penser à faire ça…
Pourquoi faut-il éviter le duplicate content ?
Vous avez dû le comprendre avec les exemples cités plus haut, il faut éviter d’avoir du texte dupliqué car Google pourrait penser que vous avez un contenu malveillant et pénaliser votre blog.
Cela se traduira par une désindexation de votre blog sur les moteurs de recherche, c’est-à-dire que les internautes ne vont plus trouver votre blog s’ils le recherchent sur Google, même avec une recherche sur le nom de votre blog.
Il sera toujours accessible avec le lien direct ou avec un lien depuis un autre site, mais étant donné que le référencement naturel permet d’apporter environ 50% des visites en moyenne sur tous les sites, cela ferait diviser par deux le trafic de votre blog…
Mais bonne nouvelle, Google sait maintenant faire la différence entre le texte initial et le texte dupliqué :
- Pour le contenu non malveillant, Google choisit lui-même d’indexer une seule des pages en doubons et pour éviter qu’il le fasse au hasard, il est possible de lui indiquer la page préférée grâce à des balises html.
- Pour le contenu malveillant, Google regarde certains critères tels que :
- la date de publication,
- l’auteur de la publication.
Comment éviter le duplicate content ?
Même si Google sait faire la différence entre un texte original et un texte dupliqué, il y a des choses que l’on peut faire pour éviter de faire du duplicate content et risquer d’être pénalisé.
Eviter les doublons sur son blog
Voilà les recommandations pour éviter le duplicate content sur son blog :
- Mettre les extraits de ses articles aussi bien sur sa page d’accueil que dans les pages d’archives, de catégories et mots-clés (tags), mais également dans son flux RSS. Pour cela sur WordPress, allez dans Réglages/Lecture/ »Pour chaque article d’un flux, choisir » et cocher « l’extrait ».
- Indiquer à Google de ne pas indexer ces pages avec l’attribut noindex. (par exemple grâce à l’extension SEO by Yoast).
- Pour les versions mobile et imprimable, dire à Google quelles sont les pages originales avec l’attribut canonical.
- Lorsque vous migrez un blog vers un nouveau nom de domaine, faites des redirections 301 pour indiquer à Google que les anciennes url doivent définitivement être transféréer vers les nouvelles.
- Pour les articles-invités que vous écrivez chez d’autres blogueurs : ne recopiez pas l’article sur votre propre blog. Si vous voulez absolument en parler à vos lecteurs, vous pouvez expliquer que vous avez écrit sur tel blog en faisant une petite introduction (unique et pas reprise sur l’article-invité) et mettre un lien cliquable vers l’article original chez l’autre blogueur. Vous comprenez maintenant pourquoi je demande à mes blogueurs invités de ne pas copier leur article sur leur blog, on ne sait pas si Google va pénaliser votre blog (selon la date de publication) ou le mien (selon le nom de l’auteur) !
Pour vérifier si vous avez du duplicate content sur votre blog, vous pouvez aller sur le site Siteliner : il vérifie tout notre blog et compare nos résultats avec la moyenne des autres sites. Par contre la version gratuite est limitée à un scan de 250 pages seulement. On ne se rend pas compte, mais avec les archives etc, un blog peut atteindre des milliers de pages très rapidement (par exemple, j’ai près de 2000 pages sur mon blog alors que j’ai seulement une centaine d’articles pour l’instant).
Traquer les plagieurs
En général, on se rend compte qu’on a été plagié lorsque l’on tombe par hasard sur un de nos articles sur un autre site, ou bien si quelqu’un d’autre le voit et nous le dit.
Il existe des sites qui permettent de vérifier si une de nos pages a été dupliquée, tels que :
- Copyscape
- Positeo et Plagspotter qui permettent aussi de voir les copies similaires avec un pourcentage de duplication (certains modifient quelques mots dans un contenu copié)
Malheureusement il faut rechercher url par url (donc article par article), ce qui peut être assez rébarbatif. Et je ne connais pas de site qui permette d’avoir une alerte automatique de contenu plagié, alors si vous en connaissez un de bien, je suis preneuse !
Si vous êtes victime de plagiat sur un de vos articles, vous pouvez :
- dans un premier temps essayer de contacter le blogueur en lui disant que vous avez été copié sans votre autorisation. Certains blogs sont des récapitulatifs de ce qu’ils trouvent ailleurs (comme on peut le voir pour les blogs de DIY) alors ce n’était peut-être pas fait méchamment.
- s’il ne veut pas supprimer le contenu malgré votre demande, vous pouvez notifier Google pour atteinte aux droits d’auteur qui se chargera de vérifier (grâce aux informations que vous leur fournirez) puis de retirer la page dupliquée. Lisez bien la notice de Google car si votre demande n’est pas justifiée et réelle, vous devrez payer des dommages et intérêts.
A vous de jouer
Est-ce que vous connaissiez le duplicate content ? Quelles sont vos techniques pour l’éviter, vos outils pour le détecter ? J’en ai peut-être oublié alors n’hésitez pas à partager avec nous vos méthodes dans les commentaires ci-dessous.
Mia
Ancienne responsable e-commerce pour une marque de luxe, elle est l'auteure du livre "Augmenter le trafic de son blog" paru aux Editions Eyrolles.
Elle s'adresse à tous ceux dont la passion est le moteur.
Voir sa description détaillée.
Les derniers articles par Mia (tout voir)
- Je vous invite dans ma bibliothèque (plein de cadeaux pour vous) - 2 avril 2019
- Je suis maman, blogueuse, guitariste, sportive et bien d’autres… - 28 mars 2019
- Le blog a 5 ans ! Un jeu-concours pour fêter ça - 8 mars 2019
Bonjour Mia,
Merci pour ce super article ! J’aimerais savoir, je blogue des chronique de livres et j’ai pour habitude de les poster également sur 3 réseaux sociaux comme Babelio. Je mets les 3/4 environ, et j’indique à la fin le lien vers l’article entier. Est-ce que tu penses que c’est considéré comme du duplicate content ?
Merci !
Bonjour je pense qu’aujourd’hui les blogueurs ont bien compris l’importance de ne pas faire de duplicate content ou contenu dupliqué.Seuls les plagieurs le font sans remord, il existe beaucoup de plateformes pour faire faire du contenu à des prix qui sont corrects.
J’ai moi même pratiqué le duplicate content pour mes pages de ventes c’est à dire que j’ai gardé le même modèle pour plusieurs pages mais mon trafic principal ne venait pas de google mais des réseaux sociaux, donc là éventuellement il n’y a pas trop de soucis vu que je me suis volé mes propres textes et que le trafic vient principalement de facebook.
Merci pour cet article Mia sur le duplicate content.
J’ai fait le test avec siteliner et il m’indique (sur la moitié de mon site) 16% de duplicate content. L’idéal est surement d’avoir 0 ou de s’en approcher mais je me dis qu’il faut carrément que je change de thème pour améliorer mon site car sur ma page d’accueil j’ai 2 fois l’extrait de mes 8 derniers articles… Après je ne comprends pas tout du rapport… A quoi ca sert de mettre des tags si on ne les indexe pas dans le moteur de recherche google ?
Bonjour Mia, j’ai utilisé site-analyzer et j’ai appris que j’avais beaucoup de duplicate links…et ça n’a pas l’air d’être une bonne nouvelle! seulement je ne vois pas ce que c’est! Aurais-tu une piste? Merci pour ce blog parfait pour les apprenties blogueuses.
Coucou Mia. Du coup j’apprends qu’en copiant l’introduction d’un article que j’écris pour un autre site avec son lien pour que mes lecteurs lisent la suite je fais du duplicate content ?
Hello Fred, tu ne fais pas de duplicate content car tu mets seulement un petit texte (c’est comme pour les extraits) et en plus tu mets un lien vers l’article donc Google comprend que ce n’est pas malveillant 🙂
Ah ouf tu me rassures 😉 Merci Mia !
Le plus simple, c’est de ne pas envoyer les catégories et les tags à référencer à Google via les sitemaps.. Ça solutionne pas mal de choses au niveau des doublons..
bonjour Mia
merci pour ces explications. Sais-tu si on peut faire des redirections 301 à partir d’un blog wordpress.com?
j’ai un tout un blog à déménager de .wordpress.com à .com….
merci
bises!
Oui, WordPress le propose, mais c’est payant..
Hello Valérie, oui c’est malheureusement payant, c’est 13$/an. Il faut que tu achètes la redirection dans la boutique WordPress. voici leur tuto (en Anglais) : http://en.support.wordpress.com/site-redirect/
bisous!
merci Mia pour ta réponse, mais je parlais d’une redirection article par article pour ne pas perdre les liens qu pointent vers le premier blog…
bisous
oui je parle aussi de redirection article par article, par contre c’est vrai que je t’ai donné la procédure pour passer de .com à .org. mais je pense que ça marche aussi de .com à .com
en fait dans ton cas, tu n’avais pas besoin de faire de migration de blog mais juste de changer le nom de ton blog dans l’admin et de faire pointer le nouveau nom de domaine vers ton ancien blog non?
en fait, je parle d’un autre blog http://www.bienvivreavecalzheimer.com et comme j’ai changé le réglage des adresses des articles dans .com, elles ne correspondent pas aux anciennes (je ne sais pas si c’est clair;-) je pensais faire les redirections à la main comme j’ai fait pour le mien… mais s’il existe une autre méthode, je suis preneuse!… merci!
ah oui! ça a changé les anciennes adresses en modifiant le réglage? je ne sais pas alors… comment tu fais pour faire les redirections à la main? quand on clique sur une ancienne url on tombe sur une page 404 non?
par « à la main », je veux dire que je laisse l’ancien blog http://www.bienvivreavecalzheimer.wordpress.com et dans chaque article, je ne mets que la première phrase avec un « lire la suite » qui pointe sur l’article entier dans le nouveau blog….
mais le nouveau est sur wordpress.org ou .com?
si c’est sur .org la redirection se fait avec le lien que je t’ai donné (13$/an)
si c’est sur .com je ne comprends pas la migration… pourquoi faire un 2e blog identique?
c’est bien sur .org, mais justement j’ai changé la façon dont se créent les adresses des articles en ne laissant que le titre de l’article (sans la date), meilleur pour le référencement parait-il, du coup la redirection payante pointe vers une page 404… désolée de squatter tes commentaires 😉
ah ben d’accord, ce n’est pas ce que tu dis au début… dans ce cas-là, si tu paies déjà la redirection de wordpress.com, tu peux télécharger le plugin « simple 301 redirects » et changer url par url les adresses du nouveau qui pointent vers les pages 404 (par exemple http://www.bienvivreavecalzheimer.com/article345566 vers http://www.bienvivreavecalzheimer.com/nomdelarticle) (et non pas http://www.bienvivreavecalzheimer.wordpress.com/article345566 vers http://www.bienvivreavecalzheimer.com/nomdelarticle)
et donc avec le plugin tu indiques article par article:
/article345566 doit rediriger vers http://www.bienvivreavecalzheimer.com/nomdelarticle
/article237895 doit rediriger vers http://www.bienvivreavecalzheimer.com/nomdelarticlesuivant
etc. (sans mettre le DNS principal au début)
ah génial!… je savais que tu avais la solution!.. t’es trop forte!.. merci!!!!!!!!!
Coucou Mia! Trè très bon article que voilà! Mais j’ai une question: j’aimerais créer une verqion de mon site en anglais, avec les mêmes articles du coup mais en anglais. Le duplicate contente s’appliquera-t-il? Si oui comment l’éviter à ce moment-là?
Très bon n article!
Du coup, chacun de mes articles à une dizaine de tags. Cela fait du duplicate content?
Ultra intéressant merci Mia pour ces infos !!
Faut absolument que je suprime mon ancien blog alors …
Bisous
Encore un très bon article 😉
Wow, je ne pensais pas que ça allait aussi loin!!!! Merci pour l’article… j’ai beaucoup de travail sur la planche vu que mes articles sont complets sur ma page d’accueil et que selon le lien que tu nous as donné, j’ai énormément de double! Merci encore!
Salut Mia, j’ai une petite question par rapport à ce sujet. Si la même phrase est répété sur chaque article, est-ce que c’est considéré comme du duplicate content ?
Bonne journée ! 🙂
si c’est seulement une phrase, non! 🙂