


Het is één van de meest gevreesde situaties voor elke online marketeer: je komt erachter dat een groot deel van je content dubbel voorkomt op je site. Die mooie tekst die je hebt geschreven over blauwe fietsen staat op minstens drie pagina’s binnen je site! Deksels! Als Google dat ziet dan gaat het mis! Nu gaan al je rankings down the drain! Je wordt uit de index gegooid! Google komt langs en scheert je hond kaal! Toch?
Duplicate content penalty?
Zo’n vaart zal het niet lopen. In de meeste gevallen zul je van Google geen penalty krijgen als er duplicate content voorkomt op je site. Zoekmachines zijn behoorlijk slim als het gaat om het herkennen van gelijke stukken content. Als Google twee versies van een pagina van je site in de index heeft zal de versie die het beste is gaan ranken, de ander wordt simpelweg niet vertoond in de resultaten. Welke pagina het beste is zal liggen aan de kwaliteit en de hoeveelheid van inkomende links, de sitestructuur, clickdata en nog een handvol redenen.
Oorzaken van duplicate content
Hoe kom je aan duplicate content? En vooral, hoe kom je er weer vanaf? Hieronder de 11 meest voorkomende redenen met bijpassende oplossingen.
www en non-www
Voorbeeld: domein.nl en www.domein.nl
Oplossing: redirect één van beiden naar de ander. Gebruik hiervoor een 301 redirect
Trailing slash
Voorbeeld: domein.nl/blauwe-fiets en domein.nl/blauwe-fiets/
Oplossing: redirect één van beiden naar de ander. Gebruik hiervoor een 301 redirect of de canonical tag
Product in meerdere categorieën
Voorbeeld: domein.nl/blauwe-fiets/blauwe-gazelle-herenfiets.html en domein.nl/gazelle/blauwe-gazelle-herenfiets.html
Oplossing: gebruik de canonical tag of vermijd het gebruik van categorieën in de url
URL rewrite + oude URL communiceren
Voorbeeld: domein.nl/blauwe-fiets en domein.nl/?page_id=6, waarbij geen redirect wordt toegevoegd aan de rewrite regel
Oplossing: gebruik een redirect
Filter criteria in URL
Voorbeeld: domein.nl/blauwe-fiets?size=20&sort=asc
Oplossing: gebruik de canonical tag, de meta robots noindex,follow of maak filters niet indexeerbaar
Paginering
Voorbeeld: domein.nl en domein.nl/page/2
Oplossing: gebruik de meta robots noindex,follow of de canonical tag
Session ID in URL
Voorbeeld: domein.nl/?sessionid=123456
Oplossing: geef geen session id mee aan de url of gebruik de canonical tag
Https & http
Voorbeeld: http://domein.nl en https://domein.nl
Oplossing: vermijd gebruikvan https of gebruik een user-agent 301 redirect voor crawlers
Printer friendly versie
Voorbeeld: domein.nl/blauwe-fiets.html?print=true
Oplossing: link naar printversie niet indexeerbaar, noindex,follow, uitsluiten in robots.txt
Interne campagne tagging
Voorbeeld: domein.nl/blauwe-fiets.html?utm_source=internal&utm_medium=footer-links&utm_campaign=homepage
Oplossing: Gebruik hash (#) voor campagne tagging of gebruik de canonical tag
Content syndication
Voorbeeld: domein.nl/blauwe-fiets.html en affiliate.nl/blauwe-fiets.html
Oplossing: Plaats een link naar de bron, cross domain canonical
Toch opzettelijk spammen?
Als je ervoor kiest om heel bewust de zoekresultaten te beïnvloeden door zowel blauwe-fiets.html als blauwe-fietsen.html aan te maken en daar dezelfde content voor te gebruiken, dan wordt het een iets ander verhaal. In dat geval bestaat de kans dat je inderdaad op termijn je rankings en dus je verkeer kwijt bent. Een quality rater die jouw site voorbij ziet komen en er een vlaggetje bij zet, een concurrent die je aangeeft bij Google of het algoritme dat jouw pagina’s er zelfstandig uitvist, er zijn genoeg manieren waarop je in een slecht daglicht komt te staan. Maar wees gerust, je hond laten ze sowieso met rust.
Handig lijstje en leuk geschreven. Tnx!
Nog een leuke, maar vooral erg belangrijke die je kunt toevoegen is het indexeren van interne zoekresultaten. Ongewenste duplicates en bovendien tegen de richtlijnen.
Inderdaad leuk geschreven en zeer handig! Domeinextensies (zonder geo targetting) komt ook vaak voor.
Mooie lijst. Je geeft soms meerdere oplossing. Ben benieuwd naar welke de voorkeur hebben bij elk probleem.
Hoi Wouter. Wellicht nog een toevoeging. Wat te denken van een subdomein dat dezelfde content uit serveert als het hoofddomein.
Hoe nu te bepalen of er sprake is van duplicate content? Tools die ik af en toe gebruik zijn http://www.virante.com/seo-tools/duplicate-content en Xenu (waar ik dan op pagina titel check).
Handige lijst! Wat ik inderdaad vaak zie gebeuren zijn de www en non-www variant. Ook domein.nl en domein.nl/index.html komt vaak voor.
Gelukkig geeft de google webmaster tool dit netjes aan.
Duidelijk geschreven! Zondermeer!
Ik vroeg me alleen af, is het nou beter om aan het eind de tag (dus na .nl) een “/” gebruiken of niet?
Voorbeeld
of dit beter???
ennuh????? waarom??
Happy SEO and SEA
Ik had een voorbeeld erin gezet
<link rel="canonical" href="www.sitenaam.nl/ "/>
deze misschien wel???