11 Oorzaken van duplicate content (mét oplossing)

Facebooktwitterlinkedin

Duplicate content oorzakenHet is één van de meest gevreesde situaties voor elke online marketeer: je komt erachter dat een groot deel van je content dubbel voorkomt op je site. Die mooie tekst die je hebt geschreven over blauwe fietsen staat op minstens drie pagina’s binnen je site! Deksels! Als Google dat ziet dan gaat het mis! Nu gaan al je rankings down the drain! Je wordt uit de index gegooid! Google komt langs en scheert je hond kaal! Toch?

Duplicate content penalty?

Zo’n vaart zal het niet lopen. In de meeste gevallen zul je van Google geen penalty krijgen als er duplicate content voorkomt op je site. Zoekmachines zijn behoorlijk slim als het gaat om het herkennen van gelijke stukken content. Als Google twee versies van een pagina van je site in de index heeft zal de versie die het beste is gaan ranken, de ander wordt simpelweg niet vertoond in de resultaten. Welke pagina het beste is zal liggen aan de kwaliteit en de hoeveelheid van inkomende links, de sitestructuur, clickdata en nog een handvol redenen.

Oorzaken van duplicate content

Hoe kom je aan duplicate content? En vooral, hoe kom je er weer vanaf? Hieronder de 11 meest voorkomende redenen met bijpassende oplossingen.

www en non-www
Voorbeeld: domein.nl en www.domein.nl
Oplossing: redirect één van beiden naar de ander. Gebruik hiervoor een 301 redirect

Trailing slash
Voorbeeld: domein.nl/blauwe-fiets en domein.nl/blauwe-fiets/
Oplossing: redirect één van beiden naar de ander. Gebruik hiervoor een 301 redirect of de canonical tag

Product in meerdere categorieën
Voorbeeld: domein.nl/blauwe-fiets/blauwe-gazelle-herenfiets.html en domein.nl/gazelle/blauwe-gazelle-herenfiets.html
Oplossing: gebruik de canonical tag of vermijd het gebruik van categorieën in de url

URL rewrite + oude URL communiceren
Voorbeeld: domein.nl/blauwe-fiets en domein.nl/?page_id=6, waarbij geen redirect wordt toegevoegd aan de rewrite regel
Oplossing: gebruik een redirect

Filter criteria in URL
Voorbeeld: domein.nl/blauwe-fiets?size=20&sort=asc
Oplossing: gebruik de canonical tag, de meta robots noindex,follow of maak filters niet indexeerbaar

Paginering
Voorbeeld: domein.nl en domein.nl/page/2
Oplossing: gebruik de meta robots noindex,follow of de canonical tag

Session ID in URL
Voorbeeld: domein.nl/?sessionid=123456
Oplossing: geef geen session id mee aan de url of gebruik de canonical tag

Https & http
Voorbeeld: http://domein.nl en https://domein.nl
Oplossing: vermijd gebruikvan https of gebruik een user-agent 301 redirect voor crawlers

Printer friendly versie
Voorbeeld: domein.nl/blauwe-fiets.html?print=true
Oplossing: link naar printversie niet indexeerbaar, noindex,follow, uitsluiten in robots.txt

Interne campagne tagging
Voorbeeld: domein.nl/blauwe-fiets.html?utm_source=internal&utm_medium=footer-links&utm_campaign=homepage
Oplossing: Gebruik hash (#) voor campagne tagging of gebruik de canonical tag

Content syndication
Voorbeeld: domein.nl/blauwe-fiets.html en affiliate.nl/blauwe-fiets.html
Oplossing: Plaats een link naar de bron, cross domain canonical

Toch opzettelijk spammen?

Als je ervoor kiest om heel bewust de zoekresultaten te beïnvloeden door zowel blauwe-fiets.html als blauwe-fietsen.html aan te maken en daar dezelfde content voor te gebruiken, dan wordt het een iets ander verhaal. In dat geval bestaat de kans dat je inderdaad op termijn je rankings en dus je verkeer kwijt bent. Een quality rater die jouw site voorbij ziet komen en er een vlaggetje bij zet, een concurrent die je aangeeft bij Google of het algoritme dat jouw pagina’s er zelfstandig uitvist, er zijn genoeg manieren waarop je in een slecht daglicht komt te staan. Maar wees gerust, je hond laten ze sowieso met rust.

8 reacties

  • Remi van Beekum 30 maart 2011 at 10:51

    Handig lijstje en leuk geschreven. Tnx!

  • Martijn Beijk 30 maart 2011 at 11:36

    Nog een leuke, maar vooral erg belangrijke die je kunt toevoegen is het indexeren van interne zoekresultaten. Ongewenste duplicates en bovendien tegen de richtlijnen.

  • Rasoel Bohlooli 30 maart 2011 at 16:41

    Inderdaad leuk geschreven en zeer handig! Domeinextensies (zonder geo targetting) komt ook vaak voor.

  • Jeroen 1 april 2011 at 10:44

    Mooie lijst. Je geeft soms meerdere oplossing. Ben benieuwd naar welke de voorkeur hebben bij elk probleem.

  • Mark 19 april 2011 at 10:07

    Hoi Wouter. Wellicht nog een toevoeging. Wat te denken van een subdomein dat dezelfde content uit serveert als het hoofddomein.

    Hoe nu te bepalen of er sprake is van duplicate content? Tools die ik af en toe gebruik zijn http://www.virante.com/seo-tools/duplicate-content en Xenu (waar ik dan op pagina titel check).

  • Erik 1 mei 2011 at 14:17

    Handige lijst! Wat ik inderdaad vaak zie gebeuren zijn de www en non-www variant. Ook domein.nl en domein.nl/index.html komt vaak voor.

    Gelukkig geeft de google webmaster tool dit netjes aan.

  • Hans Boin 26 mei 2011 at 19:47

    Duidelijk geschreven! Zondermeer!

    Ik vroeg me alleen af, is het nou beter om aan het eind de tag (dus na .nl) een “/” gebruiken of niet?

    Voorbeeld

    of dit beter???

    ennuh????? waarom??

    Happy SEO and SEA

  • Hans Boin 26 mei 2011 at 19:52

    Ik had een voorbeeld erin gezet

    <link rel="canonical" href="www.sitenaam.nl/ "/>

    deze misschien wel???

Het is niet mogelijk om te reageren.