Site-kloons

Uit De Vliegende Brigade
Versie door Jeroen Strompf (Overleg | bijdragen) op 22 jun 2021 om 12:38 (Bronnen)

(wijz) ← Oudere versie | Huidige versie (wijz) | Nieuwere versie → (wijz)
Ga naar: navigatie, zoeken

Duplicate content is content die op meerdere plekken verschijnt - Identieke content met meerdere unieke URL's. Het probleem: Google houdt daar niet van, en het schaadt je positie in Google Search.

Casus

Dit is de casus waar dit artikel over gaat (juni 2021):

Gekloonde sites

Stel je hebt een goedlopende webwinkel. Een mogelijke tactiek om daar meer uit te halen, is door deze site te klonen voor verschillende land-taal-combinaties. Bv. (land_taal):

  • nl_nl
  • be_nl
  • be_fr
  • fr_fr
  • nl_en
  • be_en
  • en_en
  • Etc.

Probleem hierbij is dat Google het niet leuk vind als je webwinkels 'zomaar' kloont. Dat is in dit voorbeeld niet het geval, maar alleen als het voor Google duidelijk is, dat deze webwinkels een grotere markt partitioneren. Dus dat het ze niet overlappen, maar elk een eigen publiek bedienen.

Meerdere links naar dezelfde content

Het tweede probleem: Google vindt het niet leuk als er binnen een gegeven site, er meerdere links naar dezelfde content is. Daar heb ik mee te maken, omdat webwinkels verschillende paden of wizards bevatten, om bij bepaalde content te komen. Het kan trouwens al veel sneller gebeuren: Als je bv. soms linkt naar example.com en andere keren naar www.example.com

Oplossingen

Canonicalization

Met canonicalization wordt bedoeld, dat als je meerdere links naar identieke content hebt, dat je aangeeft wat de primaire links zijn, en welke kopieën zijn

[1] - Snap ik niet helemaal:

Google does not recommend blocking crawler access to duplicate content on your website, whether with a robots.txt file or other methods. If search engines can't crawl pages with duplicate content, they can't automatically detect that these URLs point to the same content and will therefore effectively have to treat them as separate, unique pages. A better solution is to allow search engines to crawl these URLs, but mark them as duplicates by using the rel="canonical" link element, the URL parameter handling tool, or 301 redirects. In cases where duplicate content leads to us crawling too much of your website, you can also adjust the crawl rate setting in Search Console.
  • Bv.: Gebruik noindex tags om

Geotargeting

Met geotargeting wordt hier bedoeld, dat je Google helpt om te bepalen voor welke markt een site bedoeld is. Deze tools worden apart behandeld:

  • Gebruik country code top level domains - ccTLD's
  • Webmaster Tools

Gebruik ccTLD's

[2]:

Use top-level domains: To help us serve the most appropriate version of a document, use top-level domains whenever possible to handle country-specific content. We're more likely to know that http://www.example.de contains Germany-focused content, for instance, than http://www.example.com/de or http://de.example.com.

Google Search Console

In Google Search Console (gSC) kun je geotargeting instellen via International Targeting. Voor sites met een ccTLD zal dit doorgaans niet nodig zijn. Daarnaast lijkt dit achterhaald te zijn: Anders zou het niet in de sectie Legacy tools and reports zitten

Bronnen