Spam in Google Analytics bestrijden – Gladior

Bart Ensink, 5 februari 2016

In toenemende mate kun je in Google Analytics vreemde resultaten tegenkomen. Met name bij verwijzende websites en gebeurtenissen (events), of je ziet onnatuurlijke stijgingen in direct verkeer. Is dit het geval, dan is er waarschijnlijk sprake van spam in je data. Google Analytics is het meest gebruikte pakket voor web analytics wereldwijd. Dat is in Nederland niet anders. Deze populariteit trekt helaas ook mensen aan met andere bedoelingen.

Wat is spam in Google Analytics?

In feite hebben we het hier over robots van spamverspreiders. Deze spideren geautomatiseerd vele websites en zorgen dat ze voorkomen in Google Analytics resultaten. Het idee hier achter is dat eigenaren van deze statistieken zich afvragen welke sites dit zijn en ze gaan bezoeken. Vaak staan deze sites vol met reclame waar geld aan verdiend wordt. Het kan ook erger. Dan betreft het websites die malware of virussen proberen te plaatsen op een PC, bij het bezoeken van de site. Voor je eigen website of Google Analytics zijn spamrobots niet gevaarlijk, het bezoeken van deze websites kan wel gevaarlijk zijn.

Spam in je data kan leiden tot onbetrouwbare data en afwijkende statistieken. Bezoeken van spamrobots zijn namelijk geen echte bezoekers met menselijk gedrag. Zo zul je wellicht veel meer direct verkeer zien dan er daadwerkelijk is, kan je bounce-rate onnatuurlijk hoog worden of is de verhouding bij Acquisitie helemaal zoek. Daarop vallen geen goede beslissingen of conclusies te baseren. Wil je deze data dus gebruiken, zorg dan dat deze goed gefilterd is voor je aan de slag gaat.

Waar vind je spam in Google Analytics?

Om te controleren of er sprake is van spam in Google Analytics is het raadzaam op in ieder geval 3 plaatsen te kijken:

Acquisitie > Verwijzende sites

Hier vind je sites die online verwijzen naar jouw website. Het is mogelijk dat je hier vreemde sites tussen ziet staan. Bekende sites zijn bijvoorbeeld buttonsforwebsites, lumb.co, traffic2cash.xyz, top1seoservice of floatingsharebuttons. Met de tijd komen er steeds nieuwe domeinen bij.

Gedrag > Gebeurtenissen

Een andere manier om spam te genereren is om zogenoemde events te triggeren in Google Analytics. Een veel voorkomende is event-tracking.com.

Doelgroep > Technologie > Netwerk > Hostnaam

Het kan ook voorkomen dat je veel direct verkeer of onverklaarbare stijgingen en dalingen in verkeer ziet. Om er achter te komen of dat zo is moeten we kijken met welke hostnames bezoekers de website hebben bezocht. Normaal gesproken zie je hier alleen je eigen domeinnaam (of -namen), domeinen van je webbouwer en mogelijkerwijs googleusercontent.com of youtube.com. Het kan ook zijn dat je (not set) ziet of wederom vreemde domeinnamen. Dit duidt ook op spam.

Hoe pak je deze spam aan?

Om deze spam aan te pakken zijn er twee methoden, die beide neerkomen op het aanbrengen van filters. De best werkende manier is om alleen verkeer van bekende hostnames toe te staan. Een tweede manier is om verwijzend verkeer te filteren en bekende spamdomeinen uit te sluiten in je metingen. (Let op: Deze filters zorgen ervoor dat deze spookbezoeken niet in je statistieken terecht komen. Het betekent niet dat ze van je website worden geweerd.)

Het is noodzakelijk dat je vóór het toepassen van deze filters een extra Dataweergave aanmaakt in Google Analytics. In Analytics vind je een gelaagdheid voor het meten van websites. Die gelaagdheid is als volgt opgebouwd:

  • Account (dat is je inlog)
    • Property (dit is een soort hoofdmapje voor de metingen van je website(s))
      • Weergave (dit is een meting van je website)

Het is verstandig om je originele (bestaande) weergave ongemoeid te laten. Dat wil zeggen: zonder filters of andere uitsluitingen. Zo verzamel je ruwe data en kun je deze weergave altijd als historie en back-up gebruiken. Vervolgens maak je een tweede weergave waar je de tips uit dit artikel op toepast. Geeft deze bijvoorbeeld de toevoeging ‘gefilterd’.

Hostname filter

Dit is vaak de meest effectieve methode. Hiermee laat je alleen het meten van bezoekers toe die hostnames gebruiken die bij jou bekend of toegestaan zijn. Zoals gezegd zijn dit meestal je eigen domeinen en domeinen die je bekend zijn, aangevuld met googleusercontent.com of youtube.com.

Een voorbeeld van dit filter:

Voorbeeld: Hostname Filter in Google Analytics om spam uit te filteren

Voorbeeld: Hostname Filter in Google Analytics om spam uit te filteren

Spam domeinen (referrals) uitsluiten

Als de eerste methode niet mogelijk is in jouw situatie, is het ook mogelijk om verwijzende sites die bekend staan als spammers uit te sluiten met een filter. Je kunt ook deze methode aanvullend op de eerste toepassen. Zorg dan wel dat de volgorde van filters in Google Analytics ook is zoals hier aangegeven.

Dat kan handmatig, maar er is ook een gratis online tool voor gemaakt door de bekende Google Analytics expert Simo Ahava. Je vindt deze tool op: https://www.simoahava.com/analytics/spam-filter-insertion-tool/. Wil je handmatig filters toevoegen, kijk dan hier voor meer informatie. Ook bij Gladior hebben we geautomatiseerde manieren om deze filters toe te voegen, vraag ons gerust om hulp hierbij.

Schone data!

Na het toepassen van deze filters kun je periodiek blijven controleren of er vreemde resultaten voorkomen. Spammers vinden vaak nieuwe vormen namelijk. In ieder geval zul je een stuk minder spam zien en weet je dat je data een stuk betrouwbaarder is. Buiten spam uitsluiten, kun je nog meer doen om je data zuiver te maken en te houden. We schreven daar eerder al over

Emerce E-commerce Live! 2018

Gladior was op woensdag 30 mei aanwezig bij Emerce E-commerce Live! Lees hier meer over de interessante sessies die we gevolgd hebben, de trends die we de komende jaren kunnen verwachten én hoe jij je webshop een boost kunt geven.

The Next Web 2018: wat moet je weten?

Gladior | Online Marketing, 2 juni 2018   Meet the future! The Next Web (TNW) is één van de grootste tech congressen op de wereld en vind jaarlijks plaats in Amsterdam. Het is een event waar de toekomst van digital en tech centraal staat. Daar hoort marketing zeker...