Hoe werkt een zoekmachine? Google legt het uit

Martijn Bannink, 3 maart 2013

Een zoekmachine werkt voor een gebruiker heel simpel: Je voert een zoekopdracht in en de zoekmachine toont een hele reeks resultaten binnen een seconde. Wat veel mensen  echter niet weten is dat er achter die eenvoudige witte pagina van Google een aaneenschakeling van algoritmes, programma’s en processen wordt doorlopen om je de juiste resultaten te serveren. In een mooie visuele pagina legt Google uit hoe dit allemaal werkt.

How Search works

Informatie verzamelen

Het begint voor Google allemaal bij het vullen van hun index. Om te weten wat het internet allemaal te bieden heeft, bezoekt Google zelf alle pagina’s en volgt alle beschikbare links automatisch (ook wel crawling genoemd). Websitebeheerders kunnen zelf bepalen of er pagina’s hiervan uitgesloten moeten worden.  Alle gevonden informatie, pagina’s en andere inhoud sorteert Google vervolgens op basis de onderwerpen en beschrijvingen.  Dit alles wordt netjes geregistreerd in hun index.

Het web bestaat uit meer dan 30 triljoen pagina’s dit aantal groeit continu. De index van Google heeft een grootte van meer dan 100 miljoen gigabyte.

Zoekopdracht

Voor Google is het daarmee nog niet gedaan. Wanneer een zoekmachinegebruiker een zoekopdracht invoert, beginnen er andere systemen hun werk te doen. Google gebruikt een aantal handige programma’s en algoritmes, zoals synoniemen, ‘autocomplete’,  spelling,  “Google Instant” en het zogenoemde  “query understanding” om te achterhalen wat je precies bedoelt. Op basis van deze zoekopdracht worden de relevante pagina’s uit de index opgehaald. Vervolgens rangschikt Google de resultaten met behulp van de factoren relevantie, kwaliteit, snelheid, actualiteit, gebruikercontext en meer dan tweehonderd andere factoren. De gevonden informatie kan variëren  van pagina’s, nieuws, blog artikelen en documenten tot video’s, afbeeldingen en meer. Met wat Google “Universal search” noemt zal de zoekmachine deze verschillende soorten content voor je samenvoegen in de zoekresultaten. Dit alles gebeurt in één achtste van een seconde.

Spam

Voor zowel de internetgebruikers als Google zelf is  spam natuurlijk een grote bron van ergernis. Spam, foutieve pagina’s en gehackte sites wil je natuurlijk niet in je zoekresultaten laten voorkomen en daarom gebruikt Google zowel geautomatiseerde processen als handmatige controles om zoveel mogelijk verkeerde, onveilige en niet-relevante pagina’s uit de index te verwijderen.

De gehele uitleg

Google legt op een overzichtelijke wijze precies uit hoe hun zoekmachine werkt aan de hand van voorbeelden en extra beeldmateriaal. Bekijk hier hoe de zoekmachine werkt.

Google Partners Accelerate 2017

Op 7 september werden tijdens een exclusief evenement van Google in Dublin de Premier Partner awards uitgereikt. Gladior was hiervoor genomineerd in de categorie Growing Businesses Online.

Share This