Hoe werkt een zoekmachine? Google legt het uit

Martijn Bannink, 3 maart 2013

Een zoekmachine werkt voor een gebruiker heel simpel: Je voert een zoekopdracht in en de zoekmachine toont een hele reeks resultaten binnen een seconde. Wat veel mensen  echter niet weten is dat er achter die eenvoudige witte pagina van Google een aaneenschakeling van algoritmes, programma’s en processen wordt doorlopen om je de juiste resultaten te serveren. In een mooie visuele pagina legt Google uit hoe dit allemaal werkt.

How Search works

Informatie verzamelen

Het begint voor Google allemaal bij het vullen van hun index. Om te weten wat het internet allemaal te bieden heeft, bezoekt Google zelf alle pagina’s en volgt alle beschikbare links automatisch (ook wel crawling genoemd). Websitebeheerders kunnen zelf bepalen of er pagina’s hiervan uitgesloten moeten worden.  Alle gevonden informatie, pagina’s en andere inhoud sorteert Google vervolgens op basis de onderwerpen en beschrijvingen.  Dit alles wordt netjes geregistreerd in hun index.

Het web bestaat uit meer dan 30 triljoen pagina’s dit aantal groeit continu. De index van Google heeft een grootte van meer dan 100 miljoen gigabyte.

Zoekopdracht

Voor Google is het daarmee nog niet gedaan. Wanneer een zoekmachinegebruiker een zoekopdracht invoert, beginnen er andere systemen hun werk te doen. Google gebruikt een aantal handige programma’s en algoritmes, zoals synoniemen, ‘autocomplete’,  spelling,  “Google Instant” en het zogenoemde  “query understanding” om te achterhalen wat je precies bedoelt. Op basis van deze zoekopdracht worden de relevante pagina’s uit de index opgehaald. Vervolgens rangschikt Google de resultaten met behulp van de factoren relevantie, kwaliteit, snelheid, actualiteit, gebruikercontext en meer dan tweehonderd andere factoren. De gevonden informatie kan variëren  van pagina’s, nieuws, blog artikelen en documenten tot video’s, afbeeldingen en meer. Met wat Google “Universal search” noemt zal de zoekmachine deze verschillende soorten content voor je samenvoegen in de zoekresultaten. Dit alles gebeurt in één achtste van een seconde.

Spam

Voor zowel de internetgebruikers als Google zelf is  spam natuurlijk een grote bron van ergernis. Spam, foutieve pagina’s en gehackte sites wil je natuurlijk niet in je zoekresultaten laten voorkomen en daarom gebruikt Google zowel geautomatiseerde processen als handmatige controles om zoveel mogelijk verkeerde, onveilige en niet-relevante pagina’s uit de index te verwijderen.

De gehele uitleg

Google legt op een overzichtelijke wijze precies uit hoe hun zoekmachine werkt aan de hand van voorbeelden en extra beeldmateriaal. Bekijk hier hoe de zoekmachine werkt.

Emerce E-commerce Live! 2018

Gladior was op woensdag 30 mei aanwezig bij Emerce E-commerce Live! Lees hier meer over de interessante sessies die we gevolgd hebben, de trends die we de komende jaren kunnen verwachten én hoe jij je webshop een boost kunt geven.

The Next Web 2018: wat moet je weten?

Gladior | Online Marketing, 2 juni 2018   Meet the future! The Next Web (TNW) is één van de grootste tech congressen op de wereld en vind jaarlijks plaats in Amsterdam. Het is een event waar de toekomst van digital en tech centraal staat. Daar hoort marketing zeker...

6 mythes rondom chatbots anno 2018

Mycke en Larissa waren aanwezig op de allereerste editie van de chatbot conference. Een zeer interessante dag vol ervaren sprekers en innovatieve cases. Eén ding is duidelijk, chatbots are here to stay. Lees meer over de mythes en innovaties rondom chatbots!