Waarom Google het Orion-algoritme wilde

April 11th, 2006 - Posted by Ulco in Algoritmen

Gisteren verscheen op diverse andere websites het bericht dat Google een zoekmachine algoritme genaamd “Orion” zou hebben gekocht, onder andere Roodlicht en DutchCowboys berichtte hierover.

Wat me opviel aan de berichtgeving van bovenstaande websites is dat eigenlijk niet duidelijk wordt wat het algoritme inhoud en waarom Google, Yahoo en MSN alledrie interesse hadden om het te kopen.

Een logische verklaring is dat de ontwikkelaar van het algoritme, Ori Allon, een contract heeft gekregen bij Google onder voorwaarde dat Google gebruik mag maken van het algoritme in haar zoekmachine. Een andere optie is natuurlijk dat Google het patent in zijn geheel heeft overgenomen. In ieder geval heeft Google toegegeven dat Ori Allon tegenwoordig voor Google werkt.

Het algoritme
Wat het algoritme bijzonder maakt is dat het zoekopdrachten minder afhankelijk maakt van de input. Het is vergelijkbaar met “stemming” (meervoudsvormen, spelfouten e.d.) maar dan iets extremer. Met het algoritme wordt, wanneer bijvoorbeeld op “auto 1992” gezocht, ook de resultaten voor “volkswagen 1992” weergegeven.

Welke extra keywords in de resultaten worden opgenomen is afhankelijk van een aantal factoren. Op basis van links en een contentanalyse wordt berekend in hoeverre woorden elkaars “synoniemen” zijn. Vooral voor de onderkant van de zoektermen (de minder populaire zoektermen) is dit interessant. Het voegt iets toe wat in de ogen van een gebruiker heel natuurlijk lijkt maar “wiskundig” heel moeilijk in een algoritme is te verpakken.

De zoekmachine Orion
De bedenker van het algoritme claimde ook in samenwerking met de Universiteit van New South Wales een zoekmachine te hebben gemaakt die gebruik maakte van dit algoritme. Deze zoekmachine had nog een ander “kunstje”, namelijk dat het in plaats van pagina’s als resultaat op een zoekopdracht, direct antwoorden van een pagina afhaalde.

In de deal met Google zal dit laatste minder interessant zijn. Het zou namelijk betekenen dat webpagina’s an sich deels overbodig zouden worden en dat zou door publicisten natuurlijk nooit worden geaccepteerd.

Een nieuwe Google?
Nou nee, een zoekmachine werkt met vele algoritmen waarvan dit hoogstens (misschien) een klein deel uit zal gaan maken. Ilse bijvoorbeeld gebruikte in 2003 al 2 ranking features en nog 22 andere algoritmen. MSN gebruikt er momenteel honderden en Google doet daar ongetwijfeld niet voor onder. Mocht je dus de indruk gekregen hebben dat Google hierdoor op termijn een wereld van verschil zou worden, vergeet het dan maar…

Geen reacties tot nu toe