Local search: Query Dominant Locations

April 26th, 2006 - Posted by Ulco in Literatuur
Ik heb een nieuw paper online gezet van MSN Labs over Query Dominant Location detection. Erg goed en interessant spul al zeg ik het zelf. Een korte samenvatting:

Abstract
Wat in het paper behandeld wordt is mogelijkheid om uit een zoekopdracht de dominante factor te extraheren. De focus ligt voornamelijk op lokale factoren, detectie van lokale zoekopdrachten en/of de mogelijkheid om aan een “gewone” zoekopdracht een lokale factor te koppelen.

De introductie
Een redelijk aandeel van de zoekopdrachten die worden verwerkt door zoekmachines hebben een lokale associatie. Deze kan direct in de zoekopdracht verwerkt zitten (vacatures Amsterdam) of indirect aan “iets” lokaals gekoppeld worden (vertrektijden trein). Problemen voor zoekmachines zijn onder andere te vinden in lokale merk- of productnamen (Limburgse vlaai, Amsterdammertjes). Deze zoekopdrachten hebben taalkundig wel een lokale oorsprong maar hierbij is het niet nodig dat door de zoekmachine ook een lokale associatie wordt gebruikt.

Mogelijkheden m.b.t. QDL
In het paper worden een aantal mogelijkheden besproken, ten eerste het onderzoeken van de zoekresultaten zelf. Er wordt bijvoorbeeld gekeken naar lokale factoren aanwezig op de top 100 resultaten van een zoekopdracht. Komt een bepaald percentage van de resultaten de lokale factor overéén dan zal ook aan de zoekopdracht een lokale factor toegekend worden.

Als tweede mogelijkheid wordt gekeken naar NLP (Natural Language Processing) en NER (Name Entity Recognition). Hierbij wordt gekeken naar de positie en context van woorden en worden op die manier de dominante factoren ge-extraheerd. Voor zoekmachines wordt dit minder geschikt bevonden doordat een query vrijwel geen te analyseren context heeft en het voor resultatenpagina’s te tijdsintensief is.

De derde mogelijkheid die wordt besproken is om (IP based) de geografische locatie van de zoeker te bepalen en aan de hand daarvan lokale zoekresultaten te presenteren. Denk hierbij bijvoorbeeld aan een zoekopdracht als “McDonalds”, voor een lokale zoekmachine is het logisch dat bij zo’n zoekopdracht wordt gezocht naar een Mac in de buurt. In dit geval zijn IP based results een goede mogelijkheid. Voorwaarde is natuurlijk wel dat de zoekmachine kan concluderen dat het om een lokale zoekopdracht gaat.

Oplossingen
Het paper presenteert de volgende flowchart voor het bepalen van QDL’s:

QDL Flowchart

In het kort:

  • Controle lokale input in query
  • Controle query log op consistentie en lokatie
  • Controle top resultaten voor query

Conclusie
Zoals meestal is Nederland te klein om hier op grote schaal de toepassingen mee tegemoet te zien. Op minimale schaal zal het in de toekomst wel geimplementeerd gaan worden maar ik denk dat dit voornamelijk ook in lokale varianten van zoekmachines zal gebeuren.

Op het wat competetievere niveau, bijvoorbeeld de VS, China e.d. is dit natuurlijk wel leuk om te weten én, moeilijk te beïnvloeden van buiten de zoekmachine dus redelijk feilloos.

Geen reacties tot nu toe