Tools maken voor Google met XML output

March 2nd, 2006 - Posted by Ulco in Tools

N.a.v. de Pagerank checker waren er wel wat reactie’s van hoe je dat soort dingen maakt. Nu is die Pagerank versie niet zo ingewikkeld, tenslotte heb ik daarvan de broncode gewoon op m’n site staan.

Wat het pagerank tooltje doet is een URL vanaf Google aanroepen waar Google de pagerank van een een site bewaard (Klik).

Het belangrijkste uit het Pagerank script is de checksum, daarmee kan je namelijk nog veel meer leuke dingen. Met de checksum kun je namelijk data vanaf Google in XML files opvragen. Vanaf die XML files is het weer een stuk makkelijker data verwerken dan dat je dit direct vanaf de (standaard) resultaten pagina moet doen.

Een voorbeeldje is het XML bestand voor www.ulco.nl. Dat lijkt een hoop weinig zeggende onzin maar daar is gelukkig iets voor: De Google XML Reference. Daarin staat wat alles betekend, maakt het een stuk bruikbaarder… Zo is “RK” bijvoorbeeld:

Provides a general rating of the relevance of the search result.

Niet hetzelfde dus als je Pagerank maar je zult wel zien dat het heel vaak overéén komt. Wat bij mijn site opvalt is lang. Zoals je ziet staat die op Engels, komt waarschijnlijk doordat ulco.nl 3 jaar in het Engels is geweest voordat ik in het Nederlands begon. De interne pagina’s worden wel als Nederlands herkend.

Nog leuker wordt het als je erachter komt dat je die checksum voor alle zoekopdrachten kunt gebruiken. Bijvoorbeeld voor de zoekopdracht ulco. Je krijgt dus de output van een searchquery in XML wat het een stuk makkelijker te gebruiken maakt. Vroeger kon dit ook gewoon door output=xml achter de URL te plakken maar dat werkt (voor zover ik weet) niet meer.

Meer ideeën kun je halen uit het Google search result Protocol wat ooit eens op “Usenet” heeft gestaan. Bijvoorbeeld &num=20 om per keer 20 resultaten binnen te halen (meer werkt niet) en &start=20 om andere pagina’s op te vragen.

Ik hoor je zeggen: “Leuk, maar wat moet ik ermee?” Punt één, als je dat niet weet niets ;)
Een idee is bijvoorbeeld om het combineren met je Google sitemap, maak een overlay met “Crawldate” en je hebt inzicht hoe Google je domein spidert. Je kunt zien wat eventuele problemen zijn (zoals bij mij de verkeerde taal). Snel bekijken welke pagina’s welke ranking hebben of kijken voor welke zoektermen je welke “relevantie ranking” hebt. Ik noem maar wat, de rest mag je zelf bedenken ;)

Geen reacties tot nu toe