Metadata zijn gegevens die de eigenschappen van gegevens en/of een gegevensdragen beschrijven. Kort gezegd is het dus data over data.
Voorbeelden van metadata die door zoekmachines gebruikt worden bij het indexeren van een document zijn het domein waarop waarop het document geplaatst is, de titel en eventuele description, de datum waarop een document voor het eerst gevonden is, de publicatiedatum, de taal waarin het geschreven is en nog veel meer.
De meeste mensen die bekend zijn met het maken van websites kennen metadata waarschijnlijk alleen in de vorm van meta-tags. Toch is dit slechts het "topje van de ijsberg", sterker nog, meta-tags als description & keywords zijn voor de uiteindelijke zoekmachine rankings zo goed als waardeloos.
Metadata wordt vaker gebruikt dan je zou verwachten. In diverse hedendaagse (internet) toepassingen wordt gebruik gemaakt van metadata. Denk bijvoorbeeld aan fotogallerijen, deze maken veelal gebruik van EXIF headers om afbeeldingen eenvoudig te kunnen schalen.
Ook in wat "traditionelere" toepassingen wordt volop gebruik gemaakt van metadata. Denk bijvoorbeeld aan de bibliotheek waar boeken geïndexeerd zijn op schrijver en/of titel.
De moderne zoekmachines doorzoeken documenten op basis van full-text, dit maakt eenvoudige metadata als auteur en onderwerp een stuk minder bruikbaar. Tenslotte hoeft een in de tekst vermeldde persoon niet per definitie de auteur te zijn en kan één document verschillende onderwerpen omvatten.
Aan de hand van dit document zal ik later een uitgebreide beschouwing proberen te geven van de metadata die door Google e.a. gebruikt wordt om een document, naast de daadwerkelijke inhoud, te beoordelen.