Niels Rozeboom (2006)
Een gestandaardiseerde beschrijving van digitale afbeeldingen
Master's thesis, Rijksuniversiteit Groningen.
[ Paper (PDF, 627 kb) ]

Inleiding

1.1 Belang metadata digitale afbeeldingen

Een afbeelding zegt meestal meer dan duizend woorden kan uitdrukken. Dit kan dan wel zo zijn, maar het is geen reden een afbeelding daarom helemaal niet te ontsluiten. Binnen de webcontext wordt nog geen gebruik gemaakt van een vaste standaard om afbeeldingen te beschrijven. Een goede metadata-beschrijving kan nodig zijn voor verschillende redenen. Een belangrijke reden is dat digitale afbeelding kunnen worden teruggevonden.

Met de text-based image retrieval is het mogelijk op sleutelwoorden te zoeken. Deze sleutelwoorden moeten dan ook gevonden kunnen worden. Nog vaak maken zoeksystemen gebruik van gegevens op een website waar de afbeelding staat afgebeeld. Deze systemen maken gebruik van informatie in de HTML code. Doordat men niet altijd kan stellen dat deze informatie relevant is, levert dit veel ruis op bij het tonen van de resultaten. Wanneer aan elke afbeelding relevante descriptieve metadata zou worden gekoppeld, zou men hier directer en preciezer op kunnen zoeken.

Met content-based image retrieval is het mogelijk op de primitieve eigenschappen van een afbeelding te zoeken. Er bestaan vele zoekmachines die zich hier op richten. Doordat afbeeldingen vaak in grootte, kleur en resolutie van elkaar verschillen, kunnen deze soms moeilijk met elkaar worden vergeleken. Technische gegevens kunnen bijdragen om deze informatie weer te geven, zodat systemen hierop kunnen inspelen.

Nog een reden is dat men belang kan hebben bij metadata voor het beheer van een collectie van afbeeldingen. Belangrijke gegevens kunnen bijvoorbeeld zijn: copyright, artiest of datum van creatie.

Ook kunnen zowel technische als descriptieve metadata worden gebruikt voor de autorisatie van afbeeldingen. Met behulp van descriptieve metadata kan bijvoorbeeld worden aangegeven wie de afbeelding heeft gecreëerd. Technische metadata kan een bijdrage zijn om te achterhalen of een afbeelding eventueel is bewerkt. Dit kan vooral van belang omdat digitale afbeeldingen eenvoudig kunnen worden gekopieerd en gebruikt voor andere doeleinden.

Ten slotte kan metadata ook gegevens vastleggen die gebruikt kunnen worden om de kwaliteit van een afbeelding te interpreteren. Als bijvoorbeeld een digitale foto is gemaakt van een schilderij, kan men met behulp van technische gegevens veel beter een reproductie maken van het origineel.

Uit het bovenstaande is af te leiden dat een metadataraamwerk, waarin zowel technische als descriptieve gegevens in kunnen worden opgenomen, wenselijk is. In algemene zin is dus bekend welke informatie in een afbeelding zou moeten worden opgenomen. In detail is dat niet bekend. Daarom zal de gewenste metadata een zo breed mogelijk domein moeten beslaan. Dit in z'n geheel vertaald zich in de volgende probleemstelling waar dit onderzoek op richt:

Hoe kan voor een digitale afbeelding een gestandaardiseerde metadata-raamwerk gecreëerd worden waarmee een groot domein aan descriptieve en technische metadata kan worden opgenomen?

1.2 Aanpak

Om een raamwerk te creëren waarmee metadata over een afbeelding kan worden weergegeven moeten verschillende stappen worden genomen. Ten eerste moet een methode gevonden worden om technische metadata uit een afbeelding te krijgen. Hiervoor wordt een of meerdere proefafbeelding gebruikt. Ten tweede moet een metadata-standaard worden gevonden waarmee op een breed descriptief niveau gegevens kunnen worden opgenomen. Hiervoor wordt een metadatastandaard gebruikt met proefgegevens. De gegevens moeten kunnen worden samengevoegd en binnen een nieuwe metadata-raamwerk worden weergegeven. Binnen dat raamwerk moet duidelijk zijn hoe deze gegevens kunnen worden toegepast.