Extending Domain-Specific Resources to Enable Semantic Access to Cultural Heritage Data

Contents:

  • 1. Introduction
  • 2. Related Work
  • 2.1. Semantic Web Technologies in the Cultural Heritage Domain
  • 2.2. Information Extraction
  • 3. A Case Study: Tate Online
  • 3.1. Users’ Requirements for Semantic Search
  • 3.2. Prototype Development
  • 4. Semantic Annotation
  • 4.1. Information Sources
  • 4.2. Recognising Imperfections in the Information
  • 4.3. Extending Pre-Existing Sources with Information Extraction
  • 5. Evaluation
  • 5.1. Evaluating Semantic Annotation
  • 5.2. Semantic Annotation of the Tate Collection
  • 6. Conclusions and Future Work
  • References.

De introductie legt uit met welke factoren een rol spelen bij het opbouwen van een semantisch model oftewel ontologie. In dit onderzoek is een beperkt semantisch model gebouwd voor de kunstenaars uit Tate Online, de gezamenlijke online presentatie voor 4 fysieke musea. De Getty Union List of Artist Names (ULAN) bleek 45,1% van de 7 semantische kenmerken van de kunstenaars (‘named entities’) uit de Tate collectie te kunnen leveren. Het onderzoek toont aan dat de dekking van ULAN is te vergroten tot 63,3% door domeinspecifiek te crawlen en automatisch informatie te onttrekken van semi-gestructureerde informatiebronnen (webpagina’s en Wikipedia artikelen). Semantische technologie kan dus de toegankelijkheid van culturele erfgoedcollecties vergroten. Met de toename van openbare data in een interoperabele vorm, neemt ook de mogelijkheid toe om cultureel erfgoedobjecten te koppelen en te delen met andere beschikbare informatiebronnen. Deze semantische annotatie maakt de digitaal beschikbare content op meer manieren en explicieter inhoudelijk toegankelijk voor de gebruiker dan de beschikbare, gestructureerde collectiebeschrijvingen. Dit artikel is verschenen in: Journal of Digital Information, Vol 10, No 6.

De heldere toelichting op dit onderzoek maakt duidelijk dat de toegankelijkheid van cultureel erfgoed is te vergroten door de beschikbare, gestructureerde informatiebronnen (controlled vocabularies) voor cultureel erfgoed aan te vullen met informatie uit semi-gestructureerde online informatiebronnen. Ook wordt duidelijk welke voetangels en klemmen hierbij te verwachten zijn.