Contents: 1. Introduction 2. Converting Structured Data to RDF 3. Adding Text Relations – txt2rdf 4. Query Experiments 5. Conclusions References This paper explains how to augment structured data with “facts” automatically extracted from free text. This is done via a pipeline, txt2rdf, which takes in plain text at one end and pumps out RDF triples at the other. These …
Towards Affordable Disclosure of Spoken Heritage Archives
Contents: 1. Introduction 2. From spoken-word archive to multimedia information portal 3. Automatic annotation using automatic speech recognition 4. The Buchenwald user interface 5. Discussion and conclusion References This paper presents and discusses ongoing work aiming at affordable disclosure of real-world spoken heritage archives in general, and in particular of a collection of recorded video interviews with Dutch survivors of …
Guidelines on the Production and Preservation of Digital Audio Objects (Web version)
Contents: Publication Information Introduction to the Second Edition Introduction to the First Edition 1. Background 2. Key Digital Principles 3. Metadata 4. Unique and Persistent Identifiers 5. Signal Extraction from Original Carriers 6. Preservation Target Formats and Systems 7. Small Scale Approaches to Digital Storage Systems 8. Optical Discs 9. Partnerships, Project Planning and Resources References. These extensive guidelines, subtitled …
Metadata and Semantics in Digital Object Collections: A Case-Study on CIDOC-CRM and Dublin Core and a Prototype Implementation
Contents: 1. Introduction 2. Digital Repository Systems for Cultural Heritage 3. From Metadata to Ontologies 4. Towards a Semantic Enrichment of CIDOC-CRM 5. Bringing Dublin Core to the Semantic Web 6. A Prototype Implementation 7. Conclusions De auteurs bespreken twee metadata standaarden die in de cultureel erfgoedsector veel gebruikt worden voor de ontsluiting van digitale collecties: CIDOC-CRM en Dublin Core. …
Een gelaagd semantisch metadatamodel voor langetermijnarchivering
Contents: 1. Inleiding 2. Problemen 3. Metadataniveaus voor langetermijnarchivering 4. Gelaagd semantisch metadataschema In kader van het project BOM-Vlaanderen is een gelaagd semantisch metadataschema uitgewerkt dat alle soorten metadata, noodzakelijk voor de preservering van digitale informatie, omvat. Dit artikel licht het schema kort toe. De bovenste laag is een OWL-representatie van Dublin Core waarin de beschrijvende metadata worden behandeld en …
Automatic Audiovisual Signal Analysis
Contents: Research Motivation Automatic Newscast Transcription System (ANTS) The Segmentation in News Hyper Media News (HMN). Het onderzoekscentrum van de RAI licht kort de resultaten toe van het onderzoek naar automatische analyse van tekst en audiovisueel materiaal waarmee zij hun platform voor het automatisch indexeren van nieuwsuitzendingen willen verbeteren. De transcripts uit de automatische spraakherkenning zijn goed te gebruiken om …