DOC4: Zusammenführung heterogener interdisziplinärer Forschungsdaten am Beispiel des Bergbaus in Kitzbühel – Die Ontologie CIDOC CRM als Konzept zur Integration und Harmonisierung archäologischer, historischer und archäobotanischer Daten.

Doktorandin

Mag.a Anja Masur

 

Betreuer

Univ.-Prof. Dr. Klaus Hanke
Univ.-Prof. Dr. Michael Doneus 

  

Kontakt
Universität Innsbruck
Arbeitsbereich Vermessung und Geoinformation
Technikerstr. 13, A-6020 Innsbruck
Tel 0043 (0)512 507 6752

DOC 4 bei der Arbeit

  Mag.a Anja Masur und Univ.-Prof. Dr. Klaus Hanke
   

Übersicht

Die Einführung digitaler Dokumentationsmethoden im Bereich der Archäologie und das massenhafte Speichern von Daten haben zu einer ständig anwachsenden Diskrepanz hinsichtlich der Interoperabilität archivierter Daten geführt. Diese sowohl strukturelle als auch semantische Lücke gibt es sowohl in der Archäologie als auch innerhalb der interdisziplinären Zusammenarbeit unterschiedlicher Arbeitsbereiche. Um dem Problem heterogener  Datenstrukturen Herr zu werden und die Möglichkeit der semantischen Interpretation zu gewährleisten, wird das Einsetzen von Ontologien immer wichtiger. Diese sind ein maßgeblicher Meilenstein auf dem Weg zum "Semantic Web".

Ein Beispiel einer solchen Ontologie für den Bereich des kulturellen Erbes ist der Iso-Standard CIDOC CRM. Das CRM ermöglicht eine "Informationsintegration und Zugriffsvermittlung(Mediation) von Daten zwischen heterogenen Informationsquellen."[1] Es bildet zusätzlich einen Rahmen, der Klassen und semantische Definitionen für eine harmonisierte Datenumgebung bereit stellt. Konzepte wie das CIDOC CRM können sehr nützlich sein, um die bereits oben erwähnten Interoperabilitätsprobleme zu lösen. Leider gestaltet sich in der Praxis eine Implementierung in bereits bestehende IT-Infrastrukturen schwierig.

Ziel dieser wissenschaftlichen Arbeit ist es, bestehende Konzepte für die Integrierung und Harmonisierung heterogener Daten verschiedener Disziplinen zu analysieren und neue zu entwickeln. Die Beschäftigung mit CIDOC CRM innerhalb dieser Doktorarbeit soll in eine Art Guideline münden, die den Schritt der Implementierung, im Speziellen das sogenannte Mapping, erleichtert. Dafür sollen Daten aus verschiedenen Quellen harmonisiert und in das CRM integriert werden. Die Daten stammen aus drei verschiedenen Disziplinen: Archäologie (DOC1), Geschichte (DOC2) und Archäobotanik (DOC3). Die Domain-Ontologie CIDOC  CRM soll dann anhand eines Use Case-Szenarios, das all die Bereiche beinhaltet, getestet werden. Das Experimentieren ist notwendig, um Informationen über die Einsetzbarkeit und  deren Möglichkeiten zu gewinnen. Weiterhin bildet ein Vergleich zwischen dem CIDOC CRM und dessen Erweiterung CRM-EH[2] einen zusätzlichen Schwerpunkt dieser Arbeit. Komplettiert wird dieser durch die Analyse einiger Mappings, die schon durch Institutionen aus dem Bereich des kulturellen Erbes und der Archäologie durchgeführt wurden. Daraus resultierende Probleme sollen diskutiert werden.

Neben den allgemeinen Daten der drei Fachbereiche sollen auch LIDAR-Daten in das CRM integriert werden. Um diese zu verwalten und zu analysieren soll ein GIS benutzt werden. Dafür müssen die Anforderungen sowohl eines GIS an die durch die Ontologie strukturierten Daten als auch die der Ontologie an das GIS erhoben und analysiert werden. Die dafür verwendeten räumlichen Daten dieses Projektes stammen aus der Region Kitzbühel. Alle Ergebnisse werden in die HiMAT-Datenbank, deren Metadaten bereits auf CIDOC-Klassen beruhen, einfließen und zu einer Verbesserung dieser beitragen.

Neben der Harmonisierung der Daten wird ein weiterer Schritt das Aufzeigen der Vorzüge und des Mehrwerts einer Ontologie anhand des entwickelten Use Case (-Szenarios) sein.

Um diese Arbeit zu bewerkstelligen wird eine intensive Zusammenarbeit zwischen allen Mitgliedern des DOC-teams notwendig sein. Die Daten werden durch die einzelnen DOCs gestellt werden und in das Datenmodell integriert werden. Die harmonisierten Daten werden den Teammitgliedern im Gegenzug wieder zugänglich gemacht werden. Dafür wird ein Austausch der gegenseitigen Anforderungen notwendig sein. Das harmonisierte Datenmodell wird als Schnittstelle aller relevanten Daten dieses Projektes dienen. Nur so werden zufriedenstellende Ergebnisse für alle Teilnehmer zu erwarten sein.

 

Abkürzungen

ISO: International Organization for Standardization
CIDOC: International Committee for Documentation
CRM: Conceptual Reference Model
LIDAR: Light Detection and Ranging
GIS: Geoinformationssystem



 

zurück zur DOC-team Übersicht

 

small miner Schwazer Bergbuch