Zukunftsfitte Daten schaffen

Daten im Internet sind vergänglich, oft funktionieren Links schon nach wenigen Jahren nicht mehr. Innsbrucker Informatiker arbeiten nun daran, diesem Problem vor allem für „Linked Data“ im Rahmen eines von der Europäischen Kommission geförderten Projekts beizukommen.
ipoint_prelida_de.jpg
Bild: Das Potenzial von Linked Data ist enorm. (Foto: flickr.com/Steve Jurvetson)

Wer schon einmal versucht hat, einem mehrere Jahre alten Link auf eine Website zu folgen, kennt das bestimmt: Seiten sind häufig schon wenige Jahre später nicht mehr oder nur unter einer völlig anderen URL zugänglich, die Daten im Internet sehr vergänglich. „Linked Data“ verschärft dieses Problem zusätzlich, zumindest theoretisch: Daten, nicht bloß Websites, werden so über das Internet über eigene URIs (Uniform Resource Identifiers) abrufbar. Das ermöglicht intelligente Verknüpfung bislang nicht verlinkter Daten und so – idealerweise – die Auswertung auch komplexer Zusammenhänge. Den Zugang zu Linked Data zu bewahren ist das Ziel des von der EU-Kommission geförderten Projekts PRELIDA, an dem Innsbrucker Informatiker vom Forschungsinstitut STI beteiligt sind.

Linked Data erhalten

„Zuerst geht es uns darum, die bestehenden Communities von Linked-Data- und Archivierungs-Experten zusammenzubringen und zu vernetzen“, erklärt Projektmitarbeiter Serge Tymaniuk. Das Potenzial von Linked Data ist enorm: Weltweit geben immer mehr öffentliche Stellen ihre Daten frei, bekannte Beispiele sind Open-Data-Portale in den USA und Großbritannien. Daneben gibt es mehrere Initiativen von Unternehmen und Forschungseinrichtungen, bereits online vorhandene Daten verknüpf- und analysierbar zu machen. „Das bekannteste Beispiel ist hier das DBPedia-Projekt, das es darauf aufbauenden Anwendungen erlaubt, Daten, die in der Wikipedia nur in Form von Tabellen zugänglich sind, auf neue Arten zu verknüpfen und auch zu visualisieren“, sagt Serge Tymaniuk.

Die Vernetzung der Linked-Data- und Archivierungs-Communities ist das Hauptziel von PRELIDA (PREserving LInked DAta). Zu diesem Zweck hat im Juni bereits ein erster gemeinsamer Workshop in Tirrenia bei Pisa (Italien) stattgefunden, weitere Workshops folgen und in der ersten Septemberwoche fand das erste von zwei geplanten Summer-School-Progammen statt. „So vielversprechend Linked-Data-Anwendungen sind, so wichtig es auch, die einzelnen Datenbausteine zukunftsfit zu machen und sie abrufbar zu halten“, erläutert der Informatiker. Dabei sind einige Herausforderungen zu überwinden: Linked Data unterscheidet sich von klassischen Daten in mehreren Bereichen, um dynamische Verknüpfungen zu erlauben.

Multidisziplinäre Gemeinschaft

Eine multidisziplinäre Forscher-Gemeinschaft soll diese Herausforderungen gemeinsam angehen. PRELIDA richtet sich dabei nicht nur an wissenschaftliche Einrichtungen, sondern auch an Partner aus der Wirtschaft und Anwender von Linked Data aus den unterschiedlichsten Bereichen, etwa an das Gesundheitswesen, an Banken, Produktionsbetriebe und den Handel. PRELIDA wird mit insgesamt rund einer Million Euro von der Europäischen Kommission gefördert. Die Projektleitung übernimmt das Institute of Information Science and Technologies of the National Research Council (CNR-ISTI) in Pisa (Italien), Mitglieder im Führungskonsortium sind außerdem die European Alliance for Permanent Access (APA), eine niederländische Non-Profit-Organisation mit Schwerpunkt auf Datenarchivierung, die School of Computing and Engineering der Universität Huddersfield (Großbritannien) und das Forschungsinstitut STI der Universität Innsbruck. Assoziierte Partner sind das Europeana-Institut, das an der Digitalisierung und Konservierung von Europäischen Kulturgut arbeitet, und STI International, das das Projekt unter anderem bei der Organisation von Veranstaltungen unterstützt. Alle Partner bringen ihr spezifisches Know-How in die Projektarbeit ein, das Forschungsinstitut STI etwa im Rahmen seiner Forschung zum Semantic Web. PRELIDA ist auf zwei Jahre angesetzt und endet mit Dezember 2014.