Es erfolgte eine umfassende Digitalisierung von Grundbuchblättern.
Es erfolgte eine umfassende Digitalisierung von Grundbuchblättern.

Digi­­tali­­sierung er­­mög­­licht Erfor­­schung der Familien­ge­schichte

Seit einigen Tagen stehen mehr als 98.000 Akten zur Tiroler Geschichte der Öffentlichkeit online zur Verfügung. Durch die umfassende Digitalisierung von Personalunterlagen aus der Armee der Habsburgermonarchie, können Interessierte mithilfe einer Suchplattform interessante Einblicke in die Ahnenforschung gewinnen.

In diesen Akten, den sogenannten Grundbuchblättern, verbergen sich die Schicksale von rund 90.000 jungen Tirolern, Südtirolern und Trentinern, die im späten 19. Jahrhundert ihren Wehrdienst in der k. u. k. Armee geleistet haben. Dieser besondere Bestand ist nicht nur für die Wissenschaft interessant, sondern auch für viele Familienhistoriker. Aufgrund des großen Interesses wurden diese Daten schon bisher stark nachgefragt. Möglich gemacht wurde das Projekt des Tiroler Landesarchivs durch die Zusammenarbeit mit der Universität Innsbruck sowie der Europäischen Genossenschaft READ-COOP SCE, die die Plattform Transkribus betreiben. In Transkribus können handschriftliche Dokumente mittels künstlicher Intelligenz automatisiert erkannt werden.

Großangelegte Digitalisierung

Das Projekt wurde in mehreren Etappen durchgeführt. Im Jänner und Februar 2020 wurden die Grundbuchblätter aus Südtirol und Trentino und im Februar und März 2021 die Grundbuchblätter aus Nordtirol gescannt. Insgesamt handelte es sich um etwas mehr als 98.000 Scans, wobei jeder Scan jeweils die erste Seite eines Aktes zu einer Person darstellt. Jeder Akt umfasst meist mehrere Blätter, die mittels Klammern oder Klebeband zusammengefasst wurden. Aufgrund eines ansonsten vielfach erhöhten Arbeitsaufwandes wurde jeweils nur die erste Seite des Aktes digitalisiert. Im Rahmen eines On-Demand Verfahrens können die restlichen Seiten gegen eine kleine Gebühr bestellt werden. Für die Digitalisierung wurden mehrere Scanzelte eingesetzt, durchschnittlich waren zwischen fünf und sieben Studierende im Einsatz. Mittels der DocScan App wurden die Seiten nicht nur gescannt, sondern auch zugeschnitten und von den Bearbeiter*innen sofort in die Transkribus Plattform hochgeladen. Die Benennung der Dateien erfolgte entsprechend der Beschriftung der Originalkartons. Der komplette Bestand konnte so in weniger als 20 Arbeitstagen komplett digitalisiert werden.

In der Datenbank können Interessierte nach Grundbuchblättern suchen.

Automatische Erkennung

In einem weiteren Schritt wurde ein Spezialmodell für die Erkennung des Layouts trainiert. Hier kam das Tool P2PaLa zum Einsatz. Da es sich bei den Grundbuchblättern um komplexe Formulare handelt, die sich im Laufe der Jahre veränderten und zum Teil sehr uneinheitlich sind, beschränkt sich die Handschriftenerkennung auf den Familien- und Vornamen, den Geburtsort und das Geburtsjahr. Diese drei Felder, die in allen Formulartypen vorhanden sind, wurden mit mehreren 100 Beispielen trainiert.

 

Durch die Digitalisierung der Grundbuchblätter werden interessante Daten über Familiengeschichten zugänglich gemacht. 

Parallel zur Erstellung des Layout-Modells wurde auch ein spezielles Handschriftenmodell trainiert, um die Familien- und Vornamen zu erkennen. Hierfür wurden von jedem Dokument des Südtiroler Bestandes die 10 ersten Blätter manuell transkribiert sowie einige Dokumente vollständig. Weiters wurden noch aus anderen Projekten, wie dem Franziszeischen Kataster ebenfalls Namensdaten hinzugefügt und das allgemeine Modell Transkribus German Kurrent M2 als Basismodell verwendet.

Die Erkennungsqualität von rund 89% ist angesichts der doch recht herausfordernden Formularfelder, der vielen unterschiedlichen Schrifttypen und Schreiber, sowie der relativ geringen Zahl an Trainingsdaten, zufriedenstellend – soll aber in den nächsten Wochen noch einmal wesentlich verbessert werden. Die automatisierte Verarbeitung wurde direkt in der Plattform durchgeführt.

Der letzte Teil bestand dann in der Verfügbarmachung mittels read&search. Ein Vorgang, der innerhalb kürzester Zeit abgeschlossen werden konnte, da die Dokumente bereits in Transkribus liegen und nur die entsprechenden Bilder und Texte für die Webseite zur Verfügung gestellt werden mussten. Die Grundbuchblätter des Tiroler Landesarchivs sind nunmehr online abrufbar. Das Projekt soll im Laufe der kommenden Monate um eine Crowd-Sourcing Komponente erweitert werden. Mittels des gerade in Entwicklung befindlichen Tools Citizen@Science sollen interessierte Benutzer*innen die Möglichkeit erhalten, sich für die freiwillige Mitarbeit bei der Verbesserung der Texterkennung sowie der kompletten Erfassung der Formulardaten zu melden und so einen Beitrag zur leichteren Verfügbarkeit historischer Daten leisten können.

(Günter Mühlberger/Redaktion)

 

Links

    Nach oben scrollen