Bericht vom Forschungsaufenthalt am
Laboratoire d‘Informatique de Grenoble

25.01. – 23.02.2020

Michael Ustaszewski

Cité des Alpes -"Cité des Alpes" by L7photo is licensed under CC BY-NC-ND 2.0

"Cité des Alpes" by L7photo is licensed under CC BY-NC-ND 2.0

Auf Einladung von Prof. Laurent Besacier absolvierte ich einen einmonatigen Forschungsaufenthalt bei der Forschungsgruppe GETALP (Groupe d'étude pour la traduction automatique et le traitement automatisé des langues et de la parole) am Laboratoire d‘Informatique de Grenoble (LIG). GETALP ist eine der führenden französischen Institutionen im Bereich der Maschinellen Übersetzung, wobei die Erforschung und Entwicklung von Übersetzungssystemen auf Grundlage künstlicher neuronaler Netzwerke, der sogenannten Neural Machine Translation (NMT), einen speziellen Arbeitsschwerpunkt darstellt, weil diese Technologie nach derzeitigem Stand der Forschung den leistungsstärksten und vielversprechendsten Ansatz zur Überwindung von Sprachbarrieren mittels künstlicher Intelligenz darstellt. Im Mittelpunkt meines Aufenthaltes stand die linguistische Analyse der Qualität von maschinell generierten Übersetzungen, also ein Forschungsbereich mit direkter Relevanz für die Optimierung bestehender und Entwicklung neuer Übersetzungstechnologien.

GETALP forscht unter anderem an einem neuartigen Ansatz zur NMT, der sogenannten Low-Latency NMT. Während herkömmliche NMT-Systeme einen ausgangssprachlichen Satz zunächst in seiner Gesamtheit einlesen und erst dann die Übersetzung des Satzes in die Zielsprache generieren, beginnen Low-latency-Systeme bereits nach dem Einlesen eines Teils des Satzes (z. B. nach drei Wörtern) mit der Generierung der Übersetzung. Nach dem Einlesen und Übersetzen des ersten Satzteiles wechselt das System schrittweise zwischen Einlesen und Übersetzen weiterer Satzteile hin und her, bis der gesamte Satz in mehreren Teilschritten eingelesen und übersetzt wurde. Solche Systeme gehen also ähnlich vor wie menschliche Dolmetscherinnen und Dolmetscher, die ja auch bereits nach dem Hören von einigen wenigen Wörtern in der Ausgangssprache mit der Verdolmetschung in die Zielsprache beginnen, und dabei nicht nur Hören und zeitversetzt Sprechen müssen, sondern auch den weiteren Fortgang der ausgangssprachlichen Rede inhaltlich und strukturell antizipieren müssen. Low-latency-NMT ist ein neuartiger Ansatz zu dem bisher nur vergleichsweise wenige Arbeiten vorliegen. Künftig könnten solche Systeme beim Maschinellen Dolmetschen oder bei der simultanen As-you-type-Translation zum Einsatz kommen, also in Situationen, bei denen eine möglichst geringe zeitliche Verzögerung zwischen Verarbeitung des ausgangssprachlichen Inputs und Generierung des zielsprachlichen Outputs angestrebt wird aber eine Nachbesserung des bereits generierten Outputs nicht möglich oder erwünscht ist.

Während des Forschungsaufenthaltes arbeitete ich gemeinsam mit den Grenobler Kolleginnen und Kollegen an der Evaluation von mehreren am GETALP entwickelten NMT-Systemen. Im Mittelpunkt stand der Vergleich von Low-latency-Systemen gegenüber herkömmlichen NMT-Systemen.

Konkret wurde während des Forschungsaufenthaltes eine umfassende Studie zur linguistischen Evaluation der einzelnen NMT-Systeme ausgearbeitet. Die Evaluation der maschinengenerierten Übersetzungen erfolgt im Sprachenpaar Deutsch-Englisch, welches für Low-latency-NMT besonders herausfordernd ist aufgrund der grammatischen Unterschiede zwischen den beiden Sprachen, insbesondere der auch unter menschlichen Dolmetschern berüchtigten Verbendstellung im Deutschen. Die gemeinsame Arbeit umfasste die Konzeption einer geeigneten Fehlertypologie zur linguistischen Annotation der maschinengenerierten Übersetzungen; die Erstellung eines Schemas für die Fehlerannotation; die Adaptation einer webbasierten Annotationsplattform; die Selektion und Vorbereitung eines geeigneten Datensatzes; sowie die Durchführung eines Testlaufs der Annotationsstudie auf Grundlage der vorangegangenen Arbeitsschritte. Die Erkenntnisse aus dem Testlauf wiederum wurden zur Optimierung der einzelnen Bestandteile der Studie herangezogen, sodass die Durchführung der eigentlichen Studie in den Wochen nach Beendigung des Forschungsaufenthalts erfolgen wird können.

Die Zusammenarbeit am GETALP war überaus ertragreich, da ich von den Grenobler Kolleginnen und Kollegen bestens aufgenommen und von Beginn an in sämtliche Arbeitsschritte der bereits im Vorfeld des Aufenthalts gemeinsam besprochenen Studie involviert wurde. Zusätzlich zur Arbeit an der gemeinsamen Studie bot sich mir die Möglichkeit, in zahlreichen Gesprächen, Diskussionsrunden und Seminaren weitere Arbeitsbereiche von GETALP kennenzulernen und dabei mein Wissen über die neuesten Entwicklungen und Trends im Bereich der Sprachtechnologien und insbesondere der Maschinellen Übersetzung zu erweitern. Aufgrund der interdisziplinären internen Zusammensetzung und externen Vernetzung der GETALP-Gruppe konnte ich dabei sehr vielfältige Problemstellungen sowie Sicht- und Herangehensweisen kennenlernen; auch das Knüpfen neuer Forschungskontakte hatte dabei seinen Platz. Besonders informativ war auch ein Treffen mit Vertreter des internationalen Erasmus+-Projekts MultiTraiNMT (Machine Translation Training for Multilingual Citizens), dessen Ziel in der Entwicklung von Lern- und Unterrichtsressourcen für den bewussten und reflektierten Umgang mit neuronaler maschineller Übersetzung besteht, und zwar sowohl aus Sicht von Sprachdienstleistungsprofis, als auch von Sprachlernenden und sonstigen Nutzergruppen. Darüber hinaus hielt ich am 20.02.2020 einen Gastvortrag über das in Innsbruck angesiedelte Projekt „TransBank – A Meta-Corpus for Translation Research“. Insgesamt führte der Forschungsaufenthalt also nicht nur zur Ausarbeitung der in den nächsten Wochen zu finalisierenden NMT-Evaluierungsstudie, sondern offenbarte auch zahlreiche Möglichkeiten, vor allem aber konkrete Absichten zur längerfristigen Fortführung einer Zusammenarbeit in unterschiedlichen Bereichen.

Daneben erlaubte mir der Forschungsaufenthalt, den Alltag in Frankreich und das Leben am Westende der Alpen kennenzulernen. Grenoble und die Dauphiné sind überaus lebenswert, wovon nicht nur der Status der Stadt als einer der größten Forschungsstandorte Frankreichs zeugt. Die überschaubare Größe der Stadt, der effiziente öffentliche Verkehr und vor allem die nachahmenswerte Fahrradinfrastruktur bewirken – neben den offensichtlichen Vorzügen einer hervorragenden Gastronomie und beeindruckenden Bergkulisse – eine hohe Lebensqualität. Somit kann ich dank finanzieller Unterstützung durch das International Relations Office (Stipendium für Kurzfristige wissenschaftliche Arbeiten im Ausland) und den Frankreich-Schwerpunkt der Universität Innsbruck auf einen sehr produktiven und lehrreichen Auslandsforschungsaufenthalt zurückblicken, der den Grundstock für eine längerfristige Zusammenarbeit an der Schnittstelle von Sprache und Technologie darstellen könnte. Denn im intensiven Austausches mit den Grenobler Kolleginnen und Kollegen stellte sich rasch heraus, dass uns wesentlich mehr als nur die Ähnlichkeit unserer alpinen Städte – Innsbruck wurde vielfach treffend als „Grenoble Österreichs“ bezeichnet – verbindet.

Text: Michael Ustaszewski
F
oto: "Cité des Alpes" by L7photo is licensed under CC BY-NC-ND 2.0

Nach oben scrollen