Symbolbild: Roboterhand zeigt auf ein gezeichnetes Netzwerk

Gastvortrag im Rahmen der Lehrveranstaltung „Möglichkeiten und Grenzen der maschinellen Übersetzung“.

Maschi­nelle Über­set­zung für die ladi­ni­sche Spra­che

Die stetig wachsende Bedeutung des maschinellen Übersetzens wird durch das vorgestellte Projekt zur Einführung eines maschinellen Übersetzungssystems für die ladinische Sprache in Südtirol unterstrichen. Der Informatikabsolvent Samuel Frontull, MSc berichtet über die verschiedenen Möglichkeiten, für das Ladinische und seine Varietäten ein automatisches Übersetzungssystem zu entwickeln.

Die Entwicklung automatischer Übersetzungssysteme hat verschiedene Ansätze hervorgebracht. Gastredner Samuel Frontull, der selbst aus dem Sprachgebiet des Ladinischen stammt, versuchte bei seinem Gastvortrag am 13. Juni 2022 am Institut für Translationswissenschaft (INTRAWI) im Rahmen der Lehrveranstaltung „Möglichkeiten und Grenzen der maschinellen Übersetzung“ die drei wichtigsten dieser Ansätze (regelbasiert, statistisch und neuronal) beispielhaft für das Ladinische umzusetzen. Die Herausforderung liegt dabei vor allem darin, dass es sich bei dem Ladinischen um eine sehr kleine Minderheitensprache handelt, für die kaum Parallelkorpora vorliegen. Die beiden moderneren Ansätze der statistischen und neuronalen MÜ-Systeme bauen nämlich auf solchen zweisprachigen Textsammlungen auf: Je umfangreicher die zur Verfügung stehenden Übersetzungsbestände sind, desto höher wird auch die Qualität der automatischen Übersetzungen ausfallen. Beim direkten und regelbasierten Ansatz braucht es zwar keine Textkorpora, es müssen aber zweisprachige Wörterbücher und grammatikalische Regeln in das System eingegeben werden.

Im Fazit erklärte Samuel Frontull, MSc, dass der ältere regelbasierte direkte Ansatz mit Hilfe des Systems Apertium einen sehr hohen Aufwand erforderte, aber dennoch die geringste Qualität der Übersetzungen erreichte. Das statistische Modell mit Hilfe des Systems Moses wies die höchste Qualität auf und könnte durch wesentlich umfangreichere Paralleldaten noch gesteigert werden. Auf sehr interessanter Weise erläuterte der Gastredner, wie diese Herausforderungen für das Ladinische mit verschiedenen Lösungsansätzen gemeistert werden könnten. Damit stellte dieser Gastvortrag eine ideale Ergänzung zu den allgemeinen Inhalten dieser Vorlesung dar und konnte den Bezug zur gelebten Mehrsprachigkeit in Südtirol herstellen. Darüber hinaus konnte mit Samuel Frontull die Perspektive der Informatik in die Translationswissenschaft eingebunden werden und somit ein transdisziplinärer Blick auf das maschinelle Übersetzen und seine Herausforderungen geworfen werden.

(Peter Sandrini)

    Nach oben scrollen