German Innsbruck Corpus (GermInnC).

Ein digitales Pilotkorpus zur Variation im Deutschen 1800-1950

 

gefördert von:  Nachwuchsförderung der Universität Innsbruck

vorauss. Start:  01.10.2018

vorauss. Ende:  30.09.2019

 

Das German Innsbruck Corpus (GermInnC) 1800-1950 wird als digitales Korpus konzipiert, um Erkenntnisse zur Standardisierungsgeschichte und die damit verbundene Variation des Deutschen im tatsächlichen Sprachgebrauch des 19. und frühen 20. Jahrhunderts zu gewinnen. Das Korpus wird analog zum repräsentativen German Manchester Corpus (GerManC) kompiliert, das für das frühe Neuhochdeutsche 1650-1800 erstellt wurde. Das GermInnC orientiert sich in Korpusdesign und Vorgehensweise bei der Digitalisierung am GerManC.

Das GermInnC wird demnach aus ca. 1.000.000 Textwörtern/Tokens bestehen, mit ca. 100.000 pro Textsorte („genre“). Wie das GerManC gliedert sich das GermInnC in drei Zeitschnitte („period“) à 50 Jahre, nämlich 1800-1850, 1851-1900 und 1901-1950, mit jeweils ca. 33.333 Textwörtern/Tokens. Weiters wird das GermInnC den deutschsprachigen Binnenraum mit Quellen aus fünf Regionen („region“) abbilden. Die Einteilung der Regionen leitet sich dabei von den traditionellen dialektalen Großregionen (West-/Ostmitteldeutsch, West-/Ostoberdeutsch) und dem norddeutschen (großteils niederdeutsch-niederfränkischen) Raum ab.

Das GermInnC wird Privatbriefe („letters“), Predigten („sermons“), Dramentexte („drama“), narrative Texte („narrative prose“), Zeitungstexte („newspapers“), Sach- und Fachprosa („humanities“ und „scientific texts“) und Amtliches („legal texts“) enthalten. Allgemein sollen diese Quellen sowohl die Sprache der (zeitlich-räumlichen und kommunikativen) Nähe als auch die Sprache der (zeitlich-räumlichen und kommunikativen) Distanz widerspiegeln. Dies ermöglicht insbesondere einen Ansatz der 'Sprachgeschichte von unten' (für den Sprachgebrauch der breiten Bevölkerung), aber auch einen traditionellen Zugang der Sprachgeschichte 'von oben' (für den Sprachgebrauch der gesellschaftlichen Elite).

 

Konstantin Niehaus, 11.09.2018

Nach oben scrollen