Navigationshilfe für Einsteiger

Text: Franziska Zellner

Trotz ihrer hohen Bedeutung findet die Technischen Dokumentation in der Linguistik bislang erstaunlich wenig Beachtung. Wie können beide Bereiche stärker voneinander profitieren? Das Projekt CorTeDo ist ein erster Ansatz, zunächst für die englische Sprache.

Inhaltsübersicht

Lesedauer: 08:21 Minuten

Um solche Fragestellungen nicht nur mithilfe von subjektiver Intuition und individuellen Erfahrungswerten, sondern auf Basis von realen, belastbaren Daten zu beantworten, verwendet man in der Linguistik gerne ein Textkorpus. Derartige Textkorpora existieren bereits für viele Sprachen und Genres. Auch in der Technischen Dokumentation werden immer wieder einzelne Textkorpora erstellt, zum Beispiel als Trainingsgrundlage für Maschinelles Lernen. Allerdings existiert noch kein branchenübergreifendes, gut strukturiertes Textkorpus, das auch für die linguistische Forschung zur Verfügung steht.

Textkorpora und Korpuslinguistik

Unter einem Textkorpus (auch nur Korpus, pl. Korpora) versteht man eine strukturierte, computerlesbare Sammlung sprachlicher Daten. Diese Daten können schriftliche Texte sein oder auch Transkriptionen mündlicher Kommunikation. Die Korpuslinguistik untersucht solche ...

Eine Person steht an einer Gabelung.