Unter Dach und Fach

Text: Jasmin Nesbigall

Terminologiepflege gleicht der Aufgabe, den eigenen Keller aufzuräumen: aufwendig, unliebsam, aber eben dringend nötig. Mit dem richtigen Fokus und dem passenden Werkzeug kann sich die Pflege vom gefürchteten Mammutprojekt zur schnellen Routine entwickeln. Also Ärmel hoch und Treppe runter.

Inhaltsübersicht

Lesedauer: 12:36 Minuten

Der Keller eines Hauses kann vieles sein: Abstellkammer, Hobbyraum, Wäschezimmer, Einliegerwohnung, Partyzone, aber auch Müllhalde und Chaos. Je nach Größe und Verwendung erweitern die zur Verfügung stehenden Kellerräume die Wohnung um zusätzlichen Stauraum oder belasten als unansehnliche Rumpelkammer das Gewissen.

Ähnlich verhält es sich auch mit Terminologiedatenbanken: Einmal angelegt, entwickeln sie sich schnell zu einem Auffangbecken für alle sprachlichen Informationen eines Unternehmens. Einerseits ist man froh, endlich den passenden Speicherort für Benennungen, Synonyme, Abkürzungen und alle wichtigen und nicht so wichtigen Zusatzinformationen gefunden zu haben. Andererseits läuft man immer auch Gefahr, die Datenbank ungefiltert zu befüllen und nicht ausreichend zu pflegen. Genau wie bei vielen Kellern gelangen Dinge nur hinein, aber niemals wieder hinaus.

Idealfall statt Chaos

Keller und Terminologiedatenbanken haben auf den ersten Blick vieles gemeinsam. Sinnvoll genutzt dienen sie als solide Basis, aus der man sich bei Bedarf bedienen kann. Im besten Fall sind sie ein strukturierter Stauraum, in dem es für alles einen passenden Platz gibt. Dabei sind eine gut durchdachte Sortierung und Ordnung die Voraussetzungen für eine gezielte Suche und eine hohe Auffindbarkeit. Der Nutzer weiß dann genau, wo etwas hinkommt und wie etwas gefunden werden kann. Und auch wenn er nicht genau weiß, nach was er sucht, kommt er über Ähnlichkeiten und Verbindungen zum gewünschten Ergebnis. Soweit der Idealfall.

Im schlechtesten Fall und bei mangelnder Pflege tendieren Keller und Terminologiedatenbank allerdings dazu, mit überflüssigen, veralteten oder fehlerhaften Informationen und Dingen befüllt zu werden. Altlasten jeglicher Art werden dann ohne Struktur zusammengewürfelt, aufeinandergeschichtet und eingelagert. Nach und nach vermüllt der Stauraum und entwickelt sich schließlich zu einem Ort, den man nur ungern vorzeigt. Das entstandene Chaos erschwert die gezielte Suche und führt zu einer nur noch eingeschränkten Nutzbarkeit. Ohne klare Strukturen werden einmal abgelegte Informationen schwer oder eher zufällig wiedergefunden.

Skier, Kartons und Jacken

Doch nicht nur bei Struktur und Ordnung gibt es Gemeinsamkeiten zwischen Kellern und Terminologiebeständen. Auch inhaltlich bestehen mehr Ähnlichkeiten, als man auf den ersten Blick denkt. In Terminologiedatenbanken findet sich häufig Fremdterminologie: Termini, die nicht zum eigentlichen Unternehmenswortschatz gehören, sondern von anderen Firmen stammen, zum Beispiel die Microsoft-Oberflächenterminologie. Mit der Aufnahme in die Datenbank übernimmt man Verantwortung für Aktualisierung und Pflege des Fremdbestands, obwohl die Termini im eigenen Unternehmensumfeld vielleicht nur selten benötigt werden. Sie ähneln den Langlaufskiern, die man in einem schneereichen Winter gekauft hat, die inzwischen aber in einer Ecke stehen. Wenn man sie wieder brauchen könnte, sind sie technisch veraltet und überholungsbedürftig.

Auch leere Kartons von Versandbestellungen oder dem letzten Umzug finden sich im Keller. Während man glaubt, diese nochmals mit Inhalt zu befüllen und sinnvoll zu nutzen, wächst ihr Bestand kontinuierlich. Das Terminologie-Äquivalent sind alle Einträge, die nur schnell mit einzelnen Benennungen und dem festen Vorsatz angelegt wurden, sie irgendwann mit einer Definition und weiteren Informationen zu vervollständigen.

Das nächste Fundstück sind Winterjacken, von denen es meist mehrere Exemplare gibt. Zu der alten Jacke, die noch gut ist, aber eben nicht mehr ganz so modisch, gesellen sich Frühjahr für Frühjahr neue Exemplare. Auch Terminologiedatenbanken füllen sich schnell mit Dubletten und Synonymen, ohne dass klar ist, ob und wann die alten Einträge verwendet werden können.

Eine Kiste für den Karneval

In jedem Unternehmen gibt es zusätzlich Termini, die zwar nur selten gebraucht werden, deren korrekte Verwendung aber für das Verständnis und die korrekte Nutzung essenziell ist. Sobald ein Unternehmen mit einer eigenen Software oder Maschinensteuerungstexten arbeitet, müssen die dort verwendeten Oberflächentexte als Referenz zur Verfügung stehen, zum Beispiel für die Technische Dokumentation. Ähnlich einer Kiste mit Karnevalsutensilien handelt es sich um Termini, die nur selten benötigt werden. Fehlen sie aber, führt dies zu Problemen. Bezogen auf den Karneval zumindest in den einschlägigen Regionen Deutschlands.

Als letzte Parallele findet sich wohl in jedem Keller ein Paar schmutzige Schuhe und in jeder Datenbank unsaubere Benennungen. Sie enthalten Konjunktionen, Klam-mern und Satzzeichen und können in der vorliegenden Form nicht sinnvoll genutzt werden. Eine (Be-)Reinigung ist sowohl bei den Schuhen als auch bei den Benennungen dringend nötig.

Die sprichwörtlichen Leichen im Keller sind also aufgedeckt. Um die eigene Datenbank jetzt sinnvoll zu entrümpeln, muss man sich mit den Fakten vertraut machen. Dafür gilt es, den zur Verfügung stehenden Platz, die vorhandene Struktur und den Altbestand zu betrachten. Auch sind die Fragen wichtig, wer die Datenbank nutzt oder nutzen soll und damit von der Entrümpelung profitieren wird. Schließlich werden mögliche Maßnahmen analysiert: Was lässt sich in ein paar Stunden schaffen und womit kann (oder muss) man anfangen? Wichtig für eine sinnvolle Entrümpelung sind daher die Aspekte 1. Nutzbarkeit, 2. Nutzer(gruppen) und 3. Maßnahmen.

Nutzbarkeit definieren

Bei der Nutzbarkeit unterscheidet man zwischen externer und interner Nutzbarkeit. Die externe Nutzbarkeit umfasst alle allgemeinen Aspekte der Nutzung. Hierunter fallen die allgemeine Kenntnis der Existenz der Datenbank, die Zugriffsmöglichkeiten für Nutzer, die Rechtevergabe innerhalb der Datenbank und die intuitive Bedienung. Aber auch Suchfunktionen und die Möglichkeit, Feedback zur Nutzung abzugeben, zählen dazu.

Wichtiger im Hinblick auf eine sinnvolle Entrümpelung ist jedoch die interne Nutzbarkeit. Hierfür werden der Aufbau der Datenbank und die zur Verfügung stehenden Felder betrachtet. Für jede benötigte Information muss es ein sinnvolles Feld auf der korrekten Ebene geben: Eintrags-, Sprach- und Terminusebene. Jedes dieser Felder muss eindeutig sein, so dass immer deutlich ist, welche Information in welches Feld eingetragen wird. Ein Negativbeispiel ist das Feld „Zusatzinformation“. Wenn es als Freitextfeld auf Eintragsebene angelegt ist, dient es als Auffangbecken für jegliche Art von Definition, Kontext, Projektzugehörigkeit oder Freigabestatus.

Alle vorhandenen Felder der Datenbank müssen auf Notwendigkeit und Redundanz geprüft werden. Bei redundanten Feldern besteht die Gefahr, dass Informationen doppelt oder abweichend eingetragen werden. Ein Beispiel dafür sind die Felder „Quelle“ und „Herkunft“. Unter die interne Nutzbarkeit fallen außerdem die zur Verfügung stehenden Datenkategorien und Auswahlwerte, die sinnvoll vorgegeben werden müssen.

Nutzergruppen analysieren

Da das Ergebnis jeder Datenbankpflege im Idealfall auch eine Optimierung für die Nutzer darstellt, müssen vor einer Entrümpelung die verschiedenen Nutzergruppen und ihre Anforderungen betrachtet werden. Für die unterschiedlichen Nutzergruppen innerhalb eines Unternehmens sind naturgemäß unterschiedliche Felder und Informationen relevant. Vor jeder Umstrukturierung muss daher zwingend geklärt werden, welche Daten benötigt werden, wie diese optimiert werden können und welche Probleme bei der bisherigen Nutzung aufgetreten sind. Dabei gilt einerseits, dass die Datenbank so umfangreich sein muss, dass alle benötigten Informationen abgebildet werden können. Andererseits muss der Bestand so gut strukturiert und schlank sein, dass keine überflüssigen Daten die Nutzung erschweren.

Terminologen, die sich meist um die Datenbankpflege kümmern, benötigen grundsätzlich alle Informationen der Datenbank, vorrangig aber eine sinnvolle Struktur, um für jede Information einen passenden Speicherort zu haben. Technische Redakteure hingegen brauchen eine saubere Ausgangssprache, um die korrekte Terminologie bei der Texterstellung zu verwenden. Aussagekräftige Definitionen, Kontextsätze und vor allem Informationen zur erlaubten oder verbotenen Verwendung eines Terminus sind für diese Nutzergruppe entscheidende Voraussetzungen, um die Datenbank sinnvoll nutzen zu können.

Für die Marketingabteilung hingegen sind eventuell gesonderte Synonyme wichtig, um ein Produkt werbewirksam vermarkten zu können. Neben der rein technischen Bezeichnung ist oft eine griffige Benennung nötig, die zum Beispiel mit einem extra Gültigkeitsfeld belegt sein kann – „Gültig für Marketing“. Die Nutzergruppe des Sprachendienstes oder der internen und externen Übersetzer benötigt Informationen zur Vorzugsbenennung in der jeweiligen Sprache und eine saubere Ausgangssprache, damit die Termini aus der Datenbank bei der Übersetzung automatisch erkannt werden. Bei nicht vorhandenen Äquivalenten in der Zielsprache helfen aussagekräftige Definitionen, Kontextsätze und Abbildungen bei der Recherche nach der passenden Entsprechung eines Terminus.

Für alle gelegentlichen Nutzer der Datenbank sind insbesondere die Kenntnis über die Datenbank und ihre Funktionen sowie die Sichtbarkeit der Datenbank entscheidend. Nur eine regelmäßige Erinnerung an die Datenbank, ein prominenter Platz im Intranet und ein einfacher und schneller Zugang ermöglichen es, dass auch Kollegen, die nicht mit der Texterstellung oder -übersetzung betraut sind, einen Blick in die Datenbank werfen. Für diese Nutzergruppe sind vor allem eindeutige und vollständige Einträge wichtig, da hier nicht viele, aber auf jeden Fall korrekte Informationen benötigt werden.

Maßnahmen einleiten

Der dritte Aspekt ist zugleich der aktivste und schwerste, denn jetzt gilt es, konkret Hand anzulegen. Dabei können anhand von neun kleinen und großen Pflegemaßnahmen schnell erste Erfolge erzielt werden (Abb. 01). Die Maßnahmen, die auch einzeln wirken, gelten in erster Linie für Bestände in Terminologiedatenbanken. Einige Ansätze lassen sich aber auch für Bestände anwenden, die in Excel verwaltet werden.

Terminologiedatenbank aufräumen

Abb. 01 Neun Maßnahmen sorgen für eine aufgeräumte Terminologiedatenbank. Quelle Jasmin Nesbigall

Die Suche beginnt

Ein erstes Mittel zur Bestandspflege ist das Filtern, entweder gezielt in einer Ausgangssprache oder quer durch alle Sprachen. Dabei kann nach jedem angelegten Feld und allen Feldinhalten gefiltert werden. Die Kriterien reichen dabei vom generellen Vorhandensein eines Werts (vorhanden, fehlt), über dessen Position (beginnt mit, endet auf) bis zur exakten Übereinstimmung. Abbildung 2 stellt verschiedene Filtermöglichkeiten dar. Durch UND/ODER-Optionen können mehrere, einander ergänzende oder beschränkende Filter erstellt werden.

Filterkriterien in der Terminologiedatenbank

Abb. 02 Kriterien für die Filterung in einer Terminologiedatenbank (am Beispiel von SDL MultiTerm). Quelle Jasmin Nesbigall

Filtern ermöglicht das Auffinden von unsauberen Einträgen, die zum Beispiel Satzzeichen wie Kommata oder Klammern enthalten. Auch das gezielte Filtern nach Konjunktionen und Partikeln in Benennungen kann zum Aufspüren von nicht korrekten Termini führen. Durch die Eingrenzung eines bestimmten Erstellungsdatums lassen sich alle Termini finden, die zum definierten Zeitpunkt in der Datenbank angelegt wurden. Auf diese Weise lässt sich Fremdterminologie eingrenzen, die meist als kompletter Bestand innerhalb eines Imports in die Datenbank aufgenommen wird.

Filtert man hingegen nach leeren Werten, werden fehlende Verwendungsinformationen aufgedeckt: die fehlende Kategorisierung, ob ein Terminus erlaubt, veraltet oder verboten ist (Feld: Verwendung > Bedingung: fehlt). Auch fehlende Definitionen und Kontextsätze werden so gefunden. Um gezielt zu bearbeitende Termini auszuspielen und Einträge zu vervollständigen, lässt sich der Filter für den Export nutzen.

Da sich in großen Terminologiebeständen – analog zu den erwähnten Winterjacken – häufig Dubletten ansammeln, ist eine regelmäßige Suche angebracht. Die meisten Datenbanken bieten hierzu eine extra Suchfunktion. Es empfiehlt sich, die Suche in verschiedenen Ausgangssprachen durchzuführen, um Synonyme in unterschiedlichen Einträgen zu finden. Ein Beispiel: Wird durch die Dublettensuche im Englischen „tie“ als Dublette gefunden, so gilt es, die deutschen Äquivalente zu betrachten. Steht hier zum Beispiel in Eintrag 1 „Schlips“ und in Eintrag 2 „Krawatte“, so hat die Suche zwei Synonyme aufgedeckt, die bisher als getrennte Einträge geführt wurden. Diese Einträge können verschmolzen und die Verwendung der beiden deutschen Benennungen festgelegt werden. Wenn Eintrag 1 dann noch eine gute Definition enthält, Eintrag 2 hingegen Äquivalente auf Französisch und Spanisch, ergeben sich durch das Zusammenführen wichtige Ergänzungen des Eintrags.

Die Dublettensuche lässt sich nicht nur in Terminologiedatenbanken, sondern auch für Excel-Dateien unkompliziert anwenden. Im Bereich „Formatvorlagen“ kann in Microsoft Excel eingestellt werden, welche bedingten Formatierungen für bestimmte Zellen gelten sollen (Abb. 03). Bei vorab markierter Spalte lässt sich unter „Regeln zum Hervorheben von Zellen“ > „Doppelte Werte“ auswählen, dass doppelt vorkommende Werte farblich hervorgehoben werden. Die Funktion ermöglicht es also, in vielen Sprach(spalt)en gleichzeitig nach Dubletten zu suchen. Durch die farbliche Markierung sind die Ergebnisse viel schneller sichtbar, als dies bei einer rein alphabetischen Sortierung der Spalten der Fall ist.

Menü unter Bedingte Formatierung

Abb. 03 Auch in Microsoft Excel ist eine Suche nach Dubletten möglich. Quelle Jasmin Nesbigall

Als dritte Suchmaßnahme kann gezielt nach Termini gesucht werden. Die Voraussetzung ist, dass man bereits weiß, wonach man sucht. Sinnvoll eingesetzt kann die Wortsuche zum Abgleich von Wortteilen in Komposita dienen. Eine typische Fehlerquelle der Terminologiearbeit ist es, Einzelbenennung zu ändern, ohne anschließend eine Kompositasuche durchzuführen. Dies führt dazu, dass die Komposita veraltet sind und Inkonsistenzen sowie Übersetzungsfehler provozieren. Die direkte Suche kann aber auch dazu verwendet werden, unsaubere Einträge zu finden, zum Beispiel die Suche nach Satzzeichen oder Konjunktionen. Durch die gezielte Volltextsuche innerhalb der gesamten Datenbank können außerdem veraltete Werte gefunden werden. Ein Beispiel: Werden die Auswahlwerte für das Feld „Fachgebiet“ im Laufe der Zeit weiter spezifiziert, so dass sich das Fachgebiet „Erneuerbare Energien“ jetzt in „Windkraft“ oder „Solarenergie“ untergliedert, können durch die Volltextsuche nach „Erneuerbare Energien“ alle veralteten Einträge gefunden und aktualisiert werden.

Eine weitere Suchmaßnahme ist die Stichprobensuche, bei der nach bestimmten Termini in Texten des Unternehmens und in Übersetzungen gesucht wird. Viele Datenbanken bieten eine automatisierte Analyse gegen einen Text an, um zu erkennen, wie hoch die Matchrate zwischen der Datenbank und dem Text ist. Man findet somit gleichermaßen veraltete Benennungen, die in den Unternehmenstexten nicht verwendet werden, und neue Termini, die noch nicht in der Datenbank vorhanden sind. Fast nebenbei liefert die Stichprobensuche auch sinnvolle Kontextsätze zur Ergänzung der Datenbank und Zusatzinformationen wie fehlende Verwendungsinformationen. Gerade wenn ein Eintrag viele Synonyme ohne Verwendungsinformationen enthält, ergibt die Stichprobensuche in Unternehmenstexten durch die reine Trefferanzahl die benötigte Information, welcher Terminus bevorzugt verwendet wird.

Augen und Ohren auf

Wenn die Datenbankpflege nicht nur einzelne Termini oder Terminusgruppen, sondern die gesamte Datenbank umfassen soll, muss zwingend eine Strukturanalyse erfolgen. Die Analyse betrachtet die gesamte Struktur der Datenbank – alle Felder, Ebenen, Auswahlwerte und Vorgaben. Da alle Zusatzinformationen in meist frei definierbaren Feldern angelegt werden, liegt hier das höchste Entrümpelungspotenzial. Auch wenn das Anlegen von Feldern keine Kosten verursacht, gilt der Grundsatz: so viel wie nötig, so wenig wie möglich.

Bei der Betrachtung der bestehenden Felder muss hinterfragt werden, welche Felder wirklich benötigt werden und auf welcher Ebene (Eintrags-, Sprach- und Terminusebene) sie sinnvoll sind. Felder auf falscher Ebene (Beispiel: „Definition“ auf Terminusebene, obwohl die Definition für den gesamten Eintrag gilt) müssen umgezogen bzw. neu angelegt werden. Bei redundanten (Beispiel: „Quelle“ und „Herkunft“) oder überflüssigen Feldern (Beispiel: „Änderung am“, da diese Information meist aus den Metadaten ersichtlich ist) muss entschieden werden, ob die vorhandenen Informationen zusammengeführt werden oder die Felder komplett gelöscht werden. Bei der Strukturanalyse gilt es auch zu prüfen, ob alle vorhandenen Felder eindeutig sind, wie zum Beispiel das bereits erwähnte Feld „Zusatzinformation“ auf Eintragsebene. Ist dies nicht der Fall, kann durch die Anlage von weiteren Feldern oder die Vorgabe von Auswahlwerten in Form einer Picklist das Ergebnis in die gewünschte Richtung gelenkt werden.

Meinungen einholen

Genauso wichtig wie die eigene Analyse ist auch jede Fremdmeinung zur Terminologiedatenbank, also das Feedback der Nutzer. Dabei geht es sowohl um die Nutzer, die nur gelegentlich etwas nachschlagen, als auch um die regelmäßigen Textersteller in Ausgangs- und Zielsprachen. Alles, was diesen Nutzern auffällt, kann als wertvolles Feedback für die Optimierung dienen. Wichtig ist hierbei, dass die Datenbank Möglichkeiten zum direkten Feedback in Form einer E-Mail-Adresse oder eines Kontaktformulars bietet, damit die Informationsweitergabe für den Nutzer möglichst einfach ist. Auch aktives Nachfragen bei der Technischen Redaktion oder der Übersetzungsabteilung ist sinnvoll, um zu erkennen, welche Einträge optimiert werden müssen. Das Einfordern von QA-Reports aus der Texterstellung kann beispielsweise Aufschluss darüber geben, welche Termini immer wieder Fehler aufwerfen oder wo sich Technische Redakteure oder Übersetzer durch zahlreiche Synonyme ohne Verwendungsinformationen kämpfen müssen. Entscheidend für die aktive Einbeziehung der Nutzer ist dann die schnelle Umsetzung. Sie macht deutlich, dass die Kritik Früchte trägt. Da sich durch das Feedback der Nutzer von veralteten und falschen Benennungen, über fehlende Informationen auf allen Ebenen bis zu unterschiedlichen Begriffen innerhalb eines Eintrags alle Sorten von Fehlern aufdecken lassen, ist diese Maßnahme Gold wert.

Die großen Drei

Wenn die Bereinigung innerhalb der Datenbank nur bedingt möglich oder sinnvoll ist, stehen die letzten drei großen Maßnahmen an: separate Datenbanken, Exporte und Neuanlage.

Separate Datenbanken eignen sich zum Beispiel für Fremdterminologie, GUI-Texte, Farbnamen und Termini mit speziellen Vorgaben wie Displaytexte. Wenn diese Termini bei der normalen Texterstellung viele unnötige Fehler generieren, zum Beispiel aufgrund von erzwungenen Abkürzungen oder Allgemeinsprachlichkeit wie bei „Weiter“ (GUI), aber eigentlich nur selten benötigt werden, können sie in separaten Datenbanken leichter gepflegt und aktualisiert werden. Bei Bedarf kann die Datenbank zu einem Projekt hinzugezogen werden.

Gerade bei umfangreichen Bereinigungen, zum Beispiel der Umbenennung von Fachgebieten oder der Änderung von Verwendungsinformationen, ist die Bearbeitung außerhalb der Datenbank unumgänglich. Ein Export in Standardformate wie XML oder TBX oder auch eine Übertragung in Spezialsoftware mit Anbindung an die Datenbank ermöglichen die Bearbeitung im großen Stil und den anschließenden Re-Import mit Synchronisierung, beispielsweise über die ID eines Terminus.

Ein vollständiger Umzug

Die letzte Maßnahme wirkt abschreckend, ist aber in manchen Fällen das einzig sinnvolle Mittel, um Ordnung ins Chaos zu bringen: eine zweite, saubere Datenbank. Die neue Datenbank wird mit einer sinnvollen Struktur angelegt und nach und nach mit den bereinigten Daten aus der alten Datenbank gefüllt. Es werden nur Einträge überführt, die den Vorgaben entsprechen. Der Altbestand kann hierbei auch nach und nach abgearbeitet werden, indem man beispielsweise die einzelnen Fachgebiete vom jeweiligen Expertenteam bearbeiten lässt. Die alte Datenbank läuft dabei immer parallel als Referenz, bis irgendwann alle Einträge in die neue Datenbank überführt sind. Und obwohl diese Maßnahme die radikalste und aufwendigste scheint, schlägt sie einen guten Bogen zum anfänglichen Vergleich zwischen Terminologiedatenbanken und Kellern: Denn nie ist man so motiviert, mal richtig aufzuräumen, wie kurz vor einem Umzug.

Unter Dach und Fach