Terminologiemanagement findet man heute in vielen Unternehmen; es unterstützt nicht nur die Technische Redaktion oder die Übersetzungsabteilung, sondern wird auch für das Marketing, zur Katalogerstellung, für die Teileverwaltung, die Suchmaschinen-Optimierung sowie für die Gestaltung von Internetseiten genutzt. Auch beim Informationsaustausch mit Zulieferern und Dienstleistern spielen terminologische Daten eine Rolle.
Terminologiemanagement wird heute durch Informationstechnologie unterstützt; Terminologiedatenbanken (kurz Termbanken) haben Wörterbücher, Vokabellisten und Karteikarten längst abgelöst. Gut gestaltete und genutzte Termbanken enthalten das fachliche Wissen des Unternehmens, oft für viele Anwendungen und in vielen Sprachen. Die Termbanken müssen von allen Nutzern innerhalb und außerhalb des Unternehmens sowie von allen elektronischen Systemen genutzt werden können.
Bei der Konzeption einer IT-basierten Terminologielösung gilt es, bestimmte (Design-)Prinzipien zu befolgen, damit die Nutzung terminologischer Daten, die oft über viele Jahre mit großem Aufwand erarbeitet werden, auch auf Dauer erfolgen kann. Der verlustfreie Austausch von Daten mit anderen Partnern oder Systemen, die Konsistenz und die Verlässlichkeit der Daten sowie die Brauchbarkeit und damit die Nutzung der Daten durch die betroffenen Personengruppen werden sehr stark von einer vernünftigen Konzeption der Terminologielösung beeinflusst. Normen und Best Practices helfen bei der Konzeption, wobei vor allem die theoretischen Grundlagen der Terminologiearbeit verstanden und für die Konzeption der Termbank genutzt werden sollten. Im Mittelpunkt dieses Beitrags stehen daher die theoretischen Grundlagen der Terminologiewissenschaft und deren praktische Umsetzung.
Was gilt es zu wissen?
Fachliche Kommunikation hat zum Ziel, Wissen zu vermitteln. Wissen wird nicht nur, aber doch meistens durch die Sprache ausgedrückt. Fachwörter bezeichnen diese Wissenselemente in Fachtexten oder in der mündlichen Kommunikation, sind also wichtig für die Wissensvermittlung. Noch wichtiger ist das Wissens selbst, also das, was diese Fachwörter bezeichnen. Und genau damit beschäftigen sich die Terminologiewissenschaft und die praktische Terminologiearbeit.
Terminologie ist in der DIN 2342:2011 definiert als der „Gesamtbestand der Begriffe und ihrer Bezeichnungen in einem Fachgebiet“ [1]. Bezeichnung ist hier der Oberbegriff für alle Arten von Begriffsrepräsentationen, sei es mit sprachlichen Mitteln wie bei Benennungen und Namen oder nicht-sprachlichen Mitteln wie Symbolen, Piktogrammen oder Kennzeichnungen. Ein einfaches Modell, das semiotische oder auch terminologische Dreieck, veranschaulicht die Beziehung zwischen der Bezeichnung/Benennung und dem Begriff; als drittes Element kommt der Gegenstand hinzu (Abb. 01).
Abb. 01 Beispiel für ein semiotisches Dreieck [2].
Schauen wir uns das Dreieck genauer an. Ein Gegenstand (engl. object) ist nach DIN 2342:2011 ein Ausschnitt aus der wahrnehmbaren oder vorstellbaren Welt. Gegenstände können nicht nur konkrete (materielle) Objekte sein (zum Beispiel Maus), sondern auch abstrakte (immaterielle) Objekte (zum Beispiel Rechtschreibprüfung). Auch Sachverhalte oder Vorgänge wie etwa „eine App installieren“ werden unter Gegenstand eingeordnet. Mehr zur Klassifikation von Gegenständen findet sich in [3].
Begriffe (engl. concepts) sind gedankliche Vertreter dieser Gegenstände. Sie ergeben sich aus der Tatsache, dass Menschen die gemeinsamen Merkmale erkennen, die bei der Mehrheit von Gegenständen desselben Typs vorhanden sind. Die DIN 2342:2011 beschreibt den Begriff als „Denkeinheit, die aus einer Menge von Gegenständen unter Ermittlung der diesen Gegenständen gemeinsamen Eigenschaften mittels Abstraktion gebildet wird“; sie erläutert weiter, dass Begriffe nicht an einzelne Sprachen gebunden, sondern vom „jeweiligen gesellschaftlichen und kulturellen Hintergrund einer Sprachgemeinschaft beeinflusst“ sind. Deshalb können Begriffe in unterschiedlichen Kulturen wie etwa den USA und Irland unterschiedlich ausgeprägt sein, auch wenn sie durch den identischen sprachlichen Ausdruck bezeichnet werden.
Da Begriffe mentale Konstrukte sind, müssen sie zur Wissensvermittlung und zum Informationsaustausch mittels Definitionen „sichtbar“ gemacht werden. Die Fachliteratur unterscheidet noch zwischen Allgemeinbegriff (repräsentiert mehrere Gegenstände) und Individualbegriff (repräsentiert nur einen Gegenstand, zum Beispiel Kölner Dom); in den meisten Fällen beschäftigen wir uns mit den Allgemeinbegriffen.
Die Benennung (engl. term) ist in der DIN 2342:2011 definiert als die „sprachliche Bezeichnung eines Allgemeinbegriffs aus einem Fachgebiet“. Die Benennung ist die sprachliche Repräsentation des Begriffs; wir können sie aufschreiben, laut aussprechen und zur Kommunikation über fachliche Inhalte verwenden. Manche Benennungen bestehen aus mehr als einem Wort, etwa „parallele Schnittstelle“ oder „parallele Schnittstelle mit asynchroner Datenübertragung“.
Obwohl Begriff (engl. concept) und Benennung (engl. term) im Deutschen sehr schöne transparente sprachliche Bezeichnungen sind (von „etwas begreifen“ und „etwas benennen“), wird in der Alltagskommunikation oft Begriff mit Benennung verwechselt: „mir fällt der Begriff nicht ein“ oder „englische Begriffe sollen modern klingen“. Hier wäre jedes Mal „Benennung“ statt „Begriff“ korrekt. Auch eine automatische Übersetzung mit deepL zeigt den falschen Gebrauch der terminologischen Terminologie (Inf. 01).
Übersetzung mit DeepL |
Inf. 01 |
Im semiotischen Dreieck in Abbildung 01 ist die Linie zwischen Gegenstand und Benennung gestrichelt. Dies soll deutlich machen, dass es im Normalfall keine direkte Beziehung zwischen dem Gegenstand und der Benennung gibt (auf der Maus steht nicht „Maus“). Die Zuordnung erfolgt über den Begriff. Das heißt, wir erkennen den Gegenstand als Maus und wissen, dass wir diese Art von Gegenstand als „Maus“ benennen.
Was lernen wir daraus?
Will man das fachliche und auch fachsprachliche Wissen eines Unternehmens oder einer Organisation verwalten, so setzt man heute IT-Anwendungen ein. Die terminologischen Daten werden in Termbanken gespeichert und mit Terminologieverwaltungs- oder Terminologiemanagementsystemen erfasst, bearbeitet, verbreitet und genutzt.
Ein schwieriger Start
Zu den Anfangszeiten der rechnergestützten Terminologieverwaltung wurde häufig ein benennungsorienterter, eher nach lexikographischen Prinzipien ausgerichteter Ansatz verfolgt. Man versuchte, die etablierten, meist ein- oder zweisprachigen gedruckten Wörterbücher mit Hilfe der IT „nachzubauen“. Bei dieser Ausrichtung werden in einem terminologischen Eintrag alle Informationen zu einer Benennung untergebracht, einschließlich grammatischer Angaben, Kontext, aber auch unterschiedliche Bedeutungen mit den jeweiligen Erklärungen. Synonyme (mehrere Benennungen für den gleichen Begriff) werden in eigenen Einträgen verwaltet und verweisen (eventuell) auf die Hauptbenennung. Es hat sich gezeigt, dass benennungsorientierte Terminologiesammlungen nicht für die mehrsprachige Terminologieverwaltung geeignet sind, auf Dauer nicht konsistent gehalten werden können und nicht für ein modernes wissensbasiertes Terminologiemanagement einsetzbar sind. Der Grund ist, dass Homonyme bzw. Polyseme (eine Benennung für mehrere Begriffe) zusammen und Synonyme getrennt verwaltet werden.
Begriffsorientierte Verwaltung
Da sich Terminologiearbeit aber immer an dem in einem Fachgebiet oder einer Organisation vorhandenen begrifflichen Wissen und den begrifflichen Zusammenhängen orientiert, muss auch die Konzeption einer Terminologiemanagementlösung eher dem begrifflichen Ansatz folgen. Deshalb ist die Begriffsorientierung heute eine Anforderung, die alle modernen Terminologieverwaltungssysteme erfüllen sollten. Der begriffsorientierte Ansatz bedeutet, dass alle terminologischen Informationen zu einem Begriff einschließlich aller Benennungen in allen Sprachen und einschließlich aller benennungsbezogenen und administrativen Metadaten in genau einem terminologischen Eintrag verwaltet werden müssen. Synonyme werden im gleichen Eintrag verwaltet, Homonyme bzw. Polyseme werden in getrennten Einträgen abgelegt.
Eine ähnliche Organisation des sprachlichen Wissens finden wir auch in (den meisten) Wörterbüchern, des fachlichen Wissens dagegen in Enzyklopädien. Zwei Web-Anwendungen aus der Wiki-Familie dienen als Beispiel: Wiktionary (de.wiktionary.org) und Wikipedia (de.wikipedia.org).
Wiktionary ist als Wörterbuch lexikographisch konzipiert und zeigt in einem Eintrag alle Informationen zu einem Wort; dazu gehören Wortart, Genus, Flexionsmuster, Aussprache, Etymologie sowie alle Bedeutungen. Wikipedia dagegen ist begrifflich organisiert, da dort allgemeines, aber auch fachliches Wissen abgerufen werden kann. In einem Eintrag finden wir alle Informationen zu einem Begriff, oft einschließlich mehrerer Benennungen (Synonyme), die den Begriff bezeichnen. Da bei Wikipedia der Zugang zu den Einträgen über Suchwörter (Benennungen) erfolgt, wird bei Mehrdeutigkeiten ein Begriffsklärungseintrag angezeigt. Daraus kann der Suchende den richtigen, dem Suchwort entsprechenden Begriffseintrag auswählen.
Abbildung 02 und 03 zeigen die unterschiedlichen Konzeptionen eines lexikalischen, wortorientierten und eines terminologischen, begriffsorientierten Ansatzes. Abbildung 04 verfeinert den begriffsorientierten Ansatz noch einmal für die präskriptive Terminologiearbeit, bei der ein Unternehmen oder eine Organisation eine bevorzugte Benennung pro Begriff festlegt; alle anderen synonymen Benennungen sind entweder verboten oder (zur Not) erlaubt.
Abb. 02 Lexikalischer, wort- bzw. benennungsorientierter Eintrag.
Abb. 03 Terminologischer, begriffsorientierter Eintrag
Abb. 04 Präskriptiver terminologischer Eintrag
Quelle Klaus-Dirk Schmitz
Um den begriffsorientierten Ansatz bei der Terminologieverwaltung zu verstehen, ist es wichtig, dass man den terminologischen Eintrag, der alle Informationen zu einem Begriff und zu allen seinen Benennungen enthält, als logische Einheit sieht. Wird die Terminologieverwaltung technologisch umgesetzt, dann wird diese logische Einheit auf mehrere physikalische Datensätze verteilt. So lässt sich eine (beliebige) Wiederholbarkeit von Sprachen und Benennungen realisieren. Dies ist auch der Grund, warum eine „Terminologielösung“ mit einer Excel-Tabelle nicht funktionieren kann, wenn man versucht, alle Informationen zu einem Begriff in einer Zeile unterzubringen.
In der praktischen Terminologiearbeit können und müssen nicht immer gleichzeitig alle terminologischen Informationen zu einem Begriff in einem Eintrag erfasst werden. Definitionen, weitere (synonyme) Benennungen, zusätzliche Sprachen oder sonstige Metadaten können am Anfang fehlen und später nachgetragen werden, ohne das Prinzip der Begriffsorientierung zu verletzen. Wichtig ist aber, dass weitere Benennungen (Synonyme, Kurzformen, Schreibvarianten, abgelehnte Benennungen) zum gleichen Begriff nicht als neue Einträge gespeichert, sondern in den existierenden Begriffseintrag aufgenommen werden. Viele Terminologieverwaltungssysteme unterstützen den Nutzer bei der Einhaltung der Begriffsorientierung und weisen ihn darauf hin, wenn er Informationen zu einem Begriff in unterschiedlichen Einträgen ablegen will; ebenso stehen oft Routinen bereit, um Dubletten zu finden. Die Routinen entdecken Eintragskandidaten, die die Begriffsorientierung zu verletzen scheinen und bieten sie zur Harmonisierung an.
Wichtige Teile eines unternehmensweiten Terminologiemanagements sind neben der Erarbeitung, Verwaltung und Bereitstellung der Terminologie auch die Terminologieextraktion aus Texten und die Kontrolle der korrekten Terminologieverwendung in Texten. Die begriffsorientierte Terminologieverwaltung ist eine unabdingbare Voraussetzung für eine automatische Terminologiekontrolle. Nur so können (bevorzugte) Benennungen vorgeschlagen werden, wenn im Text eine falsche (abgelehnte) Benennung verwendet wurde; die bevorzugte und die abgelehnte Benennung befinden sich im gleichen begriffsorientierten terminologischen Eintrag, sind im Sinne der präskriptiven Terminologiearbeit klassifiziert und können deswegen im Text erkannt und korrigiert werden. Anders verhält es sich bei der Terminologieextraktion. Während automatische Verfahren oft potenzielle fachsprachliche Benennungskandidaten im Text identifizieren können, muss die Überführung in begriffsorientierte terminologische Einträge durch den Menschen erfolgen; Synonyme, Schreibvarianten und Kurzformen werden von Extraktionsprogrammen zwar identifiziert, aber als unterschiedliche Einheiten betrachtet, ohne begriffliche Zusammenhänge zu erkennen.
Prinzip der Benennungsautonomie
Eng verbunden mit der Begriffsorientierung ist die Benennungsautonomie. Damit ist sichergestellt, dass alle Typen von Benennungen (zum Beispiel Vorzugs-/Hauptbenennung, Synonym, Schreibvariante oder Kurzform) als eigenständige Elemente des terminologischen Eintrags betrachtet werden und jeweils mit einer Reihe von (abhängigen) Metadaten (Datenkategorien) dokumentiert werden. Beispiele für diese benennungsbezogenen abhängigen Datenkategorien sind etwa Informationen zur Grammatik (Wortart, Genus, Numerus), zur Sprach- bzw. Stilebene, zum regionalen Gebrauch, zum Kunden, zur Produktlinie oder Kontextbeispiele. Auch mit der Art (etwa Vollform oder Kurzform) oder dem normativen Status (bevorzugt, erlaubt, abgelehnt) kann die Benennung weiter beschrieben werden. Die mögliche Anzahl dieser den gleichen Begriff repräsentierenden Benennungen und damit der eigenständigen „Benennungsblöcke“ darf nicht begrenzt sein, da man nicht voraussehen kann, wie viele Benennungen zu einem Begriff in jeweils einer Sprache erfasst werden müssen.
Durch die Benennungsautonomie ist es beispielsweise möglich, alle folgenden deutschsprachigen Benennungen in einem terminologischen Eintrag zu verwalten und mit Metadaten zu charakterisieren; alle Benennungen repräsentieren zwar denselben Begriff, unterscheiden sich aber in ihrer sprachlichen Verwendung:
- Fahrrad (Vollform, bevorzugt)
- Zweirad (Vollform, Quasisynonym, abgelehnt)
- Rad (Kurzform, erlaubt)
- Drahtesel (umgangssprachlich, abgelehnt)
- Stahlross (umgangssprachlich, abgelehnt)
- Velo (Schweiz, erlaubt)
- Veloziped (veraltet, abgelehnt)
Terminologieverwaltungssystemen und Termbanken, die neben der Benennung eigene Datenkategorien für Synonyme oder Abkürzungen haben, fehlt meist die Benennungsautonomie; neben Problemen der Datenelementarität (bei mehreren Synonymen oder Abkürzungen) können Synonyme und Abkürzungen nicht weiter mit abhängigen Datenkategorien wie Genus, Stilebene oder Status dokumentiert werden.
Das terminologische Metamodell
Begriffsorientierung und Benennungsautonomie finden sich auch als Gestaltungselemente im terminologischen Metamodell wieder. Dieses Modell wurde im „Technischen Komitee TC37“ der ISO bei der Erarbeitung der ersten Normen zum Austausch terminologischer Daten entwickelt und später verfeinert, um eine modellhafte Strukturbeschreibung terminologischer Datenbestände und Datenbanken zu erhalten.
Das terminologische Metamodell, das formal in Abbildung 05 dargestellt ist, sagt aus, dass ein terminologischer Datenbestand im Wesentlichen aus drei bzw. vier Ebenen besteht: der Eintrags- oder Begriffsebene (Terminological Entry), der Sprachebene (Language Section) und der Benennungsebene (Term Section). Die vierte und „unterste“ Ebene (Term Component Section), die man vereinfacht auch als Wortebene bezeichnen könnte und die Teile einer möglichen (Mehrwort-)Benennung weiter beschreibt, ist bei fast allen bekannten Terminologiebeständen und Terminologieverwaltungssystemen nicht realisiert.
Abb. 05 Terminologisches Metamodell [2].
Allen Ebenen des Metamodells sind Metadaten (Associated Information) zugeordnet. Diese unterteilen sich in verwaltungstechnische Daten (Administrative Data) wie Datum, Autor oder Status und beschreibende Daten (Descriptive Data) wie Definition, Anmerkung oder Genus. Die Metadaten werden auch terminologische Datenkategorien genannt, entsprechen in einer Termbank den Datenfeldern und sind in einem Data Category Repository (DCR) aufgelistet. Es kann über die Internetseiten datcatinfo.net oder direkt über datcatinfo.termweb.se aufgerufen werden, am besten mit dem Filter „Terminology Profile“.
Die Begriffsorientierung ist im Metamodell daran zu erkennen, dass alle Informationen und alle Sprachen am terminologischen Eintrag und damit an der Begriffsebene hängen; die Benennungsautonomie zeigt sich im Modell dadurch, dass jeweils nur eine Benennung (Term) der Benennungsebene zugeordnet werden kann; weitere (synonyme) Benennungen erfordern eine Wiederholung der Benennungsebene und erlauben so, die weitere Benennung mit Metadaten zu dokumentieren.
Die Struktur eines terminologischen Eintrags auf der Basis des Metamodells kann auch etwas konkreter dargestellt werden, wie Abbildung 06 zeigt.
Je nach Zielsetzung, Anwendung und organisatorischem Umfeld der Terminologielösung werden den drei Ebenen des terminologischen Eintrags unterschiedliche Metadaten bzw. terminologische Datenkategorien (Abb. 06) zugeordnet. Diese Datenkategorien dienen der Dokumentation der terminologischen Informationen und ermöglichen den Austausch sowie die Abfrage terminologischer Daten.
Abb. 06 Struktur des terminologischen Eintrags. [3]
Neben administrativen Datenkategorien wie Bearbeitungsstatus oder Eintrags-/Begriffsnummer werden vor allem das Fachgebiet und die Abbildung auf der Eintrags-/Begriffsebene angeordnet. Die Definition (mit zugehöriger Quellenangabe) wird in der Regel der Sprachebene zugeordnet. Auch wenn die Definition den Begriff beschreibt und damit eher zur Begriffsebene gehört, will man doch die Definition in mehreren Sprachen im Eintrag speichern, weshalb sich hier die Sprachebene anbietet. Die meisten Datenkategorien findet man auf der Benennungsebene; dies sind neben den grammatischen Angaben wie Genus, Wortart und Numerus vor allem Metadaten, die die Verwendung beschreiben: Angaben zum Typ der Benennung, zur Sprach-/Stilebene, zur regionalen Verwendung, zur Gebräuchlichkeit oder auch zur normativen Verwendung (bevorzugt, erlaubt, abgelehnt). Auf allen Ebenen findet man Anmerkungen bzw. weitere verwaltungstechnische Metadaten.
Wird eine Terminologiedatenbank so konzipiert, dass die beschriebenen Prinzipien der Begriffsorientierung und Benennungsautonomie umgesetzt sind, folgt der Entwurf dem terminologischen Metamodell und stammen alle terminologischen Datenkategorien aus dem Data Category Registry (datcatinfo.net), so ist nicht nur ein den Best-Practices und Normen entsprechendes und nachhaltiges Terminologiemananegement sichergestellt; die terminologischen Daten können auch leicht mit anderen Anwendern oder anderen Anwendungen mittels TBX (TermBase eXchange = ISO 30042:2019) ausgetauscht werden.
Literatur zum Beitrag
[1] Schmitz, Klaus-Dirk (Hrsg.) (2017): Normen für Übersetzer und Technische Redakteure. Berlin: Beuth.
[2] Drewer, Petra; Schmitz, Klaus-Dirk (2017): Terminologiemanagement: Grundlagen – Methoden – Werkzeuge. Heidelberg: Springer Vieweg (Kommunikation und Medienmanagement).
[3] Arntz, Reiner; Picht, Heribert; Schmitz, Klaus-Dirk (2014): Einführung in die Terminologiearbeit. 7., vollst. überarb. und akt. Auflage. Hildesheim: Olms.
Literatur zum Weiterlesen
DTT = Deutscher Terminologie-Tag e.V. (Hrsg.) (2016): Terminologiearbeit – Best Practices 2.0. Köln: Deutscher Terminologie-Tag e.V. (auch engl. Version 2020 verfügbar).
Schmitz, Klaus-Dirk; Straub, Daniela (2016): Erfolgreiches Terminologiemanagement im Unternehmen. 2. aktualisierte Auflage. Stuttgart: tekom. (auch engl. Version 2018 verfügbar).Übersetzung mit deepL