Mit künstlicher Intelligenz zur Definition

Text: François Massion

Eine Produktinformation lässt sich mit einer Definition einordnen und anwenden. Bislang ist für das Erstellen von Definitionen menschliches Fachwissen nötig. Kommt allerdings künstliche Intelligenz zum Einsatz, dann werden die Aufgaben rund um die Definition neu verteilt.

Inhaltsübersicht

Lesedauer: 15:33 Minuten

Definitionen sind ein fester Bestandteil der Technischen Kommunikation. Wichtige Begriffe werden in Bedienungsanleitungen erklärt, Übersetzer fragen nach der Bedeutung bestimmter Fachbegriffe, Verbraucher beschreiben ihre Probleme dem technischen Support in ihren eigenen Worten, oder Firmenwebsites bieten ein Glossar mit wichtigen Begriffen. Meist erfolgt die Erstellung von Definitionen sporadisch und nach Bedarf, und das Ergebnis ist von unterschiedlicher Qualität. Woran liegt das? Warum gibt es in vielen Unternehmen keinen standardisierten Workflow für die systematische und konsistente Erstellung von Definitionen?

Jeder Terminologe weiß, dass das Verfassen einer guten Definition Recherchearbeit ist, die viel Zeit, Fachwissen und Erfahrung erfordert. In der Praxis sind dies die Schwachstellen, die in vielen Unternehmen zu finden sind. Oft fehlen die Ressourcen, um die „Corporate Language“ richtig und vollumfänglich zu definieren.

Bringen künstliche Intelligenz und insbesondere die generative KI (GenAI) die erhoffte Lösung? GenAI ist in der Lage, menschenähnliche Texte zu generieren und zu verstehen. Kann sie auch gute Definitionen generieren? Das möchten wir hier feststellen.

Festlegen einer Vorgehensweise

Zunächst müssen wir definieren, was wir von GenAI genau erwarten und welche Qualitätskriterien eine gute Definition erfüllen muss. Es gibt verschiedene Arten von Definitionen, die üblicherweise von Terminologen und Lexikografen verwendet werden. Dabei handelt es sich hauptsächlich um drei Definitionstypen:

  • Die Inhaltsdefinition listet die wesentlichen Merkmale eines Begriffs auf.
  • Die Umfangsdefinition zählt die konkreten oder abstrakten Objekte auf, die der Begriff umfasst.
  • Die Bestandsdefinition erklärt die einzelnen Komponenten oder Elemente, die zusammen einen bestimmten Begriff bilden.

Auch wenn im Bereich der Technischen Kommunikation gelegentlich andere Definitionsvarianten vorkommen, werden wir uns hier auf die weitverbreitete Inhaltsdefinition konzentrieren.

Nachdem wir im Laufe des Artikels die wichtigsten Kriterien für eine gute Definition genannt haben, werden wir auch einige spezifische Herausforderungen erwähnen, die eine gute Definition lösen muss.

Kriterien einer guten Definition

Fassen wir zunächst die wesentlichen Anforderungen an Definitionen zusammen. [1] Eine Definition muss kurz (ein Satz), prägnant und zielgruppengerecht sein. Wie eine Definition aussehen sollte, zeigt Abbildung 01. Sehen wir uns das Muster (abb. 01) genauer an:

  • Am Anfang der Definition steht optional das Fachgebiet oder der Gültigkeitsbereich (zum Beispiel Adhäsion ).
  • Die Definition sollte mit einem Oberbegriff beginnen und den definierten Begriff in ein Begriffssystem einordnen können, falls ein solches existiert.
  • Nach dem Oberbegriff folgen die Hauptmerkmale, die den definierten Begriff ausmachen.

Dazu ein Beispiel für eine komplette Definition: Maus: (Informatik) handgehaltenes Eingabe- und Steuergerät, das zur Interaktion mit Software über einen Bildschirm verwendet wird.

Darstellung des Aufbaus einer Definition.
Abb. 01 Nach diesem Muster sollte eine Definition aufgebaut sein. Quelle François Massion

Herausforderungen beim Definieren

Eine gute Definition zu schreiben, ist auch nach diesen Regeln nicht so einfach. Erfahrene Terminologen können ein Lied davon singen. Was bedeutet das für die KI? Und welchen Herausforderungen muss sie sich stellen?

Wahl des Oberbegriffs: Der Oberbegriff ist nicht automatisch der nächsthöhere Begriff. Vielmehr muss es der Oberbegriff sein, der den zu erklärenden Begriff am besten repräsentiert. Zum Beispiel sollte für Rhizobien (=Knöllchenbakterien) nicht unbedingt der nächstbeste Oberbegriff Hyphomicrobiales gewählt werden. Dieser ist noch zu spezifisch, um die Beschaffenheit von Rhizobien zu verstehen. Kann eine künstliche Intelligenz diese Auswahl treffen?

Selektion relevanter Merkmale: Welche Merkmale sind für den jeweiligen Begriff relevant und sollen in der Definition berücksichtigt werden? Für die Definition eines Prozesses sind andere Merkmale erforderlich als für die Definition einer Maschinenkomponente oder einer Finanzkennzahl. Bekannte Merkmale, die bereits im Oberbegriff enthalten sind, brauchen nicht wiederholt zu werden. Darüber hinaus gibt es wesentliche und unwesentliche Merkmale. Je größer die Anzahl der Merkmale, desto präziser ist die semantische Genauigkeit des Begriffs. Das wiederum reduziert den Umfang der konkreten oder abstrakten Objekte, auf die sich ein Begriff bezieht.

Definition und Zielgruppe(n): Vor allem in großen Organisationen und Unternehmen haben Nutzer aus verschiedenen Bereichen Zugang zur Terminologie. Das Vorwissen und die Szenarien, in denen die Terminologie und damit auch die Definitionen verwendet werden, können sehr unterschiedlich sein. Beispielsweise benötigen Ärzte und Patienten oder auch Softwareentwickler und Softwarenutzer unterschiedliche Informationen, um denselben Begriff zu verstehen.

Um die Kommunikation und Interaktion zwischen diesen Nutzergruppen zu erleichtern, können in solchen Fällen zwei oder mehr Definitionen für ein und denselben Begriff formuliert werden, wenn dies nicht anders möglich ist. Einige Terminologieverwaltungssysteme ermöglichen es, je nach Benutzergruppe, unterschiedliche Informationen anzuzeigen.

Beschreibende und vorschreibende Definitionen: Definitionen werden in der Regel verwendet, um ein möglichst breites Verständnis eines Begriffs zu erreichen. Die gewählten Merkmale sollten das widerspiegeln, was die Menschen unter dem Begriff verstehen. Meistens handelt es sich dabei um beschreibende Definitionen.

In der Fachterminologie, sei es in der Wissenschaft, im Recht oder in der Technik, werden jedoch häufiger vorschreibende (präskriptive) Definitionen verwendet, um den Umfang und die Verwendung von Begriffen einzuschränken. Eine typische Verwendung dieser Art von Definitionen findet sich in der Normung oder in der Rechtssprache.

Kontextabhängige Definitionen: Es gibt Begriffe, die die gleichen Merkmale und Eigenschaften haben, aber je nach Kontext anders definiert oder kategorisiert werden können. Zum Beispiel können ein Sensor oder ein Motor unterschiedliche Verwendungen in einem Unternehmen haben und erfordern daher unterschiedliche Definitionsmerkmale.

Ist eine Definition in allen Sprachen gleich? Eine der größten Herausforderungen für Terminologen ist die Erstellung einer mehrsprachigen Terminologie. Multinationale Unternehmen operieren oft in 20 bis 30 Sprachen und entwickeln ihre Terminologie entsprechend.

Obwohl die meisten Begriffe in allen Sprachen gleich definiert werden können, gibt es Fälle, in denen es wesentliche Unterschiede in der Bedeutung gibt. Für diese Unterschiede besteht eine Reihe von Gründen. Beispielsweise werden Fahrzeugkategorien in verschiedenen Wirtschaftsräumen unterschiedlich definiert und geordnet, so dass nicht immer eine exakte Übereinstimmung zwischen den Begriffen vorhanden ist. Oder es gibt eine Realität, die in einigen Ländern nicht oder in anderer Form existiert, wie zum Beispiel die Kapselhotels in Japan. Während also die Definitionen gleich sind (zum Beispiel eine Steckdose oder ein Frühstück), können die Objekte, auf die sich die Definition bezieht, sehr unterschiedlich sein.

Der ideale Ansatz besteht darin, die Begriffe zunächst in jeder Sprache separat zu definieren und diese dann zu vergleichen. In der Praxis ist dies jedoch schwierig, wenn die Terminologie umfangreich ist. Viele Unternehmen definieren daher eine Basissprache (Leitsprache) und passen die Begriffe in den anderen Sprachen an. Möglicherweise dokumentieren sie die semantischen Unterschiede in den anderen Sprachen. So könnte in einer Terminologiedatenbank der Begriff Hochschule definiert und seine US-amerikanischen Teiläquivalente wie Community college mit entsprechenden Erklärungen versehen werden.

Eine besonders spannende Frage ist daher, inwieweit künstliche Intelligenz dazu beitragen kann, Bedeutungsunterschiede von Begriffen in mehrsprachigen Datenbanken zu erkennen und zu berücksichtigen.

Definitionen mit KI generieren

KI existiert in verschiedenen Formen. In diesem Artikel untersuchen wir Large Language Models (LLM) wie zum Beispiel GPT-4. Diese stellen eine Teilmenge der Foundation Models dar und sind Teil der GenAI (generative künstliche Intelligenz). KI bezieht sich hier also auf LLMs und generative KI. LLMs haben Sprache gelernt, indem sie Millionen von Texten analysierten und kontextuelle Beziehungen erkannt haben.

Sobald ein Modell trainiert wurde, wird es eingesetzt, um Texte zu generieren. Dabei erstellen die Algorithmen neue Texte sequenziell, Wort für Wort. Die Wahl des jeweils nächsten Wortes im generierten Satz hängt von den Parametern und dem bisher generierten Kontext ab. Wenn ein Nutzer zum Beispiel in seiner Eingabe (Prompt oder Frage) auch nur ein einziges Wort ändert, kann das zu völlig anderen Antworten des Modells führen, da die KI den Kontext neu interpretiert.

Erstellen eines Prompts

Für die KI benötigen wir ein Definitionsmodell mit klaren und verständlichen Kriterien. Was können wir im Hinblick auf die genannten Anforderungen von der KI erwarten?

Fragt man ein KI-System wie ChatGPT einfach nach der Definition eines Begriffs, wird es in den meisten Fällen eine lange Definition mit einer oft sehr nützlichen Erklärung liefern. Dies ist jedoch weit entfernt von einem Definitionsmodell, wie man es in spezialisierten Terminologien findet. An dieser Stelle kommen Prompts ins Spiel. Ein Prompt enthält genaue Anweisungen für ein generatives System wie ChatGTP. Er gibt genau vor, welche Informationen das Modell zurückgeben soll, in welcher Form, für welche Zielgruppe, wie lang die erwartete Definition sein soll und vieles mehr.

Inhalt des Prompts

Um zu wissen, was in einem Prompt stehen soll, hilft es, zuerst einige Definitionen zu analysieren, die für das eigene Terminologieprojekt repräsentativ sind. So ist es möglich, die relevanten Parameter zu identifizieren, die mit dem Thema, der Zielgruppe, der Art des Begriffs (konkret oder abstrakt) und anderen Aspekten zusammenhängen. Das führt zu Beobachtungen wie diesen:

  • Komponenten, Techniken und Prozesse spielen im Maschinenbau und in den Ingenieurwissenschaften eine wichtige Rolle.
  • Bei Prozessen sind Merkmale wie Voraussetzungen, Schritte, Ressourcen, Zeitabläufe, Methoden und Ergebnisse von Interesse. Beispiel: Sintern: Ein Prozess, bei dem Materialien unter Hitze verdichtet werden, ohne zu schmelzen.
  • Bei der Definition von Objekten sind physische Eigenschaften wie Größe, Form und Material sowie ihre Funktion und ihr Verwendungsort wichtig.
  • Bei abstrakten Begriffen sind Merkmale wie Bezug zu Theorien, Kontext, Prinzipien, Position in einem Klassifikationssystem, Prozess, Verwendungszweck und Anwendungsbereich relevant. Beispiel: Generative künstliche Intelligenz (GenAI): Oberbegriff für KI-Systeme, die menschenähnliche Inhalte generieren können.

Tabelle 01 zeigt ein Beispiel eines GPT-4 Prompts. Darin hat die Zielgruppe einen wesentlichen Einfluss auf die Definition.

Tabelle zum Einfluss der Zielgruppe aufgeteilt nach Begriff, Zielgruppe und Definition.
Tab. 01 Quelle François Massion

Es empfiehlt sich, nicht mit einem einzigen Prompt zu arbeiten. Vielmehr bietet sich eine überschaubare Liste von Prompts an. Diese sind auf typische Definitionsobjekte zugeschnitten.

Jedes Wort zählt

Wie wir gesehen haben, besteht die Funktionsweise der generativen KI nicht so sehr aus präzisen Regeln, sondern aus mathematischen Formeln und Algorithmen, die die Abfolge von Wörtern in einem gegebenen Kontext bestimmen. So kann die einfache Änderung eines Wortes in einem Prompt einen starken Einfluss auf die generierten Sätze haben. Für die Praxis ist es daher nützlich, mit der Formulierung eines Prompts zu experimentieren, bevor man ihn regelmäßig verwendet (Inf. 01).

Prompt-Beispiel

Du bist Terminologe/in und erstellst Definitionen von {Fachbegriff}.

Anweisungen:
Die Definition sollte maximal 30 Wörter umfassen und auf die {Zielgruppe} zugeschnitten sein.

Die Definition sollte mit einem geeigneten
Oberbegriff beginnen und sich auf die
wichtigsten Merkmale wie Funktionalität,
Form, Material, Methode, Prozesse, Zeitablauf
und Einflussfaktoren konzentrieren.
Gib bei Bedarf die {Quelle} für Deine
Informationen an.

Beispiel:

Definiere {Touchscreen} für die Zielgruppe
{Technische Redakteure}.

Deine Antwort:

Touchscreen: berührungssensitiver Bildschirm, der die Auswahl von Befehlen aus einem Menü oder anderen angezeigten Daten durch Berührung
der entsprechenden Bildschirmposition mit dem Finger oder einem spitzen Gegenstand erlaubt. Quelle: Gabler Wirtschaftslexikon

Inf. 01 Quelle François Massion

Eigene Referenzen heranziehen

Es ist sinnvoll, der KI Referenzmaterial wie technische Handbücher, Normen und Webseiten zur Verfügung zu stellen. Dieses Verfahren wird als „Retrieval Augmented Generation“ (RAG) bezeichnet. Auf diese Weise kann die KI Definitionen erstellen, die näher an der Verwendung der physischen oder abstrakten Objekte eines Unternehmens angelehnt sind. Das ist besonders für vorschreibende Definitionen vorteilhaft. Das folgende Beispiel zeigt die allgemeine und die unternehmensspezifische Definition eines Absperrventils:

  • Allgemeine Variante: Eine Vorrichtung in Rohrleitungssystemen, die dazu dient, den Durchfluss von Flüssigkeiten oder Gasen vollständig zu stoppen, z.B. für Wartungsarbeiten oder im Notfall.
  • Spezifische Variante (nach RAG): Eine Vorrichtung mit einer korrosionsbeständigen Beschichtung, die extremen Temperaturen und Drücken standhält und den Gasfluss mit einer Schnelllösefunktion stoppt.

Auswerten und Verbessern

Wie genau und zuverlässig sind KI-Definitionen im Vergleich zu menschlichen Definitionen? Zur Überprüfung der Definitionsqualität gehören Punkte wie die Auswahl der Begriffsmerkmale, die Eignung für die Zielgruppe, die sprachliche Angemessenheit und Verständlichkeit, die Korrektheit der Quelle, die Länge der Definition oder die Vermeidung von erfundenen Fakten. Gehen wir in den nächsten Abschnitten auf einige dieser Aspekte ein.

Wenn KI halluziniert

Eine der größten Gefahren, auf die man achten muss, ist das Phänomen der Halluzinationen. Generative Engines wie LLMs arbeiten nicht wissenschaftlich oder methodisch, wie es bei Menschen der Fall wäre. Sie generieren auf der Basis von Algorithmen Wortfolgen, die manchmal völlig frei erfunden oder sinnlos sein können. Ein Beispiel wäre die von ChatGPT vorgeschlagene Definition für ein völlig erfundenes sinnfreies Wort wie in diesem Fall:

Definiere automatische Ventilablage (es folgen die Prompt-Definitionsregeln); Ergebnis (ChatGPT-3.5): eine computerbasierte Vorrichtung zur automatischen Steuerung und Überwachung von Ventilen in industriellen Anlagen und Prozessen, um Effizienz und Sicherheit zu verbessern.

Entdecken relevanter Merkmale

Kann KI Merkmale extrahieren und auflisten? Sind alle Textgenerierungsmodelle gleich? Modelle unterscheiden sich zum Beispiel in Bezug auf die Qualität des Outputs, die Nutzungskosten, die Größe des Kontexts und die Möglichkeit, eigene Daten zu verwenden. Am Beispiel von „Windenergie“ für die Zielgruppe „Öffentlichkeit“ können wir die Definition des Menschen mit den Definitionen verschiedener KI-Modelle vergleichen (Tab. 02). Keine Definition ist grundlegend falsch und keine berücksichtigt alle möglichen Merkmale des Begriffs.

Tabelle mit einem Überblick über Definitionsquellen und deren Ergebnisse für eine Definition.
Tab. 02 Quelle François Massion

Definieren in mehreren Sprachen

Die mehrsprachige Definitionsarbeit, genauer gesagt die Suche nach inhaltlichen Unterschieden zwischen Begriffen in mehreren Sprachen, wird in Unternehmen aufgrund des damit verbundenen Arbeitsaufwands nicht systematisch durchgeführt. Auch hier kann künstliche Intelligenz helfen, aber nur bei bestimmten Aspekten, wie die durchgeführten Tests zeigen.

In einem ersten Test haben wir Prompts in verschiedene Sprachen übersetzt und GPT-4 befragt. Das Ergebnis war, dass selbst bei sehr gebräuchlichen Begriffen die Definitionen inhaltlich nicht immer identisch waren. GPT-4 wird zum Beispiel bei Klimaanlagen das Merkmal Feuchtigkeitsregelung in Deutsch oder Englisch, das Merkmal Kühlung in Englisch oder Indonesisch oder das Merkmal Luftqualität in Chinesisch oder Griechisch berücksichtigen. Diese Unterschiede sind in erster Linie auf die gelernten Sprachmuster zurückzuführen, die für jede Sprache unterschiedliche Wortfolgen erzeugen. Einige Sprachen sind bei bestimmten LLMs unterrepräsentiert und können daher die vielen Facetten der Realität in einem Sprachraum (geschweige denn in einem Land) weniger gut widerspiegeln.

Eine bessere Möglichkeit, Begriffsunterschiede mit Hilfe der KI zu identifizieren, besteht darin, relevantes Referenzmaterial in jeder Sprache separat zu bewerten. Dabei handelt es sich zum Beispiel um Spezifikationen, Nomenklaturen oder Gesetze, die sich auf das jeweilige Thema beziehen.

Ein anderer Ansatz besteht darin, unter Angabe des Landes und der Sprache nach den Begriffen zu fragen, die am häufigsten mit dem zu definierenden Begriff in Verbindung gebracht werden. Beispielsweise wird eine Anfrage nach einem Begriff wie Smartphone in einem Land wie China Assoziationen wie Zahlungsmittel, WeChat oder QR-Code hervorrufen und in einem Land wie Algerien Assoziationen wie Mobiltelefon, (Geld-)Transfer oder Hotspot-Verbindung. Dies spiegelt die mehrheitliche Verwendung und das Verständnis dieses Begriffs in den jeweiligen Sprachen und Ländern wider. Die so gewonnenen Informationen können etwa in einem Terminologieverwaltungssystem neben einer Übersetzung der Definition in ein Feld Bedeutungsunterschied auf Sprach­ebene aufgenommen werden.

Die Erstellung automatisieren

Natürlich ist die Generierung von Definitionen mit Hilfe von KI nicht nur für den einmaligen Gebrauch interessant, sondern vor allem dann, wenn sie systematisch und teilautomatisiert erfolgt, zum Beispiel um Definitionslücken in größeren Terminologiedatenbanken zu schließen. Es versteht sich von selbst, dass eine vollständige Automatisierung ohne menschliche Intervention und Kontrolle genauso unsinnig und gefährlich ist wie die automatische Übersetzung von Unternehmensdokumenten ohne Post-Editing.

Die Komponenten einer solchen Lösung sind einerseits technischer Natur (welche Software und Infrastruktur). Andererseits betreffen sie Prozesse und Sprachen.

Grundsätzlich ist es notwendig, Zugang zu einem Sprachmodell (LLM) zu haben, vorzugsweise über eine API. Außerdem ist es wünschenswert, dass der Zugang über eine Benutzerschnittstelle erfolgt. Diese hat die Aufgabe, es den Nutzern zu ermöglichen, auf das Modell zuzugreifen und mit ihm zu interagieren. Für größere Lösungen, die etwa Zugriff auf eigene Daten ermöglichen sollen, bieten spezielle Plattformen wie Amazon Bedrock von Amazon Web Services (AWS), Microsoft Azure und Vertex AI auf der Google Cloud Platform (GCP) einen direkten Zugang zu LLMs und Datensicherheit (Abb. 02).

Screenshot der Oberfläche von Vertex AI.
Abb. 02 Erstellen einer Definition mit Vertex AI in der Google Cloud Console. Quelle François Massion

In Bezug auf Abläufe und linguistische Aspekte ist ein Workflow erforderlich, der den gesamten Zyklus der Definitionsproduktion abdeckt. Das fängt an bei der Datenvorbereitung, zum Beispiel der Auswahl von relevantem mehrsprachigem Referenzmaterial für die Definitionen, über die halbautomatische Kontrolle der Ergebnisse bis hin zum Feedback an das Prompt-Engineering, um die Erfahrungen für die Optimierung der verwendeten Prompts zu nutzen.

Prozess des Prompt-Engineerings

Beim Prompt-Engineering werden verschiedene Modelle und Modellkonfigurationen getestet und die Prompts so lange optimiert, bis die gewünschten Ergebnisse erzielt werden. Dabei werden die KI-generierten Definitionen mit Referenzdefinitionen verglichen. Bei den Optimierungsversuchen ist es hilfreich, den Wortlaut der Anweisungen zu variieren, etwa durch Ändern der Syntax oder durch Einfügen von Synonymen. Abbildung 03 zeigt schematisiert den Prozess der Entstehung von Terminologie sowie die Suche nach Äquivalenten in Fremdsprachen. Daran orientiert sich das Prompt-Engineering.

Schema zeigt die Schritte für das Erstellen von Terminologie und das Erstellen einer Übersetzung.
Abb. 03 Beispielhafter Prozess der Terminologieerstellung. Quelle François Massion

Teilautomatische Qualitätssicherung

Ein absolut unverzichtbarer Schritt bei der Automatisierung der Produktion von Definitionen mit Hilfe von generativer KI ist die Qualitätskontrolle. Als letzte Instanz kommt der Mensch zum Einsatz, um die Qualität der KI-generierten Definitionen zu überprüfen und sicherzustellen. Das Ziel ist aber, im Vorfeld die automatische Fehlererkennung zu perfektionieren. Inwiefern kann sich KI selbst korrigieren und optimieren?

Die Überprüfung der Definition betrifft zunächst rein formale Aspekte, wie die Länge der Definition, die in Anweisungen angegeben wurde. Diese Art der Überprüfung kann teilweise automatisiert werden, zum Beispiel mit regulären Ausdrücken.

Danach folgen sprachliche Aspekte wie die Überprüfung des vorgegebenen Definitionsmodells mit Oberbegriff gefolgt von Merkmalen, die zielgruppengerechte Wortwahl oder die Konsistenz von Fachbegriffen und Stil. Auch hier kann ein Teil automatisiert werden, zum Beispiel mit linguistischen Werkzeugen und einer Terminologieprüfung.

Der letzte Aspekt ist bei Weitem schwieriger und wichtiger, da hier der Inhalt der Definitionen überprüft werden muss. Es muss festgestellt werden, ob die Definitionen der Realität entsprechen, ob die notwendigen Merkmale des zu definierenden Begriffs berücksichtigt wurden und ob bestimmte Informationen falsch oder erfunden sind. Dazu bieten sich mehrere Möglichkeiten:

  • Eine Strategie in dieser Hinsicht ist, die KI zu bitten, die Semantik ihrer eigenen Definitionen zu überprüfen, etwa indem die KI eine neue Rolle als Lektorin zugewiesen bekommt. Dann wird sie per Prompt gefragt, ob bestimmte Aspekte der Definition (zum Beispiel die beabsichtigte Verwendung des Objekts) semantisch kohärent oder widersprüchlich sind.
  • Eine gut funktionierende effiziente Methode besteht darin, dem KI- Lektorat nur die Definition zu geben und es zu fragen, auf welches Objekt es sich bezieht. Wenn die Vorzugs­benennung oder ein Synonym nicht genannt werden, deutet dies auf mögliche Mängel in der Definition hin.

Ein kleiner Hinweis: Genau wie bei guten, von Menschen erstellten Definitionen gibt es auch bei KI-generierten Definitionen mehrere gute Varianten. Daher bedarf es einiger Übung, um bei der Validierung dieser Definitionen nicht in die Falle des Perfektionismus zu tappen und zu viel Zeit in die Auswahl oder Kombination von Definitionsvarianten zu investieren.

Analyse von Kosten und Nutzen

Lohnt sich der ganze Aufwand? Was bringt eine Erstellung von Definitionen mittels generativer KI, insbesondere im Hinblick auf die Zeit- und Ressourcenersparnis im Vergleich zu traditionellen Methoden? Da das gesamte Thema noch relativ neu ist, gibt es nur wenige oder gar keine praktischen Beispiele für diese Art der KI-Anwendung. Daher müssen wir hier ein wenig über den Return-on-Investment (ROI) spekulieren, zumal die Situationen und Erwartungen sehr unterschiedlich sein können.

Die Entscheidungsparameter für die Wirtschaftlichkeit einer KI-Lösung zur Erstellung von Begriffsdefinitionen sollten in zwei Kategorien unterteilt werden:

  • Schaffung der technischen Infrastruktur und damit Zugang zu den Modellen, Benutzeroberfläche, Entwicklung von Prompts und Training bestimmter Modelle sowie Prompts oder Skripte zur Qualitätskontrolle
  • regelmäßige Erstellung und Validierung der Definitionen

Die erste Komponente ist die Anfangsinvestition, die sich innerhalb von ein bis zwei Jahren amortisieren kann. Je nach Spezifikation kann es sich um einen vier- oder fünfstelligen Betrag handeln. Die zweite Komponente betrifft die manuelle Arbeit zur Validierung der von der künstlichen Intelligenz erstellten und geprüften Definitionen. Auch hier hängen die Schätzungen von einer Reihe von Faktoren ab. Bei technischen Definitionen kann man aber von einer Arbeitszeitersparnis von etwa 40 bis 50 Prozent im Vergleich zur manuellen Erstellung der Definitionen ausgehen.

Abgesehen von den rein monetären Aspekten ermöglicht die KI die Aufarbeitung von wesentlich umfangreicherem Referenzmaterial für die Erstellung von Definitionen. Dies kann bei der Suche nach Merkmalen oder Informationen, die die Qualität der Definitionen verbessern, sehr hilfreich sein. Darüber hinaus sparen solche Lösungen Zeit und senken die Hemmschwelle für die Erstellung von Definitionen in größerem Umfang.

Ein perfektes Team

Generative KI hat erst vor kurzem Einzug in die Welt der Übersetzung, Terminologie und Technischen Kommunikation gehalten. Sie hat bereits mehrfach ihr Potenzial zur Umgestaltung bestehender Prozesse unter Beweis gestellt.

Die Tests mit GenAI haben gezeigt, dass KI eine nützliche Lösung für die Terminologiearbeit ist, insbesondere wenn viele Definitionen benötigt werden. In vielen Fällen sind die Definitionen gut und den von Menschen erstellten gleichwertig. Zusammen mit der Nachbearbeitung der Definitionen bietet diese Lösung einen Zeit- und Kostenvorteil.

Was hier für die Erstellung von Definitionen veranschaulicht wurde, kann auch auf die Generierung von standardisierten Informationen wie Produktbeschreibungen und technischem Content angewendet werden. Dies unterstreicht das Ausmaß der Anwendbarkeit dieser generativen Technologien in der Technischen Kommunikation und eröffnet neue berufliche Perspektiven für alle, die in unserem Bereich arbeiten.

Literatur zum Artikel

[1] Drewer, Petra/Schmitz, Klaus-Dirk (2017): Terminologiemanagement: Grundlagen-Methoden-Werkzeuge. Springer-Verlag. Zum Thema „Definitionen“ S. 113 ff und 165 ff.

Außerdem

DIN 2330:2022-07: Terminologiearbeit – Grundsätze und Methoden in: Schmitz, Klaus-Dirk (2022). Normen für Terminologiearbeit, Technische Redaktion und Übersetzen. 2. überarbeitete und erweiterte Auflage 2022. DIN. Zum Thema „Definitionen“ S. 12 ff.

Auf einem Handteller liegt ein künstlicher roter Apfel.