Kaum ein Thema dürfte 2023 in der Technischen Kommunikation prominenter gewesen sein als künstliche Intelligenz. Sicherlich hat das mit der Veröffentlichung von ChatGPT Ende 2022 zu tun. Seither versuchen die Unternehmen verstärkt, KI in eigene Systeme zu integrieren und davon zu profitieren. Dies geschieht auch in der Übersetzungsbranche, so dass Übersetzungen zugänglicher geworden sind. Ermöglicht wird das durch einen ChatBot oder das direkte Erstellen der Texte in der Zielsprache.
Als Übersetzungsagentur, die ISO 18587-zertifiziert ist und Erfahrungen mit maschinellen Übersetzungen sowie Post-Editing hat, waren wir sehr daran interessiert, wie die Qualität einer solchen Übersetzung durch ChatGPT ausfällt. Zur selben Zeit stießen wir auf den Artikel „DeepL vs ChatGPT: Wer übersetzt besser?“ Darin wurden DeepL und ChatGPT verglichen und gegenübergestellt. Für diesen Vergleich wurden vier Texte aus dem Deutschen ins Englische und ins Spanische übersetzt und im Anschluss korrekturgelesen. Inspiriert von diesem Vergleich dachten wir uns: Wir würden dieses Experiment gerne mit unseren Fachübersetzern nachstellen. Wir entschieden uns für Französisch und Polnisch. Die Sprachen stammen aus unterschiedlichen Sprachfamilien – der romanischen und der slawischen.
Für diesen Vergleich wählten wir drei Textsorten aus den Fachgebieten Recht, Marketing und Technik aus. Der Rechtstext enthält unsere hauseigene Geheimhaltungsvereinbarung. Der Marketingtext besteht aus einer Aktion für die Mitarbeitenden eines Unternehmens, während die Textpassage aus dem Bereich Technik sich mit dem Transport und der Lagerung einer Maschine befasst. Jeder dieser Auszüge umfasst etwa 400 Wörter. Diese ließen wir von DeepL und ChatGPT vorübersetzen (Stand: Dezember 2023). Bei beiden Engines verwendeten wir die kostenpflichtige Version. Für die Übersetzung durch ChatGPT wurden drei ChatBots je nach Fachgebiet erstellt. Anschließend lautete die Arbeitsanweisung „translate from German to French“ für die französische Übersetzung und „translate from German to Polish“ für die polnische Übersetzung.
Für eine neutrale Auswertung wurde von der Verwendung von Terminologievorgaben abgesehen. Denn wir wollten ermitteln, wie beide Engines ohne jegliche Spezifikation agieren. Im Anschluss an die maschinelle Übersetzung evaluierten unsere muttersprachlichen Post-Editoren die Ergebnisse der beiden Engines. Hierbei wurden fünf Fehlerkategorien festgelegt:
- Konsistente Terminologie
- Korrektheit und Vollständigkeit
- Stil
- Sinnhaftigkeit
- Sprachkonventionen
Die Kategorie „Sprachkonventionen“ umfasst folgende fünf Unterkategorien:
- Grammatik
- Rechtschreibung
- Groß- und Kleinschreibung
- Interpunktion
- Zeitform
Die Fehler wurden nach der Gewichtung „leicht“, „mittel“ und „schwer“ unterschieden. Als Beispiel eines leichten Fehlers kann eine wörtliche Übersetzung dienen: Der Sinn wird verstanden, ein Muttersprachler würde es jedoch anders ausdrücken. Inkonsistente Terminologie oder grobe grammatikalische Fehler sind dagegen als „schwer“ einzuschätzen, da sie die Botschaft des Ausgangstextes verändern und am Beispiel einer Gebrauchs- oder Betriebsanleitung ein Risiko für Nutzerin und Nutzer darstellen.
In den nächsten Abschnitten präsentieren wir die Ergebnisse des Post-Editings. Zunächst befassen wir uns mit DeepL, im Anschluss mit ChatGPT. Die Reihenfolge der Textauszüge erfolgt nach der genannten Auflistung. In beiden Fällen wird zunächst Französisch und dann Polnisch betrachtet. Im Laufe der fortschreitenden Erfassung dieser Ergebnisse fallen bereits Gemeinsamkeiten sowie Unterschiede zwischen den Engines und Sprachen auf.
DeepL und Französisch
Unsere Übersetzerin bemerkte direkt, dass in dem Rechtstext bei der Vorübersetzung von DeepL ein Absatz nicht berücksichtigt wurde. Diese Inhalte fehlen in der Zielsprache. Ohne eine humane Überprüfung würde dies nicht festgestellt werden, und die Inhalte fehlen in der Übersetzung komplett.
Wie bereits erwähnt, wurde keiner der beiden Engines eine Vorgabe bezüglich der Terminologie gemacht. So lässt sich nachvollziehen, wie die Engines ohne jegliche Spezifikationen vorgehen. Beispielsweise wurde von DeepL „Auftragnehmer“ im Französischen mit „fournisseur“, „contractant“ und „preneur d’ordre“ übersetzt, was verwirrend ist. Die Engine verwendet ebenfalls bei dem Begriff „Auftraggeber“ Synonyme: „donneur d’ordre“ sowie „client“. Die Verwendung von Synonymen bei maschineller Vorübersetzung ist keine Seltenheit. Wenn jedoch betrachtet wird, dass das deutsche Wort „Kunde“ ebenfalls mit „client“ übersetzt wurde, wiegt diese Art der Inkonsistenz besonders schwer. Dementsprechend wurden der „Kunde“ und der „Auftraggeber“ in einem Textauszug von 400 Wörtern mit „client“ übersetzt.
Außerdem scheint DeepL Probleme zu haben, Kontext zu erkennen. So unterlief der Engine bei dem deutschen Ausgangstext „Dritte/n“ der Fehler, dass es das Wort mit „tiers(s)“ übersetzt hat. Dieses Wort existiert im Französischen nicht. Dort ist „tiers“ die Übersetzung von „Dritten“ und demnach bereits im Plural.
Die Problematik fehlender Kontexterkennung zeigt auch der Marketingtext. So wurden Sprüche als Sprichwörter und manche Begriffe, etwa „Leitbildordner“, wörtlich übersetzt, wie sie im Französischen eigentlich nicht existieren. Beispielsweise wurde „Du bist einfach MEGA!“ mit „Tu es tout simplement MEGA!“ übersetzt. Diese Formulierung existiert im Französischen nicht. Ebenso wurde das „Miteinander“, das auf das Klima innerhalb der Belegschaft verweist, als „Beziehung“ dargestellt. Das trägt allerdings nicht zum Textverständnis bei.
Bei Marketingtexten steht der Stil im Vordergrund. Leider gab es bei der maschinellen Übersetzung mitten im Text einen Stilbruch: DeepL hat vom Duzen auf das Siezen gewechselt. Grund hierfür ist, dass der Text nicht in seiner Gesamtheit bei der Übersetzung berücksichtigt wurde.
Bei der Übersetzung des Textes im technischen Bereich kam es zu ähnlichen Fehlern. So wurden Begriffe von der Engine nicht einheitlich und konsistent übersetzt, zum Beispiel „Speicherabschnitt“: Dieses Wort wurde mit „section de mémoire“, „section de l’accumulateur“, „section de stockage“ und „section mémoire“ übersetzt. DeepL hat also vier Varianten gewählt. Gerade bei technischen Texten ist eine konsistente Verwendung von Begrifflichkeiten essenziell. Solche Inkonsistenzen verwirren nicht nur die Zielgruppe, sondern können bei Gebrauchs- und Betriebsanleitungen auch schwerwiegende Folgen haben. Neben der Inkonsistenz hat sich außerdem ein Sinnfehler eingeschlichen: DeepL hat mit der Verwendung von „mémoire“ den Kontext geändert, da sich diese Art von Speicher im Französischen lediglich auf Computer bezieht und nicht, wie im Ausgangstext, auf den Transport von Gütern. Eine Übersicht der Fehler von DeepL zeigt Abbildung 01.
Abb. 01 Fehler von DeepL bei der Übersetzung ins Französische zusammengefasst für alle Textkategorien (Recht, Marketing und Technik). Quelle Pierangela Gullotta, Alexandra Kraus und Torsten Schulze
DeepL und Polnisch
Sehen wir uns wie bei der Analyse der französischen Übersetzung zunächst den Rechtstext an. Laut unserer Post-Editorin war die Übersetzung insgesamt korrekt. Doch haben sich auch hier einige Fehler eingeschlichen. So hat die Engine nicht zwischen den Begriffen „Auftraggeber“ und „Kunde“ unterschieden und beide Wörter mit „klient“ übersetzt. Grund dafür ist, dass die Kontexterkennung von DeepL zielsprachenunabhängig ist und die Sätze, wie bereits angemerkt, alleinstehend betrachtet werden. Die Folge ist, dass es in der Zielsprache zu keiner Unterscheidung zwischen den beiden Wörtern kommt und die Übersetzung einen gravierenden Fehler enthält.
Der Marketingtext hatte in der polnischen Übersetzung schwerwiegende Fehler. So gab die Engine die „tolle Urlaubsvertretung“ im Polnischen mit „świetnej wymiany wakacyjnej“ wieder. Das ist im Deutschen als „tolles Tauschgeschäft“ zu verstehen. Das Verb „verteilen“, das in diesem Kontext „aushändigen“ bedeutet, wird mit „dystrybucji“ übersetzt, zu Deutsch „verkaufen“. Ebenso wurde die Phrase „Hau rein!“ im Polnischen mit „Zagłęb się“ übersetzt, was „Verlier dich!“ bedeutet. Laut unserer Übersetzerin sind die meisten Sätze einigermaßen korrekt übersetzt, entsprechen aber in keiner Weise den Anforderungen an einen Marketingtext. Der Stil musste fast vollständig überarbeitet werden.
In der Übersetzung des technischen Textes tauchen zwei kritische Fehler auf, wobei einer erneut das Wort „Speicherabschnitt“ betrifft. Dieser Begriff, der im Ausgangstext mehrfach vorkommt, wurde unterschiedlich und damit inkonsistent übersetzt: „sekcję pamięci“, „część do przechowywania“ und „sekcji magazynowych“. Im Deutschen würde man dies als „Teil des Lagers“, „Teil zum Lagern“, jedoch auch „Teil des Computerspeichers“ verstehen. Interessanterweise ist in der Übersetzung ins Polnische demnach die Situation identisch mit der des Französischen: Die Engine hat den Speicherabschnitt in dem Kontext von Technologie interpretiert und deshalb in Verbindung zu Computern übersetzt. Wie im Französischen ist die Übersetzung in diesem Kontext nicht korrekt.
Der zweite gravierende Fehler besteht darin, dass die Phrase „außer Kraft setzen“ mit „ersetzen“ übersetzt wurde. So mussten im Ausgangstext „Sicherheitsfunktionen oder Endschalter […] außer Kraft gesetzt werden“. Im Output von DeepL jedoch müssen „Sicherheitsfunktionen oder Endschalter […] ersetzt werden“. Somit ändert sich der Sinn des Satzes im Polnischen. Eine Zusammenfassung der Ergebnisse zeigt Abbildung 02.
Abb. 02 Fehler von DeepL bei der Übersetzung ins Polnische zusammengefasst für alle Textkategorien (Recht, Marketing und Technik). Quelle Pierangela Gullotta, Alexandra Kraus und Torsten Schulze
ChatGPT und Französisch
Wie bei der Analyse der Ergebnisse von DeepL befassen wir uns zunächst mit dem Französischen, dann mit dem Polnischen. Ebenfalls untersuchen wir erst den Rechtstext, dann den Marketingtext und zuletzt den Text aus dem technischen Bereich.
In der Übersetzung des juristischen Textes fiel zunächst ein schwerwiegender inhaltlicher Fehler auf: Das Wort „Auftrag“ wurde mit „contrat“ („Vertrag“), statt mit dem Wort „commande“ übersetzt. An einigen Stellen der Übersetzung von ChatGPT wurde bemerkt: Die Übersetzung ist zwar nicht falsch, jedoch für diese bestimmte Textkonvention und in der Zielsprache unüblich.
Was den Marketingtext betrifft, so hat ChatGPT bei der Übersetzung einiger Wörter oder Redewendungen, die auch DeepL nicht optimal umsetzen konnte, Sinnfehler eingebaut. Das Wort „Sprüche“ wurde irrtümlich als „dicton“ (Sprichwörter) und nicht als „affirmation“ übersetzt. Beide Engines haben den Kontext nicht erkannt. Auch die Übersetzung des Wortes „Leitbildordner“ wurde nicht richtig gelöst, da die Übersetzung „dossier de valeur“ lautete. Die Fehlerursache ist, dass dieser Ausdruck in der französischen Sprache nicht existiert, so dass es für den Leser schwierig ist, die Bedeutung nachzuvollziehen. Die Redewendung „Viel Erfolg du Rakete“ hat ChatGPT mit der Verwendung des Wortes „Raket“ wörtlich wiedergegeben. Im Französischen kann eine Person jedoch nicht als „Rakete“ bezeichnet werden. Daher hätte ChatGPT in einem solchen Fall vom Ausgangstext abweichen und ein kulturelles Äquivalent wählen sollen.
Die Aussage „ein entspanntes Miteinander“ wurde gleichfalls nicht optimal übersetzt. In der Vorübersetzung wird „coexistence détendue“ eingesetzt, was nicht in den Zusammenhang des Arbeitslebens passt. Eine solche Übersetzung sollte anders formuliert werden, um die Botschaft idiomatischer zu vermitteln, etwa mit „pour vivre ensemble de manière détendue“. Darüber hinaus wurden grammatikalische Fehler festgestellt. Einige französische Begriffe, die dem männlichen Genus angehören, hat ChatGPT mit weiblichen übersetzt und Verbalkonstruktionen verwendet, die nicht existieren.
Da es in dem Marketingtext um das Versenden von positiver Rückmeldung geht, hat diese Passage eine E-Mail-Adresse. Während DeepL diese unverändert übernommen hat, wurde die Adresse von ChatGPT übersetzt. Bleibt ein solcher Fehler unbemerkt, werden E-Mails nicht an die korrekte Adresse versendet und die Aktion verfehlt sicherlich ihren Sinn und Zweck.
Einige terminologische Fehler fanden sich auch in der von ChatGPT durchgeführten Vorübersetzung des technischen Textes. Das Wort „Waschbenzin“ wurde wörtlich mit „essence de lavage“ übersetzt. Das ist im Französischen völlig unverständlich. Ein weiterer Fehler betrifft den Ausdruck „sachgerecht entsorgen“. Das Verb „entsorgen“ wurde mit dem falschen Freund „disposer“ übersetzt. Dies ist eine Lehnübersetzung aus dem Englischen („to dispose“). In Wirklichkeit bedeutet „disposer“ „anordnen“. Die korrekte Übersetzung wäre in diesem Kontext „eliminer“ gewesen.
Wie schon erläutert, erkennt ChatGPT den Kontext des gesamten Textes nicht. Der Begriff „Betriebsstoffzuleitungen“ wurde in einem Zusammenhang mit Leitungen sogar als „Treibstoff“ bezeichnet. Außerdem wurde „Speicherabschnitt“ fälschlicherweise mit „section de stockage“ und nicht mit „section d’accumulateur“ übersetzt. Es ist jedoch wichtig anzumerken, dass im Gegensatz zu DeepL hier die Übersetzung „section de stockage“ einheitlich verwendet wurde. Außerdem wurde eine Nebensatzkonstruktion, die inhaltlich ein hypothetisches Szenario darstellt, als eine Zeitangabe aufgefasst. Auf Französisch konnte die maschinelle Übersetzung demnach den Sinn nicht korrekt wiedergeben. Die Ergebnisse sind in Abbildung 03 dargestellt.
Abb. 03 Fehler von ChatGPT bei der Übersetzung ins Französische, zusammengefasst für alle Textkategorien (Recht, Marketing und Technik). Quelle Pierangela Gullotta, Alexandra Kraus und Torsten Schulze
ChatGPT und Polnisch
Zum Schluss betrachten wir die Ergebnisse der maschinellen Übersetzung mit ChatGPT in die polnische Sprache. Unsere Übersetzerin war der Meinung, dass der Rechtstext im Großen und Ganzen von der Engine gut umgesetzt wurde. Die gesamte Übersetzung hatte nur einen gravierenden Sinnfehler. Die Engine scheint sich lediglich bei einer Passage etwas verfangen zu haben. Das Ergebnis ist ein Satz, der sonderbar zusammengestellt ist. Dies führte dazu, dass der Output gänzlich unverständlich ist und ohne den Kontext des Ausgangstextes der Sinn komplett verloren geht.
Nach Betrachtung des Rechtstextes beschäftigen wir uns genauer mit der Rückmeldung unserer Übersetzerin zur Qualität des Marketingtextes. Hierzu meinte sie, dass der Stil von ChatGPT Mängel aufweist, ähnlich wie bei DeepL. So bilden die Sätze im Polnischen keinen Fließtext. Vielmehr wirken sie, als wären sie jeweils einzeln und unabhängig voneinander übersetzt worden. Gerade im Marketing ist es umso wichtiger, die Übersetzung kulturell und kontextbedingt zu gestalten. Damit die Zielgruppe nicht merkt, dass es sich um eine Übersetzung handelt, muss diese etwas „freier“ gestaltet werden. Leider ist die maschinelle Vorübersetzung 1:1 an den Ausgangstext gelehnt und demnach etwas holprig.
Zusätzlich zu den stilistischen Mängeln wurden im ChatGPT-Output grammatikalische Fehler erkannt. Der Text enthielt vier solcher Fehler, von denen einer schwerwiegender, lexikalischer Natur ist. Dieser entstand dadurch, dass ChatGPT eine eigene, im Polnischen nicht existierende Form des Wortes „Zettel“ mit „karteczkiem“ gebildet hat. Die Ursache ist das falsche grammatikalische Genus (Maskulinum anstatt Femininum) und die falsche Deklinationsform – die Engine hat in diesem Fall ihre eigene Form erstellt. Die korrekte Übersetzung sollte „karteczką“ lauten.
Wie beim Französischen hat ChatGPT bei der Übersetzung ins Polnische die E-Mail-Adresse übersetzt und im Gegensatz zu DeepL nicht als solche erkannt. Zudem merkte unsere polnische Übersetzerin an, dass einiges im Polnischen so merkwürdig klingt, dass sie es nicht ins Deutsche rückübersetzen kann. Der Sinn geht in der Übersetzung komplett verloren.
Die Qualität der Vorübersetzung des technischen Textes wird von unserer Übersetzerin als mittelmäßig eingestuft. Obwohl das Post-Editing an sich weniger Zeit in Anspruch nahm, bestanden dennoch stilistische Fehler; dies vor allem beim Verwenden des Passivs. Passiv ist im Polnischen nicht üblich, und der Text wurde deswegen an einigen Stellen schwer lesbar.
Es trat ein gravierender Fehler auf, bei dem „Energieversorgung und Betriebsstoffzuleitungen“ mit „zasilanie i doprowadzenie paliwa“ übersetzt wurde, was jedoch inhaltlich so viel heißt wie „Kraftstoffversorgung und -zuführung“. Somit ist der Engine ein Fehler bei der Sinnhaftigkeit unterlaufen. Die korrekte Übersetzung muss „zasilanie energią i materiałami eksploatacyjnymi“ lauten.
Wie DeepL scheint ChatGPT Probleme mit dem Kontext von „Speicherabschnitt“ zu haben. So wurde das „Umlegen“ der Speicherabschnitte sinngemäß als deren „Stürzen“ übersetzt. Tatsächlich besagt der übersetzte Satz inhaltlich, dass die Speicherabschnitte „(zu Boden) stürzen“. Eine Zusammenfassung der Fehler ist in Abbildung 04 dargestellt.
Abb. 04 Fehler von ChatGPT bei der Übersetzung ins Polnische zusammengefasst für alle Textkategorien (Recht, Marketing und Technik). Quelle Pierangela Gullotta, Alexandra Kraus und Torsten Schulze
DeepL oder ChatGPT
Fassen wir die Ergebnisse zusammen und stellen sie gegenüber. Dabei lassen sich Gemeinsamkeiten sowie Unterschiede zwischen den französischen und den polnischen Übersetzungen feststellen. Mitunter sind diese sprachspezifisch, jedoch auch von der Engine abhängig.
Ausschließlich im Französischen finden sich nicht übersetzte Passagen. DeepL hat beim Rechtstext einen kompletten Absatz nicht berücksichtigt, und ChatGPT hat ebenso einen Teil des technischen Textes komplett ausgelassen. Entgegen dem französischen Output waren im polnischen alle Texte enthalten, sowohl bei DeepL als auch bei ChatGPT.
Aufgrund des geringen Stichprobenumfangs sollten keine voreiligen Schlüsse gezogen werden. Es muss sich hierbei nicht um ein Phänomen handeln, das lediglich im Französischen auftritt. Andererseits liefert dies eine spannende Grundlage für weitere Recherchen.
In gleicher Weise bestehen bei der Übersetzung ins Polnische Probleme mit der Höflichkeitsform. So wurde bei DeepL an manchen Stellen die Anrede höflich, manchmal informell umgesetzt. Die polnische Übersetzerin fasst es so zusammen: „Im Allgemeinen hat DeepL ein Problem mit der Anrede, sie wird beliebig und manchmal völlig widersprüchlich zum Original verwendet. Dies gilt sowohl für den Marketing- als auch für den Technik-Text.“ Im Vergleich: ChatGPT hat im Marketingtext konstant die formelle Anrede verwendet und war demnach sprachlich einheitlich. Jedoch haben beide Engines oft das Passiv genutzt, das im Polnischen unüblich ist. Dadurch wird der Zieltext an einigen Stellen schwierig lesbar.
Generell lässt sich festhalten, dass beide Engines aufgrund mangelnder Kontexterkennung Probleme in der Übersetzung verursachen. Dies geschah unabhängig von der Zielsprache und resultiert daraus, dass die Maschine die verschiedenen Textkonventionen nicht kennt bzw. erkennt.
Bei DeepL sind inkonsistente Terminologie in der technischen Übersetzung sowie die ungenügende Rechtssprache speziell für den juristischen Text im Französischen zwei typische Beispiele für Fehler. Um unsere französische Übersetzerin zu zitieren: „DeepL liefert eine wörtliche Übersetzung, die weder den gesamten Text noch das Fachgebiet oder den größeren menschlichen Kontext berücksichtigt.“ Obwohl ChatGPT eine gewisse sprachliche Einheitlichkeit aufweist, wurde wortwörtlich übersetzt. Das kann gravierende Folgen haben.
Zusammenfassend: ChatGPT übersetzt zwar Begriffe konsistent, die Vorübersetzung von DeepL weist jedoch einen besseren Stil auf. Insgesamt schneidet die polnische Vorübersetzung durch ChatGPT besser ab: „Es gibt hier keine Probleme mit der Anrede wie bei DeepL.“ Dennoch heißt dies nicht, dass der Stil zufriedenstellend ist. Speziell zum Marketing-Output von DeepL meinte die französische Post-Editorin, dass sie diesen am liebsten neu übersetzen würde, um die Lesbarkeit zu vereinfachen. Auch wenn die Übersetzung lediglich für die interne Kommunikation gedacht ist, so leidet das Markenimage des Unternehmens durch eine suboptimale Übersetzung.
Menschen sind unverzichtbar
Unsere Post-Editorinnen stimmen in ihren Aussagen überein, ohne dass sie direkt miteinander gesprochen habe. Zum polnischen Output wurde festgehalten: „ChatGPT verwendet vor allem eine einheitliche Terminologie. Bei den Marketingtexten haben beide Engines gleichermaßen versagt.“ Die Rückmeldung zur französischen Übersetzung ist analog: „DeepL ist besser für den Stil, aber ich habe bemerkt, dass ChatGPT die terminologische Einheitlichkeit einhält.“
Obwohl DeepL stilistisch besser abschneidet, ist zu ergänzen, dass Post-Editing vor allem für Marketingübersetzungen essenziell ist. Ein Post-Editor kann den notwendigen Kontext berücksichtigen, der nicht nur eine korrekte, sondern auch eine flüssige Übersetzung garantiert; unabhängig vom Fachgebiet oder der Textsorte. Die Weiterentwicklung maschineller Übersetzungen der vergangenen Jahre liefert überraschend gute Ergebnisse, die Entwicklung ist aber lange nicht abgeschlossen. Zum jetzigen Zeitpunkt sollte sich ein Unternehmen und dessen Technische Redaktion nicht ohne menschliche Kontrolle auf KI-erstellte Texte verlassen. Dies zeigt, dass der menschliche Einfluss in der Sprachwissenschaft nach wie vor eine wesentliche Rolle einnimmt und weiterhin einnehmen wird.
Links und Literatur zum Artikel
[1] Brandl, R./Ali, A. (2023): DeepL vs ChatGPT: Wer übersetzt besser; https://www.tooltester.com/de/blog/deepl-vs-chatgpt, 6. Oktober 2023 [letzter Abruf am 5. Dezember 2023].
[2] https://themqm.org/error-types-2/1_scorecards/values-and-scores/