Neuer Bauplan für Smart Content

Text: Sebastian Göttel

Lange galt XML als Fundament intelligenter Inhalte. Heute übernehmen Metadaten die tragende Rolle. Smart Content bleibt damit in Bewegung. Passt eine Technische Redaktion ihre Informationsarchitektur jetzt an, dann sichert sie sich den Anschluss an das KI-Zeitalter.

Inhaltsübersicht

Lesedauer: 06:50 Minuten

Wenn ich IT-Consultants Redaktionssysteme erkläre, beginne ich meist mit drei Säulen: XML, Bausteine (modulare Topics) und deskriptive Metadaten. Diese drei Elemente bilden seit Jahrzehnten das Fundament für smarte Inhalte. Sie unterscheiden unseren Ansatz von anderen IT-Lösungen und haben sich als bemerkenswert beständig erwiesen.

Bemerkenswert beständig? Ja und nein. Die drei Säulen stehen noch immer. Wer heute ein Redaktionssystem einführt, kommt um XML, modulare Inhalte und Metadaten kaum herum.

Doch wer genauer hinsieht, erkennt eine fundamentale Verschiebung. Die Architektur mag dieselbe sein, aber die Statik hat sich komplett verändert. Was in den frühen 2000ern als tragende Säule galt, ist heute zum technischen Detail geworden. Und was damals als unscheinbares Beiwerk begann, ist heute für die Statik des Bauplans unverzichtbar.

Ein neues Baugerüst

Diese Umkehrung lässt sich an den Meilensteinen der letzten zwei Jahrzehnte ablesen. Jede Ära stellte neue Anforderungen an „smarten Content“ und verschob damit die Gewichtung zwischen den drei Säulen. Schauen wir uns an, wie aus dem Fundament von gestern das Baugerüst von morgen wurde.

Damals der Star

Aus Sicht eines Softwareanbieters für Technische Dokumentation war die Welt vor rund 20 Jahren noch überschaubar. Das klassische Redaktionssystem reichte aus. Mit XML, Bausteinen und Metadaten war man auf alle Herausforderungen vorbereitet. Die Kombination der drei war bereits damals eine starke Antwort auf die Anforderungen der Epoche.

Aus heutiger Sicht wirkt vieles erstaunlich vertraut. Doch war die Perspektive eine andere. Technische Redakteurinnen und Redakteure zerlegen ihre Dokumentation in zahlreiche Bausteine und strukturieren deren Inhalte medienneutral in XML. Eine durchdachte Ablagestruktur plus Metadaten macht es möglich, tausende Bausteine effizient zu verwalten. Die große Stärke von XML: Derselbe Inhalt lässt sich aus einer Quelle automatisiert in verschiedene Ausgabeformate publizieren. Metadaten filtern Inhalte für verschiedene Produktvarianten.

Doch anfangs dachte kaum jemand in drei getrennten Säulen. Bausteine und Metadaten? Das war Teil von XML. Die Schlagworte der Ära hießen „Single Source Publishing“ und „Cross-Media-Publishing“. Gemeint war: Print, Online-Hilfe und PDF aus einer Quelle. Dass sich XML-Inhalte in beliebige Zielformate transformieren ließen, war das Verkaufsargument schlechthin.

Bald erkannte die Branche weitere Vorteile: Die Modularisierung in Bausteine im Redaktionssystem beendete die redundante Pflege in separaten Silos für jedes einzelne Handbuch. Keine parallelen Versionen mehr, keine Synchronisationsfehler.

Und dieser Ansatz zahlte sich wirtschaftlich aus. Varianten und Publikationen automatisch zu erzeugen, wurde zum entscheidenden Erfolgsfaktor. PDF-Handbücher lassen sich durch Wiederverwendung und Variantenfilter weitaus effizienter erstellen als mit Desktop-Publishing. Entsprechend hoch ist der Return-on-Investment. Der Siegeszug der Redaktionssysteme beruhte weniger auf visionären Konzepten als auf einem handfesten ökonomischen Vorteil: Inhalte einmal erstellen und übersetzen, überall wiederverwenden.

Trotzdem kreiste die Debatte häufig um XML. Welche DTD unterstützt die Semantik des Inhalts am besten? In Projekten wurde intensiv um diese Frage gerungen. Viele Firmen leisteten sich eigene maßgeschneiderte „semantische“ DTDs. Metadaten? Die kodierte man direkt in XML-Attributen an beliebigen Elementen, statt sie gebündelt auf Bausteinebene zu verwalten.

Auch Wiederverwendung war noch nicht klar an Bausteine gekoppelt. Schließlich erlaubt XML mit seinem mächtigen xref-Mechanismus theoretisch die Wiederverwendung auf allen Ebenen. In der Praxis ein Albtraum: Unkontrollierte („wilde“) Wiederverwendung lässt Aktualisierungen zu Abstimmungsmarathons werden. Wer einen Abschnitt umstrukturierte, konnte unbemerkt ein Dutzend anderer Dokumente durcheinanderbringen.

Die Erkenntnis setzte sich durch. Kontrollierte Wiederverwendung braucht abgeschlossene Einheiten mit eigenem Lebenszyklus und Freigabestatus. Modularisierte Ansätze wurden populär. Selbst der ursprünglich dokumentzentrierte DocBook-Standard schwenkte um und führte 2009 ein <topic>-Element ein.

Damit war es amtlich. Bausteine und Metadaten hatten sich als eigenständige Säulen neben XML etabliert.

Bausteine als Antwort

Bausteine und Metadaten ermöglichten den nächsten großen Sprung: Content-Delivery-Portale. Im vergangenen Jahrzehnt erweiterte sich die Aufgabenstellung für Technische Redaktionen. Es ging nicht mehr nur darum, Dokumente effizient zu publizieren, sondern passende Antworten zu liefern. Anwender erwarten passende Suchergebnisse und kontextsensitive Inhalte, nicht mehr nur abrufbare PDFs.

Der Bauplan blieb vertraut: XML, Bausteine, Metadaten. Doch in der Praxis zeigte sich eine Lücke. Die Metadaten, mit denen Redaktionen jahrelang zuverlässig Varianten filterten, halfen Anwendern kaum beim Suchen. Mit anderen Worten: Ein Monteur bei der Fehlersuche denkt in anderen Begriffen als eine Technische Redakteurin bei der Variantensteuerung. Zusätzliche Metadaten müssen ergänzt werden, um Inhalte besser auffindbar zu machen.

Genau dieser Bedarf trieb die Entwicklung von iiRDS voran, dem ersten echten Metadaten-Standard für Technische Dokumentation. Ein deutliches Signal: Metadaten hatten XML als strategischen Schwerpunkt abgelöst. Die firmeneigene DTD, einst heiß diskutiert, wurde zum Implementierungsdetail. Was zählte, war nicht mehr die Feinstruktur von XML. Vielmehr war es die Frage, ob in der Suche die richtigen Metadaten die passenden Bausteine liefern.

Brücken zwischen Silos

Die Digitalisierung der Auslieferung veränderte die Spielregeln. In der Papierwelt konnten Informationssilos friedlich nebeneinander existieren: Betriebsanleitung hier, Ersatzteilkatalog dort, Wartungsplan im dritten Ordner. Dass man nicht ohne Weiteres von einem Handbuch ins andere springen konnte? Akzeptiert. Bestenfalls halfen Querverweise oder gemeinsame Nummernkreise.

Digital funktioniert das nicht mehr. Anwender irritiert es, wenn sie für eine Aufgabe verschiedene Portale und Dokumente durchsuchen müssen. Sie erwarten, dass Informationen verknüpft sind, egal aus welchem System sie stammen.

Smart Content muss deshalb über das Redaktionssystem hinausdenken. Es reicht nicht mehr, Bausteine innerhalb der eigenen Dokumentation zu verlinken. Vielmehr müssen wir Brücken zwischen Content-Silos schlagen. Kein leichtes Unterfangen, denn unterschiedliche Systeme und Formate sprechen bekanntlich „verschiedene Sprachen“.

Die Lösung liegt in vernetzten Metadaten. Wir brauchen Übersetzungsmechanismen zwischen den Metadatenwelten. Ein solches Netzwerk nennt man Knowledge Graph, ein Netz von Beziehungen zwischen Informationsobjekten.

Knowledge Graphen gibt es in verschiedenen Ausbaustufen. Mancher versteht darunter einfach den Abgleich zwischen Taxonomien (hierarchischen Metadaten). Andere bevorzugen umfangreiche semantische Netze, die sogar automatische Ableitungen erlauben. Die umfassende Variante klingt verlockend, erfordert aber enormen Pflegeaufwand. Seien wir realistisch. Strukturierter Content hat außerhalb der Technischen Dokumentation nie flächendeckend Fuß gefasst. Genauso wenig sollten wir darauf setzen, dass bald alle Content-Silos durch perfekt kuratierte Knowledge Graphen verbunden sind. Natürlich wird man solche Graphen dankbar nutzen, wo sie verfügbar sind. Aber für den „Wilden Westen“ im heutigen Informationsmanagement müssen wir häufig kleiner anfangen.

Viele technische Informationen lassen sich bereits über Teilenummern verknüpfen. Die meisten Unternehmen haben eine halbwegs durchgängige Nummerierung oder zumindest Übersetzungstabellen zwischen verschiedenen Nummernkreisen.

Wo das nicht reicht, helfen Taxonomy Crosswalks: Taxonomie-Abgleiche in Form tabellarischer Gegenüberstellungen zwischen Metadatenwelten. Im einfachsten Fall dient so eine Tabelle als Synonymliste für die Suche. Einen Schritt weiter gehen Semantic Correlation Rules. Das sind Regeln, die festlegen, welche Bausteine bei bestimmten Metadaten-Konstellationen zusammengehören. Viele Softwarelösungen nutzen ähnliche Ansätze. Solche Ansätze vermeiden die Komplexität formaler Knowledge Graphen, verzichten aber auch auf deren volle Ausdrucksstärke.

Genau diese Fähigkeit, zwischen Content-Silos zu überbrücken, macht Metadaten heute strategisch wichtiger als XML oder Modularisierung. Metadaten sind heute der Magnet, der Smart Content zusammenbringt.

KI verschiebt die Gewichte

Mit dem KI-Zeitalter verschiebt sich die Perspektive erneut – von der menschlichen Leserin und dem menschlichen Leser hin zum maschinellen Vermittler. Für KI-Chatbots zählt weniger die XML-Mikrostruktur als vielmehr die konsistente Modularisierung und durchgängige Klassifikation mit Metadaten. Der Chatbot muss erkennen können, welche Bausteine aus verschiedenen Quellen inhaltlich zusammengehören, um eine Anwenderfrage vollständig zu beantworten. Ob alle Inhalte nach der gleichen XML-DTD strukturiert sind oder überhaupt XML im Spiel ist? Nebensache.

Entscheidend ist, dass der virtuelle Assistent weiß, welche Inhalte er kombinieren muss. Beispiel: Zu einer Fehlermeldung gehören die Erklärung aus der Betriebsanleitung genauso wie der entsprechende Eintrag aus der Knowledge Base. Strukturelle Vergleichbarkeit auf Bausteinebene und aussagekräftige Metadaten, die über alle Content-Silos hinweg vernetzen, bilden diese Grundlage. Large Language Models können zwar auch relativ unstrukturierte Inhalte zusammenführen. Aber sie antworten deutlich präziser und zuverlässiger, wenn sie auf klar abgegrenzte, kontextspezifische Bausteine zurückgreifen.

Doch diese Erkenntnis ist leider nicht überall angekommen. Je weniger KI-Projektteams vom Erfolgsrezept der Technischen Dokumentation wissen, umso weniger nutzen sie das reichhaltige Informationsangebot des Redaktionssystems. Statt mit vorhandenem XML, mit Bausteinen und Metadaten füttern sie die Chatbots einfach mit PDF-Dateien. Das ist gleich doppelt absurd. Selbst PDF-basierte Chatbots zerlegen ihre Quellen automatisch in Chunks. Nur sind diese Chunks selten so passgenau wie die Bausteine, die Technische Redakteurinnen und Redakteure sorgfältig modularisiert und klassifiziert haben. Die Antwortqualität leidet entsprechend.

Der klassische Bauplan bewährt sich also auch im KI-Zeitalter. Aber die Prioritäten haben sich endgültig verschoben: Metadaten zuerst, dann Bausteine, dann XML. Die Rolle von XML ist geschrumpft. Für die Chatbot-Verarbeitung bietet XML kaum Vorteile gegenüber Markdown. Für Multi-Channel-Publishing bleibt es unverzichtbar. Solange PDF-Handbuch und Chatbot nebeneinander existieren, wird XML seinen Platz behalten, nur eben nicht mehr den ersten.

Ein bewegliches Ziel

XML, Bausteine, Metadaten – auf dem Papier sieht der Bauplan für smarte Inhalte seit 25 Jahren gleich aus. In der Praxis hat sich die Statik komplett verändert. Smart Content ist heute kein XML-Projekt mehr, sondern ein Metadaten-Projekt.

Die entscheidende Frage lautet nicht länger: Wie strukturiere ich Bausteine perfekt? Sondern: Mit welchen anderen Informationsquellen müssen diese Bausteine kombinierbar sein?

Daraus folgt ein Perspektivwechsel. Metadatenmodelle dürfen nicht im Alleingang am Reißbrett der Technischen Dokumentation entstehen. Eventuell ist im Zusammenspiel mit anderen Abteilungen nicht jede semantische Windung möglich. Aber ausgefeilte Metadatenmodelle altern mitunter genauso schlecht wie ausgefeilte XML-DTDs. Und die generative KI wird zudem die Art verändern, wie Knowledge Graphen entstehen, wachsen und gepflegt werden.

Wo ein umfassender übergreifender Graph nicht realistisch ist, lohnt es sich, kleiner anzufangen: gemeinsame Teilenummern, Taxonomy Crosswalks, einfache Korrelationsregeln zwischen Quellsystemen. Jeder Steg erhöht den Nutzen Ihrer Bausteine für Content Delivery und für KI.

Smart Content war nie ein fester Zustand, sondern immer ein bewegliches Ziel. Die gute Nachricht ist, gerade weil sich dieses Ziel verschiebt, werden Fachleute für Informationsarchitektur und Technische Redaktion gebraucht. Wer den Bauplan jetzt mit anschlussfähigen Metadaten an erster Stelle mutig neu zeichnet, stellt sicher, dass seine Inhalte nicht nur heute publizierbar, sondern morgen tatsächlich smart sind.

 

Titelbild von Ausgabe 01 2026 der Fachzeitschrift technische kommunikation.