Das Thema Content Delivery hat es erreicht, als aktuelle und zukünftige Aufgabe so genannter digitaler Services in den Unternehmen wahrgenommen zu werden. Im Detail sind dabei noch technische, methodische und organisatorische Hürden zu nehmen – je nach jeweils vorhandenen Informations- und Systemarchitekturen. Ziel von Content Delivery ist es, Informationen dynamischer und spezifischer zu verteilen, als dies in der Vergangenheit möglich war.
Einem der methodischen und technischen Aspekte widmet sich dieser Beitrag: der regel- und logikbasierten Vernetzung von Informationen in einem Content Delivery. Kern der Betrachtung sind dabei Regeln zwischen semantischen Metadaten von Informationen, für die unterschiedliche technische Realisierungen möglich sind.
Ausgangssituation im Content Delivery
Die Einführung von Delivery-Lösungen sollte nicht primär technisch getrieben sein, sondern anhand relevanter Anwendungsszenarien und Bedarfe entwickelt werden [1]. Szenarien ergeben sich aus konkreten Analysen und Kundenbefragungen, um bestehende Informationsverteilung zu optimieren. Oder sie werden als neue Angebote zu veränderten Produkt- oder Marktanforderungen geplant. Treiber sind derzeit Digitalisierungsinitiativen, bei denen dynamischere Informationsangebote Teil eines digitalen Produktportfolios und neuer digitaler Services werden. Die Digitalen Information Services (DIS) [1] verlangen eine konsequente Vorbereitung der Inhalte und der zugehörigen Informationsarchitekturen, wenn sie mehr sein sollen als Show-Cases. Konkret bedeutet dies die Umsetzung und aktive Nutzung der seit Jahren bekannten Konzepte modularer Inhalte zusammen mit langfristig tragenden Metadatenkonzepten etwa in einem Content-Management-System (CMS).
Unternehmen bzw. CMS-Nutzer ohne entsprechende Detailkonzepte müssen diese nachträglich erarbeiten, sofern sie die Möglichkeiten eines topicbasierten Content Delivery erproben und nutzen möchten. Methodisch und inhaltlich standardisierte Vorgehensweisen zur Entwicklung finden sich zum Beispiel in der PI-Klassifikation und darauf aufbauend in den iiRDS-Definitionen für Metadaten. Wobei immer ein nicht zu unterschätzender substanzieller Eigenanteil an Planung bleibt, um die CMS- und Delivery-Prozesse unternehmens- bzw. produktspezifisch anzupassen.
Der Kontext ist entscheidend
Wie bereits bekannt, besteht ein latentes Grundproblem von topicbasierten Delivery-Szenarien [2]: Einzeln selektierten bzw. angezeigten Informationsbausteinen fehlt potenziell der Wissenskontext für Handlungen, für Entscheidungen oder für die spezifische Vermittlung von Zusammenhängen zum Verständnisaufbau. Gerade in kritischen Situationen sollte der Kontext aber klar sein bzw. vorgegeben werden. „Kritisch“ kann dabei eine wiederkehrend fehlerbehaftete Art der Produktnutzung sein oder besonders wichtige administrative Aktivitäten für Soft- und Hardware. Es kann sich aber auch informativ auswirken etwa bei einer Kaufentscheidung; und dies alles trotz der geforderten Abgeschlossenheit einzelner modularer Informationen.
Um diese Problematik im Content Delivery zu berücksichtigen, wurden neben den klassischen Ansätzen zur manuellen oder automatisierten Verlinkung so genannte microDocs als fachliches Konzept eingeführt [2, 3]. Diese sind als Möglichkeit zu verstehen, den Handlungskontext in Delivery-Prozessen logikbasiert genauer vorgeben zu können, und zwar angepasst an die anwender- bzw. anwendungsrelevanten Situationen. Dazu wurden bereits mögliche Szenarien aus industriellen Kontexten angeführt [3]. Weitere Szenarien wurden als Vorarbeit zur Entwicklung von Korrelationsregeln mit Industrieunternehmen konkret erarbeitet. Diese werden an anderer Stelle ausführlicher dargestellt [4].
In diesem Beitrag soll hingegen beschrieben werden, wie microDocs mit Hilfe von Korrelationsregeln zwischen Informationen technisch realisiert werden können. Informationen sind dabei aber nicht notwendigerweise nur modular vernetzt. Es sollten prinzipiell weitere Daten, Information und Dokumente logisch verbunden werden. So lässt sich die Systematik auch über übliche Delivery-Ansätze hinaus einsetzen. Voraussetzung ist immer, dass die Informationen durch semantisch definierte und damit eindeutig greifbare bzw. maschinell auswertbare Klassifikationen selektiert werden können [3].
Das steckt hinter den Regeln
Um microDocs aufzubauen, werden Korrelationsregeln benötigt, die technisch und logisch flexibel auf den Anwendungsfall angepasst werden können. Üblicherweise können sie aus der Analyse von bekannten oder zumindest vermuteten kritischen Fällen des fehlenden Wissenskontextes abgeleitet werden. Allerdings sollte es nicht Aufgabe der Technischen Redaktion sein, einzelne Topics im Redaktionssystem manuell für jeden kritischen Anwendungsfall miteinander zu verlinken. Ziel ist vielmehr, die Informationen auf Basis der Metadaten logisch miteinander zu korrelieren, und dies getrennt von den Inhalten.
Auf Basis der hier vorgestellten Arbeiten können die Regeln formal und technisch als „Semantic Correlation Rules“ (SCR) umgesetzt werden. Je reichhaltiger das verwendete Metadatenmodell dabei ist, desto vielfältiger lassen sich auch die Regeln entwickeln. Denn SCR sollen ausschließlich auf der Nutzung der vorhanden Informations- und Metadatenarchitektur beruhen und keine größeren Zusatzaufwände erzeugen.
SCR ähneln den in einigen Content-Delivery-Portalen (CDP) bzw. Suchsystemen verwendeten Ansätzen für die Verlinkung von „ähnlichen“ Informationen. Ähnlichkeit kann dort im weiteren Sinne bedeuten:
- zusätzliche Informationsklassen zu selektierten Komponentenklassen und umgekehrt bei Ansätzen analog der PI-Klassifikation
- inhaltliche Verwandtschaft durch statistische und linguistische Kriterien, wie zum Beispiel dem Vorkommen von gleichen Stichwörtern
Im Gegensatz zu diesen sollen aber SCR, wie bereits betont, aus relevanten Anwendungsfällen entwickelt werden und auch dynamisch als Regel-Objekte verwaltbar sein. Man kann sie als Link-Mechanismus zwischen Informationsobjekten ansehen. Der Mechanismus basiert auf „Klassen-zu-Klassen-Links“ und wird in Such- und Delivery-Systemen dynamisch ausgewertet. Anzumerken ist, dass sich als Grenzfälle auch die bekannten expliziten Objekt-zu-Objekt-Verknüpfungen im CMS-Umfeld sowie die Links von Informationsobjekten auf Klassen von Objekten („klassifizierte Links“) und die bereits genannten Links zu ähnlichen Informationsklassen mit SCR-Methoden abbilden lassen.
Mit der verstärkten Einführung und Nutzung semantischer Technologien und vernetzend denkender Digitalisierungsinitiativen ist auch hier zu erkennen, dass neue Aufgabe und Rollen entstehen. Neben einem Verständnis der Prozesse der Inhaltserstellung müssen auch die konkreten anwenderbezogenen Probleme und Bedürfnisse verstanden werden. Die Use-Cases selber werden aber zum Beispiel häufig aus dem Web-, Sales-, Service- oder Administrations- oder auch Support-Umfeld geliefert. Sie können dann auf Basis semantischer und vernetzter Informationen modelliert und analytisch optimiert werden. In welchem Umfang dies eigene Rollen erzeugt, etwa als Data Scientists oder Data-Model- bzw. Content Engineer, ist eine der aktuell spannenden organisatorischen Entwicklungen.
Eine formale Definition
Die Darstellung der Semantic Correlation Rules erfolgt in einem standardisierten XML-Format, genauer in einer RDF-/OWL-Semantik. Sie wird auch für ontologische Modelle und Wissensgraphen verwendet. Diesem Beschreibungsformat folgen passend auch die Metadatendefinitionen des iiRDS-Austauschformats.
Im Prinzip sind die Semantic Correlation Rules aus Modellierungssicht eine sehr einfache Formulierung einer Ontologie bzw. eines semantischen Wissensnetzes. Sie sollen im Wesentlichen eine „Wenn-dann“ Beziehung von einem Primärobjekt mit mehreren Sekundärobjekten ausdrücken. Konkret sollen in einem CDP manuell Informationsobjekte gesucht oder zum Beispiel per Web-Adresse, Barcode oder durch Maschinenzustände für die Nutzer selektiert werden. Wenn dieses primäre Informationsobjekt angezeigt wird, dann sollen weitere, sekundär korrelierte Informationsobjekte zusätzlich angezeigt oder zumindest als Verweis angeboten werden. Die eigentliche visuelle Darstellung obliegt aber nicht der SCR- oder microDoc-Definition und ist systemabhängig.
Ein einfaches Beispiel von SCR zeigt Abbildung 01: Zu einer primären modularen Information zur Inbetriebnahme eines Ventilators sollen Informationen zur manuellen Fehlersuche sowie zu Störungsmeldungen und -abhilfen angeboten werden, unabhängig vom jeweiligen Produkttyp. Als Drittes können die Kontakt- und Servicedaten des Herstellers korreliert werden.
Abb. 01 Referenzbeispiel eines primär selektierten Inbetriebnahme-Topcis eines fiktiven (PI-Fan-)Ventilators links mit drei korrelierten Sekundär-Topics rechts; in den XML-Auszügen sind die wesentlichen syntaktischen Elemente der InRule und der ersten OutRule zu erkennen. Metadatenwerte der Topics sind in den jeweiligen rdf-Ressourcen zu finden. Quelle Wolfgang Ziegler
Für Umsetzungen in den verschiedenen Software-Systemen wurde dieses Beispiel aus der PI-Fan Referenz-Implementierung entnommen. Diese liegt für die PI-Klassifikation vor, außerdem wurde sie als Beispiel zur iiRDS-Umsetzung von Austauschpaketen verwendet [5].
Die Spezifikation und Beschreibung von SCR-konformen Regeln ist in [6] zu finden. In Abbildung 01 erkennt man die Kernelemente der Syntax: Primär- und Sekundärobjekte werden über so genannte InRule- bzw. OutRule-Klassen definiert und benannt. Die im jeweiligen Anwendungsfall relevanten Klassifikationen von Informationsobjekten, hier Topics, lassen sich dabei über die „selects“-Beziehungen einfach vorgeben. Einer InRule sind dabei mehrere OutRules zuordenbar. Wie in Abbildung 01 ersichtlich, können die Metadatenklassen aus unterschiedlichen Bereichen (hier iiRDS- und PI-Fan-Domäne) stammen. Letzteres ist für eine domänenübergreifende Nutzung von Verknüpfungen unabdingbar. Sie entspricht aber auch der realen Notwendigkeit, eigene unternehmensspezifische Metadaten als Erweiterung von Standardwerten zu entwickeln.
Eine ausführlichere Beschreibung zu Syntax und Implementierung ist für nachfolgende Publikationen vorgesehen [6, 7]. Das Referenzbeispiel ist dabei für unterschiedliche Klassifikationen in den Formulierungen für iiRDS/PI-Fan bzw. PI-Class/PI-Fan zu finden.
Das Zusammenspiel der Systeme
Betrachtet man die bisherige Systemlandschaft mit Blick auf die Aufgabenstellungen, die hier in einer semantischen Informations- und Metadatenarchitektur eine Rolle spielen, so lassen sich drei Systemkategorien erkennen (Abb. 02):
- Erstellsysteme – in der Technischen Kommunikation häufig spezialisierte Content-Management-Systeme (CMS), in denen Inhalte mit Metadaten modular erstellt werden.
- Semantische Modellierungssysteme (SMS), um ontologische Modelle und Wissensgraphen systematisch abbilden und auswerten zu können. Mit ihnen können bei Bedarf Produktmodelle, Wissenszusammenhänge oder auch Konfigurationen für unterschiedlichste Anwendungsfelder aufbereitet und ggf. über Schnittstellen nutzbar gemacht werden.
- Content-Delivery-Portale schließlich nutzen Inhalte falls nötig aus unterschiedlichen Erstellsystemen oder sonstigen Dokumentquellen und machen sie mit Hilfe von Metadaten oder zusätzlichen semantischen Modellen intelligent verfügbar. Metadaten lassen sich damit, wie bereits definiert [8], als native Intelligenz der Inhalte und semantische Modelle als erweiterte Intelligenz auffassen. Mit semantischen Modellen können zum Beispiel wichtige Regeln und Abhängigkeiten zwischen den Metadaten abgebildet werden. Methoden der künstlichen Intelligenz kommen eventuell an anderer Stelle des Prozesses zum Tragen.
Abb. 02 Zusammenspiel der Systemlandschaft, wenn Semantic Correlation Rules (SCR) erstellt und genutzt werden.
Quelle Wolfgang Ziegler
Für das Zusammenspiel der Systeme sind folgende Szenarien denkbar: Inhalte werden in einem CMS modularisiert und mit Metadaten versehen. Sofern das CMS nicht bereits semantische Relationen erzeugt und verwaltet, lassen sich die Metadatenstrukturen systemabhängig in unterschiedliche, normalweise aber semantisch auswertbare Formate exportieren. Mit iiRDS liegt zudem ein potenzielles standardisiertes Austauschformat vor. [5]
Hinzu kommen die semantischen Modellierungssysteme (SMS), mit denen sich die Semantic Correlation Rules erstellen und pflegen sowie visualisieren lassen. Letzteres kann für die Kommunikation mit den Personen hilfreich sein, die für die Anwendungsfälle des Content Delivery verantwortlich sind; letztlich entscheidet die Einfachheit der SCR-Modellierung über die Rollenverteilung bei der realen Nutzung und Pflege.
Im Prinzip ließen sich SCR auch mit vereinfachten XML-basierten Hilfswerkzeugen oder einer Tabellenverarbeitung „händisch“ erzeugen. Semantische Modellierungssysteme erlauben hingegen eine viel weitergehende Nutzung und Auswertung von Beziehungen über die Technische Dokumentation hinaus. SCR können dafür eine Basis sein und einen ersten Zugang zu Beziehungswissen zwischen Informationen geben.
Die SCR lassen sich nach der Modellierung in ein standardisiertes XML-Format exportieren und in Content-Delivery-Portale oder generelle Suchsysteme importieren. Diese müssen die dynamische Auswertung übernehmen und bei der Anzeige und Weitergabe von Informationen ermitteln, welche korrelierten Informationen dem Nutzer im Sinne eines microDocs angezeigt werden sollen.
Wie in Abbildung 02 zu sehen ist, kann dies ein dynamischer Prozess sein, in dem Analysen der CDP-Nutzung die Regeln optimieren und neue erstellen. Dies ist dann auch der Bereich, in dem künstliche Intelligenz einsetzbar ist, um Nutzungsregeln automatisiert zu erkennen und als SCR umzusetzen.
Erste technische Umsetzungen
Der existierende SCR-Formalismus ist in ersten Forschungs- und Entwicklungsinitiativen bereits in mehreren Systemen implementiert, allerdings in noch unterschiedlichen Integrationstiefen. Bei einigen Systemen zeigt sich bereits die Tendenz, die ursprünglichen und im vorherigen Abschnitt dargestellten Systemgrenzen zunehmend zu überschreiten. Für die technische Nutzung von Semantic Correlation Rules und deren fachliches Konzept der microDocs kann dies wegen der Durchgängigkeit innerhalb eines Systems nur förderlich sein; durch die Export- und Importmöglichkeiten des standardisierten SCR-Formates bleiben aber dennoch die Austauschmöglichkeiten erhalten.
Die folgenden Abbildungen zeigen aktuelle Umsetzungen. Die Systemkonzepte werden in den jeweiligen Bildunterschrift kurz erläutert. So können bei den CMS bereits einige Systeme SCR-Modellierungen direkt umsetzen (Abb. 03/04, Abb. 05); weitere sind in Vorbereitung. Im Bereich der spezialisierten Modellierungssysteme lassen sich SCR direkt umsetzen und können über Exportmechanismen bzw. Skripting erzeugt werden. (Abb. 05/06, Abb. 07). In den Abbildungen 08 und 09 sind direkte Umsetzungen der SCR im Delivery zu finden. Hierbei werden die Regeln zum Erzeugen von microDocs dynamisch ausgewertet und bei der Darstellung von primären Suchergebnissen als Linklisten angezeigt.
Abb. 03 In-/OutRule-Definition mit (rechts oben) sichtbarer Selektion der iiRDS-/PI-Fan-Klassen für das sekundär anzuzeigende Topic gemäß der OutRule1. Quelle CMS: Smart Media Creator der Expert Communication Systems GmbH
Abb. 04 In-/OutRule-Definition mit (mittig vergrößerter) sichtbarer Selektion der PI-Class/PI-Fan Klassen für das sekundär anzuzeigende Topic gemäß der OutRule1. Quelle CMS: klar:suite der Klarso GmbH
Abb. 05 In-/OutRule-Modellierung (oben rechts) mit unten sichtbarer Selektion der PI-Class/PI-Fan-Klassen für das sekundär anzuzeigende Topic gemäß der OutRule3. Das System hat zusätzlich sowohl eine CMS- als auch eine CDP-Komponente, in der SCR und Ontologien genutzt werden können. Quelle SMS: Product Model Editor der Ontolis GmbH
Abb. 06 Ausschnitt aus In-/OutRule-Modellierung mit visueller Darstellung des semantischen Netzes. Selektion der iiRDS/PI-Fan-Klassen für die anzuzeigenden Topics als Endknoten an den Rules. Das System hat zusätzlich eine CDP-Komponente, in der SCR und Ontologien genutzt werden können. Quelle SMS: Knowledge Builder der Intelligent Views GmbH/Empolis Information Management GmbH
Abb. 07 Semantic Modeling Feature und visuelle Darstellung der SCR; das System stellt ebenfalls eine mit dem CMS integrierte Content-Delivery-Anwendung zur Verfügung. Quelle SMS: Sherlock der Fischer Information Technology AG.
Abb. 08 Delivery-Umsetzung des Referenzbeispiels; die über SCR verbundenen Topics lassen sich rechts über das Netzsymbol anzeigen und selektieren. Quelle CDP: Expert Communication Systems GmbH
Abb. 09 Delivery-Umsetzung des Referenzbeispiels über „Correlated Topics“, rechts; das Netz aus den regelbasierten Verbindungen kann zusätzlich angezeigt werden; hier links verkleinert eingefügt.
Quelle CDP: I-views content der Intelligent Views GmbH/Empolis Information Management GmbH
Voraussetzungen und Realisierungen
Mit der formalen Definition von Regeln im standardisierten SCR-Format lässt sich das fachliche Content-Delivery-Konzept der microDocs technisch umsetzen. SCR-Definitionen bedienen sich dabei selbst gängiger Standards wie XML und RDF.
Unternehmen können damit ihre kritischen Anwendungsfälle im Content Delivery unterstützen, bei denen Inhalte logisch vernetzt werden sollten, um Informationsempfängern den notwendigen Wissens- oder Handlungskontext zu vermitteln. Autoren müssen bei der Content-Erstellung dazu keine Verknüpfungen manuell aufbauen und zum Beispiel explizit auf andere Inhalte und Medien verlinken. Die Regeln erlauben es dagegen auf einfache Weise, unabhängig von spezifischen Systemen, die Inhalte logisch zu korrelieren. Für die tatsächliche Erstellung von SCR-Regeln sind verschiedene Möglichkeiten und bereits erste Werkzeuge vorhanden.
Die Visualisierung der microDocs im Delivery ist systemabhängig und erfolgt beim jetzigen Stand der Entwicklung häufig auf Basis dynamisch erzeugter Link-Listen. Weiterentwicklungen können noch zahlreiche andere visuelle Möglichkeiten vorsehen wie etwa semantische Graphen oder Netze zur Erhöhung der Usability.
Notwendige Vorbedingung für die SCR-Nutzung ist das Vorhandensein einer Metadatenarchitektur, die semantisch auswertbar ist. Dies können existierende Umsetzungen der PI-Klassifikation oder deren Umsetzung im iiRDS-Format sein. Generell gibt es aber keine technologischen oder systemtechnischen Einschränkungen. Je reichhaltiger die Metadatenarchitektur ist, desto komplexere Korrelationen und Use-Cases verknüpfter Informationen können abgebildet werden. SCR lassen sich als Vorstufe von und Hinführung zu komplexeren ontologischen Modellierungsansätzen verstehen. Man kann damit auch perspektivisch abteilungs- oder unternehmensübergreifende Korrelationen abbilden, die auch jenseits des topicbasierten Content Deliveries liegen.
Durch die Einfachheit der Modellierungen kann ein Unternehmen die Methodik der Semantic Correlation Rules und microDocs relativ rasch einsetzen. Erste Realisierungen in unterschiedlichen Systemen und Systemkategorien beweisen dies bereits.
Links und Literatur zum Beitrag
[1] Ziegler, Wolfgang (2018): Man muss auch austeilen können. In: technische kommunikation, H. 4, S. 15–21.
[2] Ziegler, Wolfgang (2019): Delivery zwischen Kontext und Content. In: technische kommunikation, H. 6, S. 58–61.
[3] Ziegler, Wolfgang (2020): Extending intelligent content delivery in technical communication by semantics: microdocuments and content services. ETLTC, Japan. https://doi.org/10.1051/shsconf/20207703009
[4] Ziegler, Wolfgang (2020): Regelmäßig Inhalte vernetzen: MicroDocs im Content-Delivery. Vortrag und Tagungsband, tekom-Jahrestagung 2020.
[5] https://iirds.org/material-downloads/iirds-version-1-0-1/; https://iirds.org/material-downloads/sample-content/
[6] https://www.i4icm.de/scr/; https://www.i4icm.de/downloads/scr/
[7] Ziegler, Wolfgang: Keynote on „Semantic Correlation Rules“. ETLTC2021. https://etltc-acmchap-japanconf.org/
[8] Ziegler, Wolfgang (2017): Metadaten für intelligenten Content. In: Intelligente Informationen, Schriften zur Technischen Kommunikation, Band 22, Hrsg. Hennig, Jörg / Tjarks-Sobhani, Marita. tcworld GmbH: Stuttgart.