Gesucht und gefunden dank Index

Text: Walter Greulich

Durch die heutige Volltextsuche ist der Nutzen eines Index oder auch Registers in Vergessenheit geraten. Dabei kann er moderne Verfahren sehr gut ergänzen. Eine passende Gelegenheit, um das Image des Indexierens aufzupolieren.

Inhaltsübersicht

Lesedauer: 08:58 Minuten

Technische Dokumentationen haben am Ende häufig einen Index. Nicht selten allerdings gibt dessen nähere Untersuchung Anlass zu der Vermutung, er sei im letzten Moment etwas lieblos erstellt worden. Das Erzeugen eines Index scheint so manche Technische Redakteurin und so mancher Redakteur als Last, als notwendige Pflicht empfunden zu haben. Gründe dafür gibt es sicher einige. Ein wichtiger, wenn nicht gar entscheidender Grund ist die Tatsache, dass der Sinn und der Nutzen von Indexen heute nicht mehr gesehen werden. Denn macht die Volltextsuche in PDFs oder in EPUB-basierten E-Books einen Index nicht überflüssig? Schützenhilfe erhalten Indexkritiker durch iiRDS, den intelligent information Request and Delivery Standard [1]. Den Standard hat die tekom gemeinsam mit anderen Partnern entwickelt. Mit iiRDS wird die Handhabung von Metadaten geregelt, die für Dokumente vergeben werden können. Ein wichtiger Aspekt dabei ist die bessere Erschließbarkeit der Inhalte.

Eigene Schlagworte definieren

Im Grunde ist aber genau das auch Aufgabe eines guten Index: Inhalte einer Benutzerin oder einem Benutzer zugänglich zu machen. Die Vergabe von Metadaten läuft, vereinfacht ausgedrückt, auf eine Verschlagwortung des Inhalts hinaus. Schlagworte sind Begriffe, die so geschrieben nicht unbedingt im Dokument vorkommen müssen. Vielmehr muss sie sich die Technische Redakteurin oder der Redakteur ausdenken und dem Dokument zuweisen. Ein Index dagegen wird oft als reine Sammlung von im Dokument enthaltenen Begriffen gesehen: Wörter werden markiert und als Indexeintrag festgelegt.

In den gängigen Programmen wie Microsoft Word, Adobe InDesign und FrameMaker bedeutet das Festlegen eines Indexeintrags, dass ein markiertes Wort zum Inhalt eines Feldes wird, das im Text eingebettet wird. Man spricht auch von Embedded Indexing. Was selten genutzt wird, ist die Möglichkeit, leere Indexfelder zu erzeugen und diese manuell mit Inhalt zu versehen, mit anderen Worten: Schlagworte selbst zu vergeben. Die Aufnahme von Schlagworten erhöht die Qualität eines Index immens. Hieße das etwa, dass auf Metadaten verzichtet werden kann, wenn ein guter Index erstellt wird? Die Antwort lautet klar nein. Denn beide Ansätze besitzen eigene Merkmale, durch die sie zu voneinander unabhängigen Methoden der Inhaltserschließung werden. Die Metadatenerzeugung nach iiRDS und die Indexerzeugung sind keine Konkurrenten, sondern können sich sehr gut ergänzen.

Eigenschaften eines guten Index

Was ist ein Index oder auch ein Register genau? Wer schon an einem der Themenabende teilgenommen hat, die ich in lockerer Reihenfolge bei den tekom-Regionalgruppen abgehalten habe, kennt folgende Definition: „Ein Register oder Index ist eine nach einheitlichen Kriterien systematisch erstellte, meist alphabetisch angeordnete Liste von Themen, Schlagwörtern, Begriffen und Dokumenteigenschaften, die dem Leser den Zugang zum Inhalt des Dokuments erleichtert.“

Die Definition stammt von Hans H. Wellisch, einem der Registerpäpste im angelsächsischen Raum [2]. In der Definition sind praktisch alle Aspekte enthalten, die den Weg hin zu einem guten Index beschreiben:

  • einheitliche Kriterien
  • Systematik
  • alphabetische Anordnung
  • Aufnahme von Themen, Schlagwörtern, Begriffen und Dokumenteigenschaften

Mit anderen Worten: Ein Index sollte nicht auf die Schnelle erzeugt werden, denn dann bleiben notgedrungen die einheitlichen Kriterien und die Systematik auf der Strecke. Die Konsequenz ist, dass dem Leser eines solchen Index der Zugang zum Inhalt des Dokuments nicht erleichtert, sondern erschwert wird. Er greift zu anderen Mitteln, um Inhalt zu finden, etwa zur Nutzung des Inhaltsverzeichnisses oder – bei PDFs und E-Books – zur Volltextsuche.

Unterschiede der Verfahren

Metadaten, Indexe und Volltextsuchen sind letztlich dazu da, das Finden von Informationen zu erleichtern. Informationen sind nicht irgendwelche Daten. Es handelt sich eher um solche, die eine Person interessieren, zum Beispiel, weil sie ein Problem bei der Handhabung eines Geräts lösen möchte. Die Frage lautet also: Sind alle Suchverfahren gleichermaßen in der Lage, die interessanten Textstellen zugänglich zu machen?

Schaut man sich an, wie Technische Dokumente heute erstellt werden, so rückt ein Aspekt in den Vordergrund: die Modularisierung. Egal, ob mit einem Redaktionssystem, einem Layout- oder Textverarbeitungsprogramm – immer wird versucht, in kleinen Portionen zu arbeiten, von denen sich möglichst viele für unterschiedliche Zwecke kombinieren lassen. Wenn dabei nach gewissen Standards systematisch vorgegangen wird, reduziert sich bei der Erzeugung eines Gesamtdokuments nicht nur die Fehlerquote, sondern auch der Aufwand. Genau das ist auch ein Ziel von iiRDS.

Was das Auffinden von Informationen betrifft, zeigt sich dabei ganz deutlich, welche Rolle die verschiedenen Suchverfahren einnehmen. Metadaten werden zum Beispiel für ein Modul als Ganzes vergeben und beschreiben dessen Eigenschaften. In vernetzten digitalen Umgebungen müssen Module nicht mehr zu einem Gesamtdokument vereinigt werden, vielmehr lassen sich einzelne Module mit den interessierenden Eigenschaften treffsicher über die Metadaten finden, zum Beispiel die Beschreibung einer Fehlerbehebung. Das Problem bei Metadaten besteht aber darin, dass nicht alle Nutzer Zugriff auf sie haben. Im Herstellungs- und Wartungsprozess wird die Verwendung von Metadaten sicher zu einer höheren Effektivität führen. Fraglich ist aber, ob der Endkunde damit zufriedengestellt werden kann.

Die Volltextsuche kommt komplett ohne eine Vorbereitung durch die Technische Redaktion aus. Die Programme, in denen eine Suche gestartet wird, gehen jeweils den kompletten Wortbestand (einen Volltextindex im Hintergrund) durch – mit hoher Geschwindigkeit, was sicherlich einer der Hauptvorteile ist. Die Modularisierung von Dokumenten bzw. die Synthese von Modulen hat keinerlei Auswirkung auf das Funktionieren einer Volltextsuche. Die Volltextsuche hat aber den Nachteil, dass jegliche Informationen über Zusammenhänge fehlen. Als Suchergebnis erhält man nicht wirklich Informationen, sondern eine Liste mit Fundstellen bzw. unstrukturierten Daten. Sie müssen recht mühsam durchforstet werden.

Ergebnis einer Analyse

Solange Gebrauchs- und Betriebsanleitungen in gedruckter Form oder als PDF erstellt werden, können Indexe ihr Potenzial als Such- und Findehilfe entfalten. Einen Index mitzuliefern, dürfte grundsätzlich kein Problem sein. Die Nutzung eines Index muss nicht erläutert werden, sondern erschließt sich intuitiv. Vorausgesetzt, er ist gut gemacht (Inf. 01).

Indexbegriffe sind, falls eine Technische Dokumentation modular erstellt wurde, mit Textstellen im Inneren der Module verknüpft und bilden daher andere Eigenschaften von Modulen ab als Metadaten. Inhalte von Modulen, aber auch von ganzen Dokumenten zu analysieren und als Analyseergebnis die passenden Begriffe in einen Index aufzunehmen, macht die Kunst des Indexierens aus. Das modulare Vorgehen erfordert allerdings immer einen gewissen Anpassungsaufwand, denn die Gewichtung von Indexbegriffen kann sich verschieben, wenn Module zu einem Ganzen vereinigt werden.

Ähnlich wie bei der Metadatensuche vermittelt ein guter Index Zusammenhänge. Er liefert Informationen und führt eine Person ebenfalls schnell und sicher zum Ziel. Dass das funktioniert, liegt in erster Linie daran, dass die Technische Redaktion bei der Verschlagwortung und Festlegung eines Indexeintrags Bedeutung und Relevanz der Begriffe abwägt und intelligente Entscheidungen fällt. Metadaten und gute Indexe fungieren als Filter für die wichtigen Informationen in einem Modul oder Dokument.

Merkmale eines guten Index/Registers

Äußere Merkmale:

  • Er enthält keine Schreibfehler.
  • Er besitzt konsistente Schreibweisen.
  • Er enthält keine Einzahl-Mehrzahl-Fehler.
  • Er ist korrekt sortiert.
  • Er gibt nicht mehr als fünf Seitenzahlen nach dem jeweiligen Thema an.
  • Er enthält Seitenbereichsangaben, nicht nur Verweise auf einzelne Seiten.
  • Er ist optisch gut gegliedert, das heißt, er weist wenigstens zwei, höchstens drei Stufen (Ebenen) auf und arbeitet mit Einzügen für die Untereinträge.

Allein durch die Erfüllung dieser äußeren Merkmale erhöht sich die Brauchbarkeit eines Index so sehr, dass die Leser daran ihre Freude haben.

Innere Merkmale:

  • Er ist möglichst vollständig und enthält alle wichtigen Begriffe.
  • Er enthält ausreichend viele, trotzdem aber keine redundanten Untereinträge.
  • Er zeigt vor allem durch die geschickte Wahl von Untereinträgen Zusammenhänge zwischen den Begriffen auf.
  • Er ist kein reines Stichwortregister (Extraktionsindex), sondern enthält ausreichend viele Schlagworte, die den Inhalt beschreiben (Zuteilungsindex).
  • Er bietet ausreichend viele sinnvolle Querverweise. Diese lassen sich sehr gut bilden, wenn man Schlagworte aufnimmt, zum Beispiel Synonyme zu im Text vorhandenen Begriffen.
  • Er bietet dem Leser mehrere Einstiege zu wichtigen Themen. Erreicht wird das neben der Aufnahme von Synonymen durch das so genannte Double Posting. Ein Beispiel wäre, nicht nur Begriff und Unterbegriff aufzunehmen, sondern auch die Umkehrung – selbstverständlich nur, wenn der Unterbegriff als Hauptthema geeignet ist, sich also wieder ein vernünftiger Eintrag ergibt. Wenn Sie es ausprobieren, werden Sie feststellen, dass ein Double Posting erstaunlich oft möglich ist, und das bei äußerst geringem Aufwand.

Zur Erfüllung der inneren Merkmale ist ein gewisser Aufwand nötig, und es gehört etwas Übung dazu. Je mehr Indexe man erstellt hat, umso leichter fällt es, im richtigen Moment, an der richtigen Stelle im Dokument die optimale Indexeintragsentscheidung zu treffen. Nicht zu unterschätzen ist darüber hinaus die Hilfe, die technische Verfahren bieten können.

Inf. 01 Quelle Walter Greulich

Erinnern und Entdecken

Aus der Sicht der suchenden Person spielt noch ein weiterer Punkt eine große Rolle: die Art der Recherche. Sie kann auf zwei grundsätzlich verschiedene Weisen durchgeführt werden [3]:

  • Die Person ist sicher, dass in einem Dokument ein bestimmter Aspekt behandelt wird, weiß aber nicht wo. Das kann als Zielrecherche bezeichnet werden, manchmal spricht man auch von Erinnerungsrecherche.
  • Es gibt aber Situationen, in denen nicht klar ist, wonach gesucht werden soll. Die Person kennt zum Beispiel die Begriffe nicht, die in einer Bedienungsanleitung verwendet werden, um ein Problem und dessen Lösung zu beschreiben. Dann ist es hilfreich, wenn die Anleitung neben dem Inhaltsverzeichnis ein alphabetisches Verzeichnis anbietet, das eine Ent­deckungsrecherche erlaubt.

Man sollte sich klarmachen, dass sowohl bei der Metadaten- als auch der Volltextsuche immer ein bestimmtes Ziel gesucht wird. Eine Person gibt den Zielbegriff zunächst ein und wartet auf das, was bei der Suche herauskommt. Dass beim Durchsehen der Ergebnisliste eventuell auch Dinge entdeckt werden, an die man bei der Eingabe nicht gedacht hat, ist eher ein Nebenaspekt. Falls nichts Interessantes gefunden wurde, muss die Suche mit einer abgewandelten Schreibweise des Begriffs oder gleich mit ganz anderen Suchkriterien erneut durchgeführt werden.

Ein guter Index dagegen erlaubt von vornherein eine ungezielte Suche. Eine Möglichkeit für eine solche Entdeckungsrecherche wäre, probehalber verschiedene Stellen der alphabetischen Liste auf sich wirken zu lassen. Dabei bekommt man unvermutet Anregungen, die das Suchen einfacher machen. Beispielsweise wird es in einem guten Index Querverweise geben, die von einem Alternativbegriff zu demjenigen Registerbegriff führen, der von der Technischen Redakteurin oder dem Redakteur im Anleitungstext verwendet wurde. Der zugehörige Seitenverweis führt schließlich zur Fundstelle im Text. Das gezielte Suchen, also eine Erinnerungsrecherche, ist in einem Index natürlich genauso möglich.

Ein echter Zusatznutzen

Heute ist die Volltextsuche sozusagen ein nützliches Abfallprodukt, das sich automatisch aus der Digitalisierung von Dokumenten ergibt. Sie liefert aber als Ergebnis keine Informationen, sondern unstrukturierte Daten. Das gewünschte Ziel zu erreichen, eine Information zu finden, ist möglich, kann aber mühsam sein.

Jegliche Arbeit, die zusätzlich in die Beschreibung von Inhalten einfließt, wertet Dokumente auf und erleichtert die Suche nach Informationen. Metadaten können ihre volle Kraft in Produktions- und Wartungsprozessen entfalten. Bei der Endkundin oder dem Endkunden dagegen ist ein guter Index das Mittel der Wahl, wenn es um das Finden von Informationen geht. Indexe sind nicht nur in der Handhabung leicht zu verstehen. Wie keine andere Methode bieten sie die Möglichkeit, ungezielt zu suchen und Anregungen zu erhalten. Indexe sind daher auch heute nicht überflüssig.

Die Art und Weise, wie sie erstellt werden, ändert sich mit den Anforderungen, die sich durch den technischen Wandel ergeben. Zum Beispiel steht für das Embedded Indexing in Microsoft Word und Adobe InDesign das Zusatzprogramm IndexManager zur Verfügung, das eine interaktive Verbindung zwischen den Einträgen im Register und den Eintragsfeldern im Dokument schafft. Wird ein Eintrag im Register bearbeitet, sind die Änderungen sofort auch im zugehörigen Feld zu sehen und umgekehrt. Darüber hinaus können Indexeinträge über mehrere Dokumente hinweg ohne großen Aufwand aufeinander abgestimmt werden, was beim Zusammenfügen von Modulen zu einem Gesamtdokument sehr hilfreich ist.

Neben dem Embedded Indexing entwickelt sich auch das so genannte Separate-File Indexing weiter. Dabei entsteht der Index separat vom Inhaltsdokument. So können etwa Markierungen, die in einem PDF-Dokument vorgenommen werden, auf Knopfdruck in einen Index überführt werden. Eine sehr spannende Angelegenheit ist das Nutzen von SmartIDs. Dabei werden die Absätze in Word oder InDesign per Makro oder Skript mit eindeutigen Nummern versehen, die in einem separaten Indexprogramm – das kann zum Beispiel Excel sein – anstelle von Seitenzahlen als Locators verwendet werden. Locators sind allgemein „Zeiger“, die zur jeweiligen Fundstelle führen. Man hat dann die Wahl: Entweder werden die IDs sowohl im endgültigen Dokument als auch im fertigen Register offen gezeigt oder sie werden vor der Veröffentlichung im Dokument gelöscht und im Register in Seitenzahlen konvertiert. Das SmartID-Verfahren hat zwei wesentliche Vorteile:

  1. Verschiebungen oder Ergänzungen im Text werden automatisch über die eindeutige ID nachverfolgt, so dass bei einer Konvertierung immer die richtigen Seitenzahlen herauskommen.
  2. Als separate Indexing-Software können neben Excel auch die Profi-Indexing-Programme Cindex, Sky Indexing und Macrex zum Einsatz kommen, mit denen sich ausgereifte Methoden zur Erzeugung guter Indexe nutzen lassen.

Mehr darüber in den nächsten Ausgabe der ‚technischen kommunikation‘.

Links und Literatur zum Beitrag

[1] https://iirds.org/

[2] Wellisch, Hans H. (2000): Glossary of Terminology in Abstracting, Classification, Indexing, and Thesaurus Construction. 2nd edition. Information Today, Medford.

[3] Fugmann, Robert (2006): Das Buchregister. Methodische Grundlagen und praktische Anwendungen. Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis, Frankfurt/Main.

Quelle CSH