Von ASCII bis XLIFF

Text: Florian Sachse

Wer sich näher mit der Softwarelokalisierung beschäftigt, taucht früher oder später in eine eigene Begriffswelt ein. Kann die Mehrheit mit der Bezeichnung „ASCII“ noch etwas anfangen, dann wird es bei „Assembly“, „BOM“, „Codepoint“ oder „XLIFF“ schon deutlich schwieriger. Deshalb soll dieser Beitrag die Begriffswelt von Programmierung und Lokalisierung zugänglicher machen und wesentliche Begriffe und Entwicklungen erklären.

Inhaltsübersicht

Lesedauer: 07:42 Minuten

Angefangen hat die Lokalisierung mit dem ASCII-Zeichensatz – „American Standard Code for Information Interchange“. Er umfasst 128 Zeichen und enthält Ziffern, übliche Sonderzeichen und das lateinische Alphabet in Groß- und Kleinbuchstaben. Die Beschränkung auf 128 Zeichen schien anfangs keine große Einschränkung und – was besonders wichtig war – man benötigte nur sieben Bits, um ein Zeichen zu kodieren. Damit blieb eines in Reserve, da Bytes mit ihren acht Bits die kleinsten zu verarbeitenden Einheiten sind. Dieses Bit wurde als ‚Prüfbit’ eingesetzt, um die korrekte Übermittlung von Daten per Datenleitung oder Modem sicherzustellen. Bis heute haben Anwendungen zum Beispiel im Maschinenbau oder der Laborautomatisierung überlebt, die den ASCII-Zeichensatz verwenden. Auch vieles, was beispielsweise die Programmiersprachen „C“ und „C++“ von Hause aus an Textbearbeitungsfunktionen enthalten, ...