Page 52

BIT 01-2017

Output-Zentrale und Document-Factory Output-Management Compart: Ein Fachbeitrag zum Unicode-Standard Muss man alles können? Unicode ist ein seit 25 Jahren existierender Standard für die digitale Kodierung von Schriftzeichen unterschiedlicher Kulturen. Theoretisch lässt sich mit der aktuellen Unicode- Version nahezu jedes Schriftsystem dieser Welt abdecken. Nur: Kein Font unterstützt alle Zeichen. Die Frage ist daher, wie weit ein Unternehmen in Sachen Unicode gehen sollte. Wenn es um die digitale Kodierung von Schriftzeichen geht, werden recht schnell einige Mankos deutlich. Zwar setzen die meisten Unternehmen inzwischen Unicode oder mehrere Codepages ein, welche die grundlegenden Buchstaben des lateinischen Alphabets abdecken. Doch bei Sonderzeichen, anderen Alphabeten oder selten genutzten diakritischen Zeichen, stoßen viele schnell an ihre Grenzen. Das ist natürlich problematisch, denn Namen von Personen, Produkten, Marken, Adressen etc., die besondere Buchstaben enthalten, werden dann zum Teil unterschiedlich erfasst oder fehlerhaft dargestellt – je nachdem, welcher Zeichensatz gerade verwendet wird. Vor allem in der öffentlichen Verwaltung handelt es sich hier um einen sensiblen Punkt, denn mit der korrekten Schreibweise können juristische Aspekte verknüpft sein. Zudem haben in vielen EU-Ländern sowie in den USA und Kanada die Bürger einen Rechtsanspruch auf die Richtigkeit ihres Namens, wobei die Transkription mitunter zu Schwierigkeiten führt. Zum Verständnis: Wenn beispielsweise der Name Møller in manchen Unternehmen als Möller oder Moller geführt wird (weil deren Zeichensatz das ø nicht enthält), schlägt die Suche in der Kundendatenbank oder im Melderegister möglicherweise fehl, weil der Name in abweichender Schreibweise geführt wird. Unicode: Auf das Wichtige konzentrieren Auf den ersten Blick ließe sich dieses Problem mit Unicode lösen, denn die aktuelle Version dieses Zeichensatzstandards ist in der Lage, nahezu alle Schriften dieser Welt abzudecken. Tatsächlich sind in der aktuellen Version weit über 100000 Zeichen berücksichtigt. Nur – was nützen einem die mehr als eine Million theoretisch zur Verfügung stehenden Unicode- Zeichen, wenn sie nicht von den eingesetzten Fonts unterstützt werden? Bekanntlich genügt es nicht, die Buchstaben bzw. Zeichen zu kodieren – sie müssen sich auch darstellen lassen. Viele gängige Fonts haben mit 400 bis 500 Zeichen einen sehr begrenzten Umfang. Da stößt man schnell an Grenzen, wenn man bedenkt, dass sich beispielsweise in Deutschland allein die Behörden schon auf 700 einheitlich zu verwendende Buchstaben und Symbole geeinigt haben. Unternehmen und Organisationen stehen also vor der Frage, welche Unicode-Zeichen sie überhaupt benötigen und wie sie sich darstellen lassen. Fakt ist: Es gibt keinen Font, der alle Unicode-Zeichen unterstützt, nicht mal die erwähnten 700. Inzwischen nimmt das Thema an Fahrt auf, denn die Internationalisierung unserer Gesellschaft hinterlässt auch in der geschäft lichen Kommunikation ihre Unternehmen und Organisationen stehen vor der Frage, welche Unicode-Zeichen sie benötigen und wie sie sich darstellen lassen. Die Unterstützung eines Spezialisten für Dokumenten- und Output-Management, der sich auch mit den Spezifika von Unicode auskennt, ist sinnvoll. Abb.: everythingpossible, Fotolia. 52 | BIT 1–2017


BIT 01-2017
To see the actual publication please follow the link above