02 Was ist Unicode?

Unicode – Wikipedia

Der ASCII-Code mit seinen 7 Bit bietet nicht genügend Raum, um alle Zeichen der menschlichen Sprachen gleichzeitig abzubilden.

Um den Anforderungen der verschiedenen Sprachen gerecht zu werden, wurde der Unicode entwickelt. Er verwendet bis zu 32 Bit pro Zeichen und könnte somit über vier Milliarden verschiedene Zeichen unterscheiden, wird jedoch auf etwa eine Million erlaubte Zeicheneingeschränkt.

Damit können alle bislang von Menschen verwendeten Schriftzeichen dargestellt werden, sofern sie in den Unicode-Standard aufgenommen wurden.

Im Oktober 1991 wurde nach mehrjähriger Entwicklungszeit die Version 1.0.0 des Unicode-Standards veröffentlicht, die damals nur die europäischen, nahöstlichen und indischen Schriften kodierte. Acht Monate später erschien Version 1.0.1, die erstmals ostasiatische Zeichen kodierte. Mit der Veröffentlichung von Unicode 2.0 im Juli 1996 wurde der Standard von ursprünglich 65.536 auf die heutigen 1.114.112 Codepunkte, von U+0000 bis U+10FFFF erweitert.