Character Encoding Definition

Was ist Character Encoding?

Während wir Textdokumente als Textzeilen betrachten, sehen Computer sie als Binärdaten oder eine Reihe von Einsen und Nullen. Daher müssen die Zeichen in einem Textdokument durch numerische Codes dargestellt werden. Um dies zu erreichen, wird der Text unter Verwendung einer von mehreren Arten der Zeichenkodierung gespeichert.

Die gängigsten Arten der Zeichenkodierung sind ASCII und Unicode. Während ASCII noch von fast allen Texteditoren unterstützt wird, wird Unicode häufiger verwendet, da es einen größeren Zeichensatz unterstützt. Unicode wird oft als UTF-8, UTF-16 oder UTF-32 definiert, die sich auf verschiedene Unicode-Standards beziehen. UTF steht für „Unicode Transformation Format“ und die Zahl gibt die Anzahl der Bits an, die zur Darstellung der einzelnen Zeichen verwendet werden. Seit den Anfängen der Computertechnik werden Zeichen durch mindestens ein Byte (8 Bits) dargestellt, weshalb die verschiedenen Unicode-Standards Zeichen in Vielfachen von 8 Bits speichern.

Während ASCII und Unicode die gängigsten Arten der Zeichenkodierung sind, können auch andere Kodierungsstandards zur Kodierung von Textdateien verwendet werden. So gibt es beispielsweise verschiedene sprachspezifische Zeichenkodierungsstandards, wie westliche, lateinamerikanische, japanische, koreanische und chinesische. Während westliche Sprachen ähnliche Zeichen verwenden, benötigen östliche Sprachen einen völlig anderen Zeichensatz. Daher würde eine lateinische Kodierung nicht die Symbole unterstützen, die zur Darstellung einer Zeichenkette im Chinesischen erforderlich sind. Glücklicherweise unterstützen moderne Standards wie UTF-16 einen ausreichend großen Zeichensatz, um sowohl westliche als auch östliche Buchstaben und Symbole darzustellen.

Die Definition von Character Encoding auf dieser Seite ist eine Originaldefinition von SharTec.eu.
Das Ziel von SharTec ist es, Computerterminologie so zu erklären, dass sie leicht zu verstehen ist. Wir bemühen uns bei jeder von uns veröffentlichten Definition um Einfachheit und Genauigkeit. Wenn Sie Feedback zur Zeichencodierung-Definition haben oder einen neuen Fachbegriff vorschlagen möchten, kontaktieren Sie uns bitte.