UTF-8

UTF-8 ist ein Norm für die Kodierung von Zeichen mit daten variabler Länge. Möchte man alle Zeichen einheitlich kodieren, dann müßten für jedes Zeichen mindestens 4 Bytes verwendet werden. Um an Datenmenge zu sparen, verwendet diese Norm je nach Zeichen 1, 2, 3 oder 4 Bytes. Spezielle Bit-Indikatoren verraten dem interpretierenden System, mit wievielen Bytes das Zeichen kodiert wurde.