Mittwoch, September 14

 

UTF-8 was und warum?

UTF-8 oder Unicode Transformation Format in 8 Bit ist ein Unicode Format um Text zu übertragen. Es ist das Standardformat für XHTML und deswegen für Webdesigner wichtig.

Früher einmal war ein Buchstabe durch 8 Bit, also 1 Byte, codiert. Heutzutage will man aber mehr als 256 Zeichen verwenden. Die Chinesen würden nichtmal ihr Alphabet da drin unterbringen. Sonderzeichen, wie zum Beispiele viele verschiedene Landeswährungen ( € ¥ $ £ ), müssen ja auch noch rein. UTF-8 erlaubt deswegen bis zu 4 Byte pro Zeichen (232=4.294.967.296 Zeichen). Die Ersten 128 sind identisch mit dem alten ASCII Zeichensatz, so dass Unicode abwärtskompatibel ist.

Was bedeutet es nun, dass UTF-8 Standard für XHTML ist? Zum Beispiel, dass es eigentlich unnötig ist, HTML Entities wie Uuml und szlig zu verwenden. UTF-8 hat alle diese Zeichen im Zeichensatz, also ist eine zusätzliche Kodierung sinnlos.

Probleme gibt es nur, wenn der Browser oder andere Empfänger es nicht als Unicode erkennen. Das kann passieren, wenn der Webserver Mist baut oder falls der Editor des Webdesigners die Dateien nicht als UTF-8 abspeichert. In Deutschland kommt oft iso-8895-1 alias Latin-1 zum Zuge, aber Vorteile zu UTF-8 gibt es eigentlich keine. Leider gibt aus auch noch keine Betriebssystem, das Unicode bis zum letzten Winkel integriert hat. OSX und Ubuntu sollen am nächsten dran sein.

Zusammenfassend: Keine Angst Sonderzeichen direkt zu schreiben und immer Alles (HTML, CSS und Co) in UTF-8 abspeichern.

Kommentare

i thought your blog was cool and i think you may like this cool Website. now just Click Here
 
Anonymous Anonym sagte:
This is very interesting site... » » »
 
Anonymous Anonym sagte:
Very cool design! Useful information. Go on! »
 
Kommentar abgeben

<< Hauptseite