En son web geliştirme öğreticiler
 

HTML Karakter Setleri


Doğru bir HTML sayfasını görüntülemek için, tarayıcı karakter kümesi bilmek gerekir (character encoding) kullanmak.


HTML Karakter Setleri

HTML kullanılacak doğru karakter kodlama nedir?

HTML5 için varsayılan karakter kodlama UTF-8'dir.

Bu her zaman böyle olmamıştır. Erken web için karakter kodlama ASCII oldu.

Daha sonra 4.01 HTML HTML 2.0, ISO-8859-1 standardı olarak kabul edildi.

XML ve HTML5 ile UTF-8 nihayet geldi ve karakter kodlama sorunların çoğunu çözdük.

Aşağıda karakter kodlama standartlarının kısa bir açıklamasıdır.


Başlangıçta: ASCII

Bilgisayar bilgisi (numbers, texts, and pictures) ikili birler ve sıfırlar olarak saklanır (01000101) elektronik.

Alfanümerik karakterden saklanmasını standardize etmek için, Bilgi Değişimi İçin Amerikan Standart Kodu (ASCII) oluşturuldu. Bu 0-9 arasındaki sayıları desteklemek için her depolanabilir karakter için benzersiz bir ikili 7-bit numara tanımlı, üst / küçük harf İngiliz alfabesi (az, AZ) , ve benzeri bazı özel karakterler! $ + - ( ) @ <>.

ASCII bir byte (karakter için 7 bit ve iletim eşlik kontrolü için bit biri) kullanılan olduğundan, sadece 128 farklı karakteri temsil edebilir. Ayrıca bu karakterlerin 32 diğer kontrol amacıyla ayrıldı.

ASCII ile büyük zayıflığı olmayan İngilizce harfleri hariç olmasıydı.

ASCII özellikle büyük Ana bilgisayar sistemlerinde yaygın kullanımda hala bugün.

Daha yakından bakmak için lütfen öğrenim lütfen Komple ASCII Referans .


Windows'ta: ANSI

ANSI (also called Windows-1252) Windows 95 kadar Windows ayarlanan varsayılan karakterdi.

ANSI eklendi uluslararası karakterler ile ASCII bir uzantısıdır. Bu tam bir bayt kullanır (8-bits) 256 farklı karakteri göstermek için.

ANSI Windows'da ayarlanan varsayılan karakter olmuştur yana, tüm tarayıcılar tarafından desteklenmektedir.

Daha yakından bakmak için lütfen öğrenim lütfen Komple ANSI Referansı .


ISO-8859-1: HTML 4'te

çoğu ülkede ASCII dışında karakterler kullanmak için, HTML 2.0 standardında varsayılan karakter kodlama ISO-8859-1 olarak değiştirilmiştir.

ISO-8859-1 eklendi uluslararası karakterler ile ASCII bir uzantısıdır. ANSI gibi, ASCII daha iki kat daha fazla karakteri temsil etmek için tam bayt kullanır.

tarayıcılar bir web sayfasında ISO-8859-1 tespit ederlerse ANSI ANSI 32 ekstra karakterler var olması dışında ISO-8859-1 ile aynıdır, çünkü normalde, ANSI varsayılan.

Bir HTML 4 web sayfası farklı bir karakter-set ISO-8859-1 daha kullanıyorsa, belirtilmelidir <meta> etiketi gibi:

Örnek

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

HTML5 için ayarlanan varsayılan karakter UTF-8'dir.
Tüm HTML 4 işlemciler UTF-8 destekleyen ve tüm HTML5 ve XML işlemciler UTF-8 ve UTF-16 ikisini de destekler.

Daha yakından bakmak için lütfen öğrenim lütfen Komple ISO-8859-1 Referansı .


HTML5'de: Unicode UTF-8

Yukarıda listelenen karakter setleri sınırlı ve çok dilli ortamlarda uyumlu olmadığından, Unicode Consortium Unicode Standard geliştirdi.

Unicode Standardı kapakları (almost) dünyadaki tüm karakterler, noktalama işaretleri ve semboller.

Unicode platform ve dilden bağımsız işleme, depolama, ve metnin taşınmasını mümkün kılar.

HTML5'teki varsayılan karakter kodlama UTF-8'dir.

Daha yakından bakmak için lütfen öğrenim lütfen Komple Unicode Referansı .