Последние учебники веб-разработки
 

HTML наборы символов


Для корректного отображения страницы HTML, браузер должен знать, какой набор символов (кодировка символов) для использования.


HTML наборы символов

Что такое правильный кодировки символов для использования в HTML?

Для HTML5, кодировка символов по умолчанию является UTF-8.

Это не всегда было так. Кодировка символов для раннего веб был ASCII.

Позже, из HTML 2.0 для HTML 4.01, ISO-8859-1 считается стандартом.

С помощью XML и HTML5, UTF-8, наконец, прибыл, и решить множество проблем кодирования символов.

Ниже приводится краткое описание стандартов кодировки символов.


В начале: ASCII

Компьютерная информация (номера, тексты и рисунки) хранится в виде двоичных единиц и нулей (01000101) в электронике.

Для того, чтобы стандартизировать хранение буквенно-цифровых символов, был создан Американский стандартный код для обмена информацией (ASCII). Он определил уникальный двоичный 7-битное число для каждого хранимого характера для поддержки цифры от 0-9, верхний / нижний регистр буквы английского алфавита (AZ, AZ), а также некоторые специальные символы, такие как! $ + - () @ <>.

Поскольку ASCII используется один байт (7 битов для символа, а также один из бит для контроля четности передачи), она может представлять только 128 различных символов. Кроме того 32 из этих символов были зарезервированы для других целей управления.

Самая большая слабость с ASCII было то, что она исключала не являющимся английскими буквами.

ASCII все еще широко используются сегодня, особенно в больших ЭВМ компьютерных систем.

Для более близкого взгляда, пожалуйста , изучить наш Complete Reference ASCII .


В операционной системе Windows: ANSI

ANSI (также называемый Windows-1252) был набор символов по умолчанию в Windows, вплоть до Windows 95.

ANSI является расширением ASCII, с добавлением международных символов. Он использует полный байт (8-бит) для представления 256 различных символов.

Так как ANSI был набор символов по умолчанию в Windows, он поддерживается всеми браузерами.

Для более близкого взгляда, пожалуйста , изучить наш полный ANSI Reference .


В HTML 4: ISO-8859-1

Поскольку большинство стран используют символы вне ASCII, кодировка символов по умолчанию в стандарте HTML 2.0 был изменен на ISO-8859-1.

ISO-8859-1 является расширением ASCII, с добавлением международных символов. Как ANSI, он использует полный байт для представления в два раза больше символов, чем ASCII.

Заметка Когда браузеры обнаружить ISO-8859-1 на веб-странице, они обычно по умолчанию ANSI, потому что ANSI идентичен ISO-8859-1, за исключением, что ANSI имеет 32 дополнительных символов.

Если веб - страница HTML 4 использует другой символьный набор , чем ISO-8859-1, он должен быть указан в <meta> тег:

пример

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Попробуй сам "

Заметка

Набором символов по умолчанию для HTML5 является UTF-8.
Все HTML 4 процессоры поддерживают UTF-8, и все процессоры HTML5 и XML поддерживают как UTF-8 и UTF-16.

Для более близкого взгляда, пожалуйста , изучить наш полный ISO-8859-1 Reference .


В HTML5: Unicode UTF-8

Поскольку наборы символов, перечисленные выше, ограничены, и не совместимы в многоязычной среде, Консорциум Unicode разработал стандарт Unicode.

В Unicode Стандартные крышки (почти) все символы, знаки препинания и символы в мире.

Unicode позволяет обрабатывать, хранение и транспортировка текста, независимо от платформы и языка.

Кодировка символов по умолчанию в HTML5 является UTF-8.

Для более близкого взгляда, пожалуйста , изучить наш Complete Reference Unicode .