Los últimos tutoriales de desarrollo web

Codificación HTML (el conjunto de caracteres)


Para visualizar una página HTML correctamente, un navegador web debe conocer el conjunto de caracteres (character encoding) para su uso.


¿Qué es la codificación de caracteres?

ASCII fue el primer estándar de codificación de caracteres (también llamado juego de caracteres). Define 127 caracteres alfanuméricos diferentes que podrían ser utilizados en Internet.

HTML (Hypertext Markup Language) ha estado en uso desde 1991, pero HTML 4.0 (diciembre de 1997) fue la primera versión estandarizada, donde se les dio tratamiento caracteres internacionales razonablemente completa. Cuando un documento HTML incluye caracteres especiales por fuera del rango de ASCII de siete bits dos metas son dignas de consideración: la integridad de la información, y la pantalla del navegador universal.

Números apoyado ASCII (0-9) , letras del alfabeto inglés (AZ) , y algunos caracteres especiales como ! $ + - ( ) @ < > ! $ + - ( ) @ < > .

ANSI (Windows-1252) fue el conjunto original de caracteres de Windows. Se contaba con 256 códigos de caracteres diferentes.

ISO-8859-1 fue el juego de caracteres predeterminado para HTML 4. También contaba con 256 códigos de caracteres diferentes.

Debido a ANSI e ISO eran limitados, la codificación de caracteres por defecto fue cambiado a UTF-8 en HTML5.

UTF-8 (Unicode) cubre casi todos los caracteres y símbolos en el mundo.

Todos los procesadores de HTML 4 también soporta UTF-8.


El juego de caracteres atributo HTML

Para visualizar una página HTML correctamente, un navegador web debe conocer el conjunto de caracteres utilizado en la página.

Esto se especifica en el <meta> etiqueta:

Para HTML 4:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

Para HTML5:

<meta charset="UTF-8">

Si un navegador detecta ISO-8859-1 en una página web, que por defecto es ANSI, ANSI, porque es idéntica a la norma ISO-8859-1, excepto que ANSI tiene 32 caracteres adicionales.


Diferencias entre el conjunto de caracteres

La siguiente tabla muestra las diferencias entre los conjuntos de caracteres descritos anteriormente:

NumbASCIIANSI8859UTF-8 Descripción
32     espacio
33!!!! signo de exclamación
34"""" comilla
35#### símbolo de número
36$$$$ signo de dólar
37%%%% signo de porcentaje
38&&&& signo &
39'''' apóstrofe
40(((( paréntesis izquierdo
41)))) paréntesis derecho
42**** asterisco
43++++ Signo de más
44,,,, coma
45---- Guión menos
46.... punto
47//// solidus
480000 cero dígitos
491111 un dígito
502222 dos dígitos
513333 tres dígitos
524444 cuatro dígitos
535555 cinco dígitos
546666 seis dígitos
557777 siete dígitos
568888 ocho dígitos
579999 nueve dígitos
58:::: colon
59;;;; punto y coma
60<<<< signo menor que
61==== signo de igual
62>>>> signo mayor que
63???? signo de interrogación
64@@@@ comercial a
65AAAA Una letra mayúscula América
66BBBB Letra latina mayúscula
67CCCC Letra latina mayúscula
68DDDD letra mayúscula D latina
69EEEE E mayúscula América
70FFFF América letra F
71GGGG letra mayúscula G América
72HHHH Letra latina mayúscula
73IIII América I mayúscula
74JJJJ América capital letra J
75KKKK América letra mayúscula K
76LLLL Letra latina mayúscula
77MMMM Letra latina mayúscula
78NNNN América letra mayúscula N
79OOOO Letra latina O mayúscula
80PPPP letra mayúscula P América
81QQQQ América letra Q
82RRRR Letra latina mayúscula
83SSSS América letra mayúscula S
84TTTT letra mayúscula T América
85UUUU Letra latina U mayúscula
86VVVV América letra mayúscula V
87WWWW América letra mayúscula W
88XXXX América letra mayúscula X
89YYYY Letra latina mayúscula
90ZZZZ América letra mayúscula Z
91[[[[ corchete izquierdo
92\\\\ solidus inversa
93]]]] corchete derecho
94^^^^ acento circunflejo
95____ línea baja
96```` acento grave
97aaaa Letra latina pequeña una
98bbbb Letra latina pequeña b
99cccc Letra latina pequeña c
100dddd América pequeña letra d
101eeee Letra latina e minúscula
102ffff América pequeña letra f
103gggg América pequeña letra g
104hhhh América pequeña letra h
105iiii América pequeña letra i
106jjjj América pequeña letra j
107kkkk América pequeña letra k
108llll América pequeña letra l
109mmmm América pequeña letra m
110nnnn América pequeña letra n
111oooo América pequeña letra o
112pppp Letra latina pequeña p
113qqqq Letra latina pequeña q
114rrrr Letra latina pequeña r
115ssss América pequeña letra s
116tttt Letra latina t pequeña
117uuuu Letra latina u
118vvvv América pequeña letra v
119wwww Letra latina w
120xxxx América pequeña letra x
121yyyy América pequeña letra y
122zzzz América pequeña letra z
123{{{{ corchete izquierdo
124|||| linea vertical
125}}}} corchete derecho
126~~~~ tilde
127DEL   
128    Muestra euro
129     NO UTILIZADO
130    comilla bajo 9
131 ƒ   Letra latina f con gancho
132    doble comilla bajo 9
133    Puntos suspensivos horizontales
134    daga
135    daga doble
136 ˆ   carta de modificador de acento circunflejo
137    por cartel Mille
138 Š   Letra latina mayúscula S con caron
139    comilla ángulo apunta hacia la izquierda
140 Œ   capital de América ligadura de OE
141     NO UTILIZADO
142 Z   América letra mayúscula Z con caron
143     NO UTILIZADO
144     NO UTILIZADO
145    comilla simple izquierda
146    comilla simple derecho
147    comillas dobles izquierda
148    comilla doble hacia la derecha
149    bala
150    guión corto
151    guión largo
152 ˜   pequeña tilde
153    signo de marca
154 š   Letra latina s con caron
155    comilla ángulo apunta hacia la derecha sola
156 œ   América pequeña oe ligadura
157     NO UTILIZADO
158 z   América pequeña letra z con caron
159 Ÿ   letra mayúscula América Y con diéresis
160     no-break espacio
161     signo de exclamación invertida
162 ¢¢¢ símbolo de centavos
163 £££ signo de Libra
164     Muestra de dinero
165 ¥¥¥ signo de yenes
166 ¦¦¦ barra rota
167 §§§ sección de signo
168 ¨¨¨ diéresis
169 ©©© muestra de los derechos
170 ªªª Indicador ordinal femenino
171 ««« apunta hacia la izquierda comilla doble ángulo
172     no firme
173 ­­­ guión de separación
174 ®®® signo registrado
175 ¯¯¯ macrón
176 °°° signo de grado
177 ±±± más-menos signo
178 ²²² superíndice dos
179 ³³³ superíndice tres
180     acento agudo
181 µµµ señal de micro
182     signo Pilcrow
183 ··· punto medio
184 ... cedilla
185 ªªª un superíndice
186     Indicador ordinal masculino
187 »»» apunta hacia la derecha ángulo doble comilla
188 1/41/41/4 fracción vulgar cuarto
189 1/21/21/2 fracción vulgar una media
190 3/43/43/4 fracción vulgar tres cuartos
191     signo de interrogación invertido
192 ÀÀÀ Una letra mayúscula latina con grave
193 ÁÁÁ letra mayúscula A con América aguda
194 ÂÂÂ Una letra mayúscula latina con acento circunflejo
195 ÃÃÃ Una letra mayúscula latina con tilde
196 ÄÄÄ Una letra mayúscula latina con diéresis
197 ÅÅÅ Una letra mayúscula latina con el anillo superior
198 ÆÆÆ América letra mayúscula AE
199 CCC Letra latina mayúscula C con cedilla
200 EEE Letra latina mayúscula E con la tumba
201 EEE Letra latina mayúscula E con aguda
202 EEE Letra latina mayúscula E con acento circunflejo
203 EEE Letra latina mayúscula E con diéresis
204 III letra mayúscula Latín I con grave
205 III letra mayúscula I con América aguda
206 III letra mayúscula Latín I con acento circunflejo
207 III letra mayúscula América I con diéresis
208 ÐÐÐ América letra mayúscula Eth
209 ÑÑÑ letra mayúscula América N con tilde
210 OOO Letra latina O mayúscula con grave
211 OOO Letra latina O mayúscula con aguda
212 OOO Letra latina O mayúscula con acento circunflejo
213 OOO Letra latina O mayúscula con tilde
214 OOO Letra latina O mayúscula con diéresis
215 ××× signo de multiplicación
216 ØØØ Letra latina O mayúscula con un accidente cerebrovascular
217 UUU letra mayúscula T con grave América
218 UUU letra mayúscula U con América aguda
219 UUU letra mayúscula América U con acento circunflejo
220 UUU letra mayúscula América U con diéresis
221 YYY letra mayúscula América Y con aguda
222 ÞÞÞ América letra mayúscula Thorn
223 ßßß Letra latina aguda s
224 aaa Letra latina pequeña una con grave
225 aaa Letra latina pequeña con una aguda
226 aaa Letra latina con acento circunflejo una pequeña
227 aaa Letra latina pequeña con una tilde
228 aaa Letra latina pequeña con una diéresis
229 aaa Letra latina pequeño un anillo con arriba
230 aaa América pequeña letra ae
231 ccc Letra latina c con cedilla
232 eee Letra latina e minúscula con grave
233 eee Letra latina e minúscula con aguda
234 eee Letra latina e minúscula con acento circunflejo
235 eee Letra latina e minúscula con diéresis
236 iii Letra latina i con grave
237 iii Letra latina i con aguda
238 iii Letra latina i con acento circunflejo
239 iii Letra latina i con diéresis
240     América pequeña letra eth
241 nnn América pequeña letra n con tilde
242 ooo Letra latina o con grave
243 ooo Letra latina o con aguda
244 ooo Letra latina o minúscula con acento circunflejo
245 ooo Letra latina o minúscula con tilde
246 ooo Letra latina o minúscula con diéresis
247 ÷÷÷ signo de división
248     Letra latina o con un accidente cerebrovascular
249 uuu Letra latina u con grave
250 uuu Letra latina u con aguda
251 uuu Letra latina con acento circunflejo
252 uuu Letra latina u con diéresis
253 yyy América pequeña letra y con aguda
254 þþþ América pequeña letra de la espina
255 yyy América pequeña letra y con diéresis

El conjunto de caracteres ASCII

ASCII utiliza los valores de 0 a 31 (and 127) para caracteres de control.

ASCII utiliza los valores de 32 a 126 para las letras, dígitos y símbolos.

ASCII no utiliza los valores de 128 y 255.


El juego de caracteres ANSI (Windows-1252)

ANSI es idéntica a ASCII para los valores de 0 a 127.

ANSI tiene su propio grupo de caracteres para los valores de 128 a 159.

ANSI es idéntica a UTF-8 para los valores de 160 a 255.


El conjunto de caracteres ISO-8859-1

8859-1 es idéntica a ASCII para los valores de 0 a 127.

8859-1 no utiliza los valores de 128 A 159.

8859-1 es idéntica a UTF-8 para los valores de 160 a 255.


El conjunto de caracteres UTF-8

UTF-8 es idéntica a ASCII para los valores de 0 a 127.

UTF-8 no utiliza los valores de 128 A 159.

UTF-8 es idéntica a ambos ANSI y 8859-1 para los valores de 160 a 255.

UTF-8 continúa desde el valor 256 con más de 10 000 caracteres diferentes.

Para un vistazo más de cerca, estudiar nuestra completa de caracteres HTML Conjunto de referencia .