최신 웹 개발 튜토리얼

HTML 인코딩 (문자 집합)


올바르게 HTML 페이지를 표시하려면, 웹 브라우저는 문자 집합을 알고 있어야합니다 (character encoding) 사용합니다.


문자 인코딩은 무엇인가?

ASCII (또한 문자 집합이라고도 함)의 첫 번째 문자 인코딩 표준이었다. 그것은 인터넷에서 사용할 수있는 127 개 가지 영숫자 문자를 정의합니다.

HTML (하이퍼 텍스트 마크 업 언어)은 1991 년부터 사용되어 왔지만, HTML 4.0 (1997 년 12 월) 국제 문자가 합리적으로 완전한 치료를 받았다 최초의 표준화 된 버전이었다. HTML 문서는 일곱 비트 ASCII의 범위 밖에있는 특수 문자를 포함하면 두 가지 목표는 고려 가치가있다 : 정보의 무결성 및 보편적 인 브라우저 표시됩니다.

ASCII 지원 숫자 (0-9) , 영문자 (AZ) 와 같은 일부 특수 문자 ! $ + - ( ) @ < > ! $ + - ( ) @ < > .

ANSI (Windows-1252) 원래 Windows 문자 집합이었다. 그것은 256 개 개의 서로 다른 문자 코드를 지원했다.

ISO-8859-1 또한 256 개 개의 서로 다른 문자 코드를 지원하는 HTML 4에 설정된 기본 문자였다.

ANSI와 ISO가 제한 되었기 때문에, 디폴트 문자 인코딩 HTML5에서 UTF-8로 변경 하였다.

UTF-8 (Unicode) 거의 모든 세계에서 문자 및 기호의 설명합니다.

모든 HTML 4 개 프로세서는 UTF-8을 지원합니다.


는 HTML 문자 집합 속성

올바르게 HTML 페이지를 표시하려면 웹 브라우저 페이지에서 사용되는 문자 집합을 알고 있어야합니다.

이것은에 지정된 <meta> 태그 :

HTML4의 경우 :

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

HTML5의 경우 :

<meta charset="UTF-8">

브라우저가 웹 페이지에 ISO-8859-1을 감지하면 그 ANSI 32 개 여분의 문자가 제외하고, 그것은 ANSI 기본값, ANSI는 ISO-8859-1 동일하기 때문이다.


문자 집합의 차이점

다음 표는 상술 된 문자 세트들 사이의 차이를 표시

NumbASCIIANSI8859UTF-8 기술
32     공간
33!!!! 느낌표
34"""" 인용 부호
35#### 숫자 기호
36$$$$ 달러 기호
37%%%% 퍼센트 기호
38&&&& 앰퍼샌드
39'''' 아포스트로피
40(((( 왼쪽 괄호
41)))) 오른쪽 괄호
42**** 별표
43++++ 더하기 기호
44,,,, 콤마
45---- 하이픈 - 마이너스
46.... 마침표
47//// 상선
480000 자리 제로
491111 자리 하나
502222 자리 두
513333 자리 세
524444 자리 네
535555 자리 오
546666 자리 육
557777 자리 칠
568888 자리 팔
579999 자리 구
58:::: 콜론
59;;;; 세미콜론
60<<<< 보다 작음 기호
61==== 등호
62>>>> 기호보다 큰
63???? 물음표
64@@@@ 에서 상업
65AAAA 라틴어 대문자 A
66BBBB 라틴어 대문자 B
67CCCC 라틴어 대문자 C
68DDDD 라틴어 대문자 D
69EEEE 라틴어 대문자 E
70FFFF 라틴어 대문자 F
71GGGG 라틴어 대문자 G
72HHHH 라틴어 대문자 H
73IIII 라틴어 대문자 I
74JJJJ 라틴어 대문자 J
75KKKK 라틴어 대문자 K
76LLLL 라틴어 대문자 L
77MMMM 라틴어 대문자 M
78NNNN 라틴어 대문자 N
79OOOO 라틴어 대문자 O
80PPPP 라틴어 대문자 P
81QQQQ 라틴어 대문자 Q
82RRRR 라틴어 대문자 R
83SSSS 라틴어 대문자 S
84TTTT 라틴어 대문자 T
85UUUU 라틴어 대문자 U
86VVVV 라틴어 대문자 V
87WWWW 라틴어 대문자 W
88XXXX 라틴어 대문자 X
89YYYY 라틴어 대문자 Y
90ZZZZ 라틴어 대문자 Z
91[[[[ 왼쪽 대괄호
92\\\\ 역 상선
93]]]] 우측 대괄호
94^^^^ 곡절 악센트
95____ 낮은 라인
96```` 억음 악센트
97aaaa 라틴어 편지에
98bbbb 라틴어 소문자 (B)
99cccc 라틴어 문자 c
100dddd 라틴어 문자 D
101eeee 라틴어 작은 문자 e
102ffff 라틴어 소문자 F
103gggg 라틴어 소문자 g
104hhhh 라틴어 소문자 시간
105iiii 라틴어 소문자 I
106jjjj 라틴어 소문자 J
107kkkk 라틴어 소문자 K
108llll 라틴어 문자 l
109mmmm 라틴어 소문자 m
110nnnn 라틴어 문자 n
111oooo 라틴어 소문자 오
112pppp 라틴어 소문자 P
113qqqq 라틴어 소문자 q를
114rrrr 라틴어 소문자 R
115ssss 라틴어 소문자 S
116tttt 라틴어 소문자 t
117uuuu 라틴어 소문자 U를
118vvvv 라틴어 문자 v
119wwww w 라틴어 소문자
120xxxx 라틴어 문자 x
121yyyy 라틴어 소문자 y를
122zzzz 라틴어 문자 z
123{{{{ 왼쪽 중괄호
124|||| 수직선
125}}}} 바로 중괄호
126~~~~ 틸데
127DEL   
128    유로 기호
129     USED하지
130    하나의 낮은 9 따옴표
131 ƒ   후크 F 라틴어 소문자
132    이중 낮은 9 따옴표
133    수평 줄임표
134    단검
135    이중 단검
136 ˆ   수정 문자 곡절 악센트
137    밀레 기호 당
138 Š   카논 라틴어 대문자 S
139    단일 왼쪽을 가리키는 각도 따옴표
140 Œ   라틴어 자본 합자 OE
141     USED하지
142 Z   카논 라틴어 대문자 Z
143     USED하지
144     USED하지
145    왼쪽 작은 따옴표
146    오른쪽 작은 따옴표
147    왼쪽 큰 따옴표
148    바로 따옴표
149    총알
150    대시 엉
151    전각 대시
152 ˜   작은 물결
153    상표 기호
154 š   캐런 라틴 소문자의
155    하나의 오른쪽을 가리키는 각도 따옴표
156 œ   라틴어 작은 합자 OE
157     USED하지
158 z   캐런 라틴 작은 문자 z
159 Ÿ   분음 기호가 붙은 라틴어 대문자 Y
160     노 휴식 공간
161     반전 느낌표
162 ¢¢¢ 퍼센트 기호
163 £££ 파운드 기호
164     통화 기호
165 ¥¥¥ 엔 기호
166 ¦¦¦ 깨진 바
167 §§§ 섹션 기호
168 ¨¨¨ 분음
169 ©©© 저작권 기호
170 ªªª 여성 서수 표시
171 ««« 왼쪽을 가리키는 이중 꺽쇠 따옴표
172     서명하지
173 ­­­ 소프트 하이픈
174 ®®® 등록 기호
175 ¯¯¯ 장음
176 °°° 도 기호
177 ±±± 플러스 마이너스
178 ²²² 첨자이
179 ³³³ 첨자 세
180     악센트
181 µµµ 마이크로 기호
182     단락 기호 기호
183 ··· 중간 점
184 ... 세 디유
185 ªªª 첨자 하나
186     남성 서수 표시
187 »»» 오른쪽을 가리키는 이중 꺽쇠 따옴표
188 1/41/41/4 저속 부분 사분
189 1/21/21/2 저속 분획 절반
190 3/43/43/4 저속 분획 사분의 삼
191     역 물음표
192 ÀÀÀ 무덤 붙은 라틴어 대문자 A
193 ÁÁÁ 급성가 붙은 라틴어 대문자 A
194 ÂÂÂ 곡절가 붙은 라틴어 대문자 A
195 ÃÃÃ 물결표가 붙은 라틴어 대문자 A
196 ÄÄÄ 분음 기호가 붙은 라틴어 대문자 A
197 ÅÅÅ 위의 고리가 붙은 라틴어 대문자 A
198 ÆÆÆ 라틴어 대문자 AE
199 CCC 디유 라틴 대문자 C
200 EEE 무덤 라틴 대문자 E
201 EEE 급성와 라틴어 대문자 E
202 EEE 곡절 악센트가 붙은 라틴어 대문자 E
203 EEE 분음 기호가 붙은 라틴어 대문자 E
204 III 무덤 붙은 라틴어 대문자 I
205 III 급성 라틴 대문자 I를
206 III 곡절가 붙은 라틴어 대문자 I
207 III 분음 기호가 붙은 라틴어 대문자 I
208 ÐÐÐ 라틴어 대문자 ETH
209 ÑÑÑ 물결표와 라틴어 대문자 N
210 OOO 무덤 라틴 대문자 O
211 OOO 급성 라틴 대문자 O
212 OOO 곡절 악센트가 붙은 라틴어 대문자 O
213 OOO 물결표와 라틴어 대문자 O
214 OOO 분음 기호가 붙은 라틴어 대문자 O
215 ××× 곱셈 기호
216 ØØØ 스트로크 라틴어 대문자 O
217 UUU 무덤 라틴 대문자 U
218 UUU 급성 라틴 대문자 U를
219 UUU 곡절 라틴 대문자 U
220 UUU 분음 기호가 붙은 라틴어 대문자 U
221 YYY 급성 라틴 대문자 Y
222 ÞÞÞ 라틴어 대문자 가시
223 ßßß 라틴어 소문자 날카로운들
224 aaa 무덤 라틴 작은 편지에
225 aaa 급성 라틴 작은 편지에
226 aaa 곡절 라틴 작은 편지에
227 aaa 물결표가 붙은 라틴어 편지에
228 aaa 분음 기호가 붙은 라틴어 편지에
229 aaa 위의 고리가 붙은 라틴어 편지에
230 aaa 라틴어 소문자 AE
231 ccc 디유와 C 라틴어 소문자
232 eee 무덤 라틴 작은 문자 e
233 eee 급성 라틴 작은 문자 e
234 eee 곡절 라틴 작은 문자 e
235 eee 분음 기호가 붙은 라틴어 문자 e
236 iii 무덤에 라틴어 나 편지를
237 iii 급성 라틴 작은 편지 나에게
238 iii 곡절와 라틴어 나 편지를
239 iii 분음 기호가 붙은 라틴어 나 편지를
240     라틴어 소문자 ETH
241 nnn 물결표가 붙은 라틴어 문자 n
242 ooo 무덤에 라틴어 소문자 o
243 ooo 급성와 라틴어 소문자 o
244 ooo 곡절와 라틴어 소문자 o
245 ooo 물결표와 라틴어 소문자 o
246 ooo 분음와 라틴어 소문자 o
247 ÷÷÷ 구분 기호
248     스트로크 라틴어 소문자 o
249 uuu 무덤 라틴 작은 문자 U를
250 uuu 급성 라틴 작은 문자 U를
251 uuu 곡절 라틴 소문자
252 uuu 분음 기호가 붙은 라틴어 문자 U를
253 yyy 급성 라틴 소문자 y를
254 þþþ 라틴어 소문자 가시
255 yyy 분음 기호가 붙은 라틴어 소문자 y를

ASCII 문자 집합

ASCII는 0 내지 31의 값을 사용한다 (and 127) 의 제어가 문자.

ASCII 문자, 숫자 및 기호 (32)로부터 126의 값을 사용한다.

ASCII는 128에서 255의 값을 사용하지 않습니다.


ANSI 문자 집합 (Windows-1252)

ANSI는 0 ~ 127의 값 아스키와 동일하다.

ANSI는 128에서 159의 값을 문자의 고유 세트를 갖는다.

ANSI는 UTF-8 160 ~ 255의 값과 동일하다.


ISO-8859-1 문자 집합

8859는 0부터 127까지의 값 아스키와 동일하다.

8859 128에서 159까지의 값을 사용하지 않는다.

8859은 UTF-8 160 ~ 255의 값과 동일하다.


UTF-8 문자 집합

UTF-8은 0 ~ 127의 값 아스키와 동일하다.

UTF-8은 128에서 159까지의 값을 사용하지 않는다.

UTF-8은 ANSI 160 ~ 255의 값에 대한 8859 모두 동일하다.

UTF-8은 10 개 이상의 서로 다른 000 개의 문자 값 (256)에서 계속된다.

자세히 살펴 들어, 우리의 연구 전체 HTML 문자 집합 참조 .