최신 웹 개발 튜토리얼
 

HTML 문자 집합


제대로 HTML 페이지를 표시하려면 브라우저는 문자 집합 (문자 인코딩)을 사용하는 것을 알고 있어야합니다.


HTML 문자 집합

HTML에 사용할 올바른 문자 인코딩은 무엇입니까?

HTML5, 디폴트 문자 인코딩은 UTF-8이다.

그렇지 않은 경우가 있습니다. 초기 웹의 문자 인코딩은 ASCII했다.

나중에, 4.01를 HTML로 HTML 2.0, ISO-8859-1 표준으로 간주되었다.

XML 및 HTML5로, UTF-8은 마침내 도착하고, 문자 인코딩 문제를 많이 해결했다.

아래 문자 인코딩 표준에 대한 간단한 설명이다.


처음에 : ASCII

컴퓨터 정보 (번호, 텍스트 및 사진)는 전자 이진 1과 0 (01000101)로 저장됩니다.

영숫자의 저장을 표준화, 정보 교환을위한 미국 표준 코드 (ASCII)을 만들었습니다. 그것은 0-9에서 숫자를 지원하기 위해 각각 저장 가능한 문자에 대해 고유 한 이진 7 비트 수를 정의, 상단 / 소문자 영어 알파벳 (AZ, AZ)와 같은 일부 특수 문자! $ + (-) @ <>.

ASCII 하나의 바이트 (문자 7 비트, 전송 패리티 제어용 비트 중 하나)를 사용하므로, 128 다른 특성을 나타낼 수있다. 또한 이러한 문자 (32)는 다른 제어 목적을 위해 예약되었다.

ASCII의 가장 큰 약점은 비 영어 문자를 제외이었다.

ASCII 특히 대형 메인 프레임 컴퓨터 시스템에서 널리 사용 오늘날입니다.

자세히 살펴 들어, 우리의 공부하시기 바랍니다 완료 ASCII 참조 .


Windows의 경우 : ANSI

(또한 윈도우 1252라고도 함) ANSI 윈도우 95까지, Windows에서 기본 문자 집합이었다.

ANSI 덧붙였다 국제 문자와 ASCII의 확장이다. 그것은 256 개의 서로 다른 문자를 표현하기 위해 전체 바이트 (8 비트)를 사용합니다.

ANSI Windows에서 기본 문자 집합되어 있기 때문에, 모든 브라우저에서 지원된다.

자세히 살펴 들어, 우리의 공부하시기 바랍니다 완료 ANSI 참조 .


ISO-8859-1 : HTML 4에서

대부분의 국가가 ASCII 이외의 문자를 사용하기 때문에, HTML 2.0 표준의 기본 문자 인코딩은 ISO-8859-1로 변경되었습니다.

ISO-8859-1 덧붙였다 국제 문자와 ASCII의 확장이다. ANSI 마찬가지로 ASCII보다 두 배 많은 문자를 나타 내기 위해 전체 바이트를 사용한다.

노트 브라우저가 웹 페이지에 ISO-8859-1을 감지하면 ANSI는 ANSI 32 여분의 문자가있는 것을 제외하고는 ISO-8859-1 동일하기 때문에, 그들은 일반적으로 ANSI로 기본.

는 HTML 4 웹 페이지가 다른 문자 집합 ISO-8859-1 이상을 사용하는 경우, 그것은 지정해야합니다 <meta> 태그 :

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
»그것을 자신을 시도

노트

HTML5에 설정된 기본 문자는 UTF-8입니다.
모든 HTML 4 프로세서는 UTF-8 지원 모든 HTML5 및 XML 프로세서는 UTF-8 및 UTF-16을 모두 지원한다.

자세히 살펴 들어, 우리의 공부하시기 바랍니다 완료 ISO-8859-1 참조 .


HTML5에서 : 유니 코드 UTF-8

위에 나열된 문자 집합 제한, 다국어 환경에서 호환되지 않기 때문에, 유니 코드 컨소시엄은 유니 코드 표준을 개발했다.

유니 코드 표준 커버 (거의) 세상의 모든 문자, 문장 부호 및 기호.

유니 코드는 플랫폼과 언어에 독립적 인 처리, 저장, 텍스트의 전송을 가능하게한다.

HTML5의 기본 문자 인코딩은 UTF-8입니다.

자세히 살펴 들어, 우리의 공부하시기 바랍니다 완전한 유니 코드 참조 .