최신 웹 개발 튜토리얼
 

HTML 문자 집합


올바르게 HTML 페이지를 표시하려면 브라우저는 문자 집합을 알아야합니다 (character encoding) 사용.


HTML 문자 집합

HTML에 사용할 올바른 문자 인코딩은 무엇인가?

HTML5의 경우, 기본 문자 인코딩은 UTF-8입니다.

이 그렇지 않은 경우가 있습니다. 초기 웹의 문자 인코딩은 ASCII했다.

나중에, 4.01를 HTML로 HTML 2.0, ISO-8859-1 표준으로 간주되었다.

XML 및 HTML5로, UTF-8은 드디어 도착 및 문자 인코딩 많은 문제를 해결했다.

다음은 문자 인코딩 표준에 대한 간략한 설명입니다.


처음에 : ASCII

컴퓨터 정보 (numbers, texts, and pictures) 이진 1과 0으로 저장됩니다 (01000101) 전자이다.

영숫자 문자의 저장을 표준화하기 위해, 정보 교환을위한 미국 표준 코드 (ASCII) 만들었습니다. 그것은 0-9에서 숫자를 지원하기 위해 각각 저장 가능한 문자에 대해 고유 한 바이너리 7 비트 수를 정의, 상단 / 소문자 영어 알파벳 (az, AZ) 와 같은 일부 특수 문자! $ + - ( ) @ <>.

ASCII 하나의 바이트 (문자 7 비트 송신 패리티 제어용 비트 중 하나)를 사용하므로, 128 개 다른 특성을 나타낼 수있다. 또한 이러한 문자 (32)는 다른 제어 목적을 위해 예약되었다.

ASCII의 가장 큰 약점은 비 영어 문자를 제외이었다.

ASCII 특히 대형 메인 프레임 컴퓨터 시스템에 널리 사용되고 오늘날입니다.

자세히 살펴 들어, 우리의 연구하십시오 전체 ASCII 참조 .


Windows의 경우 : ANSI

ANSI (also called Windows-1252) 윈도우 95까지, Windows에서의 기본 문자 집합이었다.

ANSI 추가 국제 문자와 ASCII의 확장이다. 그것은 전체 사용 바이트 (8-bits) (256 개) 다른 문자를 표현한다.

ANSI Windows에서 기본 문자 집합되어 있기 때문에, 모든 브라우저에서 지원됩니다.

자세히 살펴 들어, 우리의 연구하시기 바랍니다 전체 ANSI 참조 .


ISO-8859-1 : HTML 4에서

대부분의 국가가 ASCII 이외의 문자를 사용하기 때문에, HTML 2.0 표준의 기본 문자 인코딩은 ISO-8859-1로 변경되었습니다.

ISO-8859-1 덧붙였다 국제 문자와 ASCII의 확장이다. ANSI처럼, ASCII보다 두 배나 많은 문자를 표현하기 위해 전체 바이트를 사용합니다.

브라우저가 웹 페이지에 ISO-8859-1을 감지하면 ANSI는 ANSI 32 여분의 문자가있는 것을 제외하고 ISO-8859-1 동일하기 때문에, 그들은 일반적으로 ANSI로 기본.

는 HTML 4 웹 페이지에 ISO-8859-1 외에 다른 문자 설정을 사용하는 경우, 그것은에 지정해야합니다 <meta> 태그와 같은 :

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

HTML5에 설정된 기본 문자는 UTF-8입니다.
모든 HTML 4 개 프로세서는 UTF-8을 지원하고, 모든 HTML5와 XML 프로세서는 UTF-8과 UTF-16을 모두 지원합니다.

자세히 살펴 들어, 우리의 연구하시기 바랍니다 완전한 ISO-8859-1 참조 .


HTML5에서 : 유니 코드 UTF-8

위에 나열된 문자 세트는 제한이 있고 다국어 환경에 호환이되지 않기 때문에, 유니 코드 컨소시엄은 유니 코드 표준을 개발했다.

유니 코드 표준 커버 (almost) 세상의 모든 문자, 구두점, 기호.

유니 코드는 플랫폼 독립적 인 언어의 처리, 저장 및 텍스트의 전송을 가능하게한다.

HTML5의 기본 문자 인코딩은 UTF-8입니다.

자세히 살펴 들어, 우리의 연구하시기 바랍니다 완전한 유니 코드 참조 .