最新のWeb開発のチュートリアル

HTMLエンコード(文字セット)


正しくHTMLページを表示するには、Webブラウザが文字セットを知っている必要があります(character encoding)使用します。


文字エンコーディングとは何ですか?

ASCIIは、最初の文字符号化規格 (とも呼ばれる文字セット)でした。 これは、インターネット上で使用できる127個の異なる文字の英数字を定義します。

HTML(ハイパーテキストマークアップ言語)は、1991年から使用されてきたが、HTML 4.0(1997年12月)は、国際的な文字が合理的に完全な治療を与えられた最初の標準化されたバージョンでした。 情報の完全性、およびユニバーサルブラウザ表示:HTMLドキュメントは、7ビットASCIIの範囲外の特殊文字が含まれている場合2つのゴールは検討する価値があります。

ASCIIサポートの数字(0-9)英字(AZ)などいくつかの特殊文字! $ + - ( ) @ < > ! $ + - ( ) @ < >

ANSI (Windows-1252)元のWindows文字セットでした。 これは、256個の異なる文字コードをサポートしていました。

ISO-8859-1は、それはまた、256の異なる文字コードをサポートするHTML 4のデフォルトの文字セットでした。

ANSIやISOが限られていたので、デフォルトの文字エンコーディングは、HTML5でUTF-8に変更しました。

UTF-8 (Unicode)ほぼすべての世界で文字や記号のカバーしています。

すべてのHTML 4つのプロセッサはまた、UTF-8をサポートしています。


HTMLのcharset属性

正しくHTMLページを表示するには、Webブラウザがページで使用される文字セットを知っている必要があります。

これはで指定された<meta>タグ:

HTML4の場合:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

HTML5の場合:

<meta charset="UTF-8">

ANSIは、ANSIが32余分な文字を持っていることを除き、ISO-8859-1と同一ですので、ブラウザは、それANSIデフォルト、WebページにISO-8859-1を検出した場合。


文字セットの違い

次の表は、上記の文字セット間の違いを表示します。

NumbASCIIANSI8859UTF-8 説明
32     スペース
33!!!! エクスクラメーション・マーク
34"""" クォーテーションマーク
35#### 番号記号
36$$$$ ドル記号
37%%%% パーセント記号
38&&&& アンパサンド
39'''' アポストロフィ
40(((( 左括弧
41)))) 右括弧
42**** アスタリスク
43++++ 正符号
44,,,, コンマ
45---- ハイフンマイナス
46.... 終止符
47//// ソリダス
480000 数字のゼロ
491111 桁1
502222 数字2
513333 数字3
524444 数字4
535555 数字5
546666 数字6
557777 桁7
568888 数字8
579999 数字9
58:::: 結腸
59;;;; セミコロン
60<<<< 小なり記号
61==== 等号
62>>>> 大なり記号
63???? クエッションマーク
64@@@@ 商用で
65AAAA ラテン大文字A
66BBBB ラテン大文字B
67CCCC ラテン大文字C
68DDDD ラテン大文字D
69EEEE ラテン大文字E
70FFFF ラテン大文字F
71GGGG ラテン大文字G
72HHHH ラテン大文字H
73IIII ラテン大文字I
74JJJJ ラテン大文字J
75KKKK ラテン大文字K
76LLLL ラテン大文字L
77MMMM ラテン大文字M
78NNNN ラテン大文字N
79OOOO ラテン大文字O
80PPPP ラテン大文字P
81QQQQ ラテン大文字Q
82RRRR ラテン大文字R
83SSSS ラテン大文字S
84TTTT ラテン大文字T
85UUUU ラテン大文字U
86VVVV ラテン大文字V
87WWWW ラテン大文字W
88XXXX ラテン大文字X
89YYYY ラテン大文字Y
90ZZZZ ラテン大文字Z
91[[[[ 左角括弧
92\\\\ 逆ソリダス
93]]]] 右角カッコ
94^^^^ 曲折アクセント
95____ 低いライン
96```` 低アクセント
97aaaa ラテン小文字a
98bbbb ラテン小さな文字b
99cccc 小さなラテン文字c
100dddd ラテン小さな文字d
101eeee ラテン小文字e
102ffff ラテン小さな文字F
103gggg ラテン小さな文字g
104hhhh ラテン小さな文字h
105iiii ラテン小文字のI
106jjjj ラテン小文字J
107kkkk ラテン小文字のk
108llll ラテン小さな文字l
109mmmm ラテン小さな文字m
110nnnn ラテン小文字のn
111oooo 小さなラテンアルファベットのO
112pppp ラテン小さな文字p
113qqqq ラテン小文字のq
114rrrr ラテン小さな文字r
115ssss ラテン小文字の
116tttt ラテン小さな文字t
117uuuu ラテン小文字u
118vvvv ラテン小文字V
119wwww ワットラテン小文字
120xxxx ラテン小さな文字x
121yyyy ラテン小さな文字y
122zzzz 小さなラテン文字Z
123{{{{ 左中かっこ
124|||| 縦線
125}}}} 右中かっこ
126~~~~ チルダ
127DEL   
128    ユーロ記号
129     使用されていない
130    単一の低9引用符
131 ƒ   フックとFラテン小文字
132    ダブル低9引用符
133    水平方向の反復記号
134    短剣
135    ダブルダガー
136 ˆ   修飾子手紙曲折アクセント
137    ミル記号あたり
138 Š   キャロン付きラテン大文字S
139    シングル左向き角引用符
140 Œ   ラテン資本リガチャーOE
141     使用されていない
142 Z   キャロン付きラテン大文字Z
143     使用されていない
144     使用されていない
145    左一重引用符
146    右の単一引用符
147    左の二重引用符
148    右の二重引用符
149    弾丸
150    半角ダッシュ
151    全角ダッシュ
152 ˜   小さなチルダ
153    トレードマークの看板
154 š   キャロン付きラテン小文字の
155    シングル右向きのアングル引用符
156 œ   小さなラテンリガチャーOE
157     使用されていない
158 z   キャロン付きラテン文字Z
159 Ÿ   分音記号付きラテン大文字Y
160     ノーブレークスペース
161     逆感嘆符
162 ¢¢¢ セント記号
163 £££ ポンド記号
164     通貨記号
165 ¥¥¥ 円記号
166 ¦¦¦ 壊れたバー
167 §§§ セクション記号
168 ¨¨¨ ダイエレシス
169 ©©© 著作権記号
170 ªªª 女性序数標識
171 ««« 左向きの二重角引用符
172     署名していません
173 ­­­ ソフトハイフン
174 ®®® 登録記号
175 ¯¯¯ マカロン
176 °°° 度の記号
177 ±±± プラスマイナス記号
178 ²²² 上付き文字2
179 ³³³ 上付き3
180     急性アクセント
181 µµµ マイクロ記号
182     段落記号記号
183 ··· 中ドット
184 ... カンマ
185 ªªª 上付き1
186     男性の序数標識
187 »»» 右向きの二重角引用符
188 1/41/41/4 下品な分数四分の一
189 1/21/21/2 下品な分数の半分
190 3/43/43/4 下品な分数四分の三
191     逆疑問符
192 ÀÀÀ 墓付きラテン大文字A
193 ÁÁÁ 急性付きラテン大文字A
194 ÂÂÂ 曲折アクセント付きラテン大文字A
195 ÃÃÃ チルダ付きラテン大文字A
196 ÄÄÄ 分音記号付きラテン大文字A
197 ÅÅÅ 上記リング付きラテン大文字A
198 ÆÆÆ ラテン大文字AE
199 CCC セディーユ付きラテン大文字C
200 EEE 墓付きラテン大文字E
201 EEE 急性付きラテン大文字E
202 EEE 曲折アクセント付きラテン大文字E
203 EEE 分音記号付きラテン大文字E
204 III 墓付きラテン大文字I
205 III 急性付きラテン大文字I
206 III 曲折アクセント付きラテン大文字I
207 III 分音記号付きラテン大文字I
208 ÐÐÐ ラテン大文字のEth
209 ÑÑÑ チルダ付きラテン大文字N
210 OOO 墓付きラテン大文字O
211 OOO 急性付きラテン大文字O
212 OOO 曲折アクセント付きラテン大文字O
213 OOO チルダ付きラテン大文字O
214 OOO 分音記号付きラテン大文字O
215 ××× 乗算記号
216 ØØØ ストローク付きラテン大文字O
217 UUU 墓付きラテン大文字U
218 UUU 急性付きラテン大文字U
219 UUU 曲折アクセント付きラテン大文字U
220 UUU 分音記号付きラテン大文字U
221 YYY 急性付きラテン大文字Y
222 ÞÞÞ ラテン大文字ソーン
223 ßßß ラテン小文字シャープS
224 aaa 墓とラテン小文字a
225 aaa 急性付きラテン小文字a
226 aaa 曲折アクセント付きラテン小文字a
227 aaa チルダ付きラテン小文字a
228 aaa 分音記号付きラテン小文字a
229 aaa 上記リング付きラテン小文字a
230 aaa ラテン小文字AE
231 ccc セディーユ付きCラテン小文字
232 eee 墓とラテン小文字e
233 eee 急性付きラテン小文字e
234 eee 曲折アクセント付きラテン小文字e
235 eee 分音記号付きラテン小文字e
236 iii 墓付きラテン小文字のI
237 iii 急性の小さなラテン文字I
238 iii 曲折アクセント付きラテン小文字のI
239 iii 分音記号付きラテン小文字のI
240     ラテン小文字ETH
241 nnn チルダ付きラテン小文字のn
242 ooo 墓とラテン小文字o
243 ooo 急性付きラテン小文字o
244 ooo 曲折アクセント付きラテン小文字o
245 ooo チルダ付きラテン小文字o
246 ooo 分音記号付きラテン小文字o
247 ÷÷÷ 除算記号
248     脳卒中とラテン小文字o
249 uuu 墓とラテン小文字u
250 uuu 急性付きラテン小文字u
251 uuu 曲折アクセント付きラテン小文字
252 uuu 分音記号付きラテン小文字u
253 yyy 急性付きラテン文字y
254 þþþ ラテン小文字のとげ
255 yyy 分音記号付きラテン文字y

ASCII文字セット

ASCIIは、0から31までの値を使用して(and 127)制御文字のため。

ASCIIは、文字、数字、および記号のために32から126までの値を使用します。

ASCIIは、128から255までの値を使用していません。


ANSI文字セット(Windows-1252)

ANSIは、0から127までの値のASCIIと同一です。

ANSIは、128から159までの値の文字の独自のセットを持っています。

ANSIは、160から255までの値のUTF-8と同一です。


ISO-8859-1文字セット

8859-1は、0から127までの値のASCIIと同一です。

8859-1は、128から159までの値を使用していません。

8859-1は、160から255までの値のUTF-8と同一です。


UTF-8文字セット

UTF-8は、0から127までの値のASCIIと同一です。

UTF-8は、128から159までの値を使用していません。

UTF-8は、160から255までの値のANSI及び8859の両方に同じです。

UTF-8は、10個の以上000の異なる文字を有する値256から継続します。

よく見るために、私たちの研究完全なHTML文字セットの参照を