ล่าสุดการพัฒนาเว็บบทเรียน
×

HTML5 เกี่ยวกับการสอน

HTML บ้าน HTML บทนำ บรรณาธิการ HTML HTML ขั้นพื้นฐาน HTML องค์ประกอบ HTML แอตทริบิวต์ HTML หัวเรื่อง HTML ย่อหน้า HTML รูปแบบ HTML การจัดรูปแบบ HTML ใบเสนอราคา HTML รหัสคอมพิวเตอร์ HTML ความคิดเห็น HTML สี HTML CSS HTML การเชื่อมโยง HTML ภาพ ตาราง HTM​​L รายการ HTML HTML บล็อกและ Inline องค์ประกอบ HTML ชั้นเรียน HTML แบบ HTML อ่อนไหว HTML iframes HTML JavaScript HTML หัว HTML หน่วยงาน HTML สัญลักษณ์ HTML charset HTML URL เปลี่ยนเป็นรหัส HTML XHTML

HTML ฟอร์ม

HTML ฟอร์ม HTML องค์ประกอบของแบบฟอร์ม HTML รูปแบบการใส่ HTML แอตทริบิวต์การป้อนข้อมูล

HTML5

HTML5 แนะนำ HTML5 สนับสนุน HTML5 องค์ประกอบ HTML5 อรรถศาสตร์ การย้ายถิ่นของ HTM​​L5 HTML5 คู่มือสไตล์

HTML กราฟิก

HTML ผ้าใบ HTML SVG

HTML สื่อ

HTML สื่อ HTML วีดีโอ HTML เสียง HTML ปลั๊กอิน HTML YouTube

HTML APIs

HTML ตำแหน่งทางภูมิศาสตร์ HTML ลาก / Drop HTML เก็บข้อมูลท้องถิ่น HTML App ขุมทรัพย์ HTML คนงานเว็บ HTML SSE

HTML ตัวอย่าง

HTML ตัวอย่าง HTML ทดสอบ HTML5 ทดสอบ HTML สรุป

HTML คู่มืออ้างอิง

HTML รายการแท็ก HTML แอตทริบิวต์ เหตุการณ์ HTML HTML ผ้าใบ HTML เสียง / วิดีโอ HTML doctypes HTML สี HTML ชุดตัวอักษร HTML URL เปลี่ยนเป็นรหัส HTML รหัสภาษา HTTP ข้อความ HTTP วิธีการ PX to EM แปลง แป้นพิมพ์ลัด

HTML การเข้ารหัส (ชุดตัวอักษร)


ในการแสดงหน้าเว็บ HTML ได้อย่างถูกต้อง, เว็บเบราเซอร์จะต้องรู้ว่าชุดอักขระ (character encoding) ที่จะใช้


การเข้ารหัสอักขระคืออะไร?

ASCII เป็นมาตรฐานการเข้ารหัสตัวอักษรตัวแรก (ที่เรียกว่าชุดตัวอักษร) มันกำหนด 127 ตัวอักษรและตัวเลขที่แตกต่างกันที่สามารถใช้บนอินเทอร์เน็ต

HTML (Hypertext Markup Language) ที่ได้รับในการใช้งานมาตั้งแต่ปี 1991 แต่ HTML 4.0 (ธันวาคม 1997) เป็นครั้งแรกที่รุ่นมาตรฐานที่ตัวละครต่างประเทศที่ได้รับการรักษาที่สมบูรณ์พอสมควร เมื่อเอกสาร HTML ประกอบด้วยอักขระพิเศษนอกช่วงของ ASCII เจ็ดบิตสองเป้าหมายมีมูลค่าการพิจารณา: ความสมบูรณ์ของข้อมูลและการแสดงผลเบราว์เซอร์ที่เป็นสากล

หมายเลข ASCII สนับสนุน (0-9) , ตัวอักษรภาษาอังกฤษ (AZ) และบางตัวอักษรพิเศษเช่น ! $ + - ( ) @ < > ! $ + - ( ) @ < >

ANSI (Windows-1252) เป็นต้นฉบับของ Windows ชุดอักขระ มันได้รับการสนับสนุน 256 รหัสอักขระที่แตกต่างกัน

ISO-8859-1 ถูกตัวอักษรเริ่มต้นที่กำหนดไว้สำหรับ HTML 4. นอกจากนี้ยังได้รับการสนับสนุน 256 รหัสอักขระที่แตกต่างกัน

เพราะ ANSI และ ISO ถูก จำกัด การเข้ารหัสตัวอักษรเริ่มต้นได้เปลี่ยนไปเป็น UTF-8 ใน HTML5

UTF-8 (Unicode) ครอบคลุมเกือบทุกตัวอักษรและสัญลักษณ์ในโลก

ทั้งหมด HTML 4 โปรเซสเซอร์ยังสนับสนุน UTF-8


ใช้ HTML แอตทริบิวต์ charset

ในการแสดงหน้าเว็บ HTML ได้อย่างถูกต้อง, เว็บเบราเซอร์จะต้องรู้ว่าชุดตัวอักษรที่ใช้ในหน้า

นี้จะระบุไว้ใน <meta> แท็ก:

สำหรับ HTML4:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

สำหรับ HTML5:

<meta charset="UTF-8">

หากเบราว์เซอร์ตรวจจับ ISO-8859-1 ในหน้าเว็บที่เป็นค่าเริ่มต้น ANSI เพราะ ANSI เป็นเหมือน ISO-8859-1 ยกเว้น ANSI ที่มี 32 ตัวอักษรพิเศษ


ความแตกต่างระหว่างชุดตัวอักษร

ตารางต่อไปนี้แสดงความแตกต่างระหว่างชุดตัวอักษรที่อธิบายไว้ข้างต้น

NumbASCIIANSI8859UTF-8 ลักษณะ
32     ช่องว่าง
33!!!! อัศเจรีย์
34"""" เครื่องหมายคำพูด
35#### เครื่องหมาย
36$$$$ เครื่องหมายดอลลาร์
37%%%% เครื่องหมายเปอร์เซ็นต์
38&&&& เครื่องหมาย
39'''' จุดลูกน้ำ
40(((( วงเล็บ
41)))) วงเล็บ
42**** ดอกจัน
43++++ กากบาท
44,,,, จุลภาค
45---- ยัติภังค์ลบ
46.... มหัพภาค
47//// โซลิดัส
480000 ศูนย์หลัก
491111 หลักหนึ่ง
502222 เลขสองหลัก
513333 หลักสาม
524444 หลักสี่
535555 หลักห้า
546666 หลักหก
557777 เจ็ดหลัก
568888 หลักแปด
579999 หลักเก้า
58:::: ปลายลำไส้ใหญ่
59;;;; อัฒภาค
60<<<< น้อยกว่าการเข้าสู่ระบบ
61==== เท่ากับ
62>>>> มากขึ้นกว่าการเข้าสู่ระบบ
63???? เครื่องหมายคำถาม
64@@@@ พาณิชย์
65AAAA ละตินอักษรตัวใหญ่
66BBBB ละตินตัวอักษร B
67CCCC ตัวอักษรละติน C
68DDDD ตัวอักษรละติน D
69EEEE ตัวอักษรละติน E
70FFFF ตัวอักษรละติน F
71GGGG ตัวอักษรละติน G
72HHHH ตัวอักษรละติน H
73IIII ละตินอักษรตัวใหญ่ผม
74JJJJ ตัวอักษรละติน J
75KKKK ตัวอักษรละติน K
76LLLL ตัวอักษรละติน L
77MMMM ตัวอักษรละติน M
78NNNN ตัวอักษรละติน N
79OOOO ละตินตัวอักษร O
80PPPP ตัวอักษรละติน P
81QQQQ ละตินตัวอักษร Q
82RRRR ละตินตัวอักษร R
83SSSS ตัวอักษรละติน S
84TTTT ตัวอักษรละติน T
85UUUU ตัวอักษรละติน U
86VVVV ละตินตัวอักษร V
87WWWW ตัวอักษรละติน W
88XXXX ตัวอักษรละติน X
89YYYY ตัวอักษรละติน Y
90ZZZZ ละตินตัวอักษร Z
91[[[[ วงเล็บตาราง
92\\\\ โซลิดัสย้อนกลับ
93]]]] วงเล็บเหลี่ยมขวา
94^^^^ สำเนียงหมวก
95____ บรรทัดต่ำ
96```` สำเนียงหลุมฝังศพ
97aaaa ละตินตัวอักษรขนาดเล็ก
98bbbb ละตินเล็กตัวอักษร B
99cccc ละตินเล็กตัวอักษร C
100dddd ละตินเล็กตัวอักษร D
101eeee ละตินตัวอักษร E ขนาดเล็ก
102ffff ละตินเล็กตัวอักษรฉ
103gggg ละตินจดหมายกรัมขนาดเล็ก
104hhhh ละตินตัวอักษร H ขนาดเล็ก
105iiii ละตินฉันอักษรตัวเล็ก
106jjjj ลาตินเจอักษรตัวเล็ก
107kkkk ละตินตัวอักษร k ขนาดเล็ก
108llll ละตินตัวอักษร L ขนาดเล็ก
109mmmm ละตินเล็กตัวอักษรเมตร
110nnnn ละตินตัวอักษร n ขนาดเล็ก
111oooo ละตินตัวอักษร O ขนาดเล็ก
112pppp ละตินตัวอักษร P ขนาดเล็ก
113qqqq ละติน Q อักษรตัวเล็ก
114rrrr ละติน R อักษรตัวเล็ก
115ssss ละตินตัวอักษร S ขนาดเล็ก
116tttt ละตินตัวอักษร T ขนาดเล็ก
117uuuu อักษรตัวเล็กละตินยู
118vvvv ละตินเล็กตัวอักษร V
119wwww อักษรตัวเล็กละติน W
120xxxx ละตินตัวอักษร X ขนาดเล็ก
121yyyy ละตินตัวอักษร y ขนาดเล็ก
122zzzz ละตินเล็กตัว Z
123{{{{ ปีกกาซ้าย
124|||| เส้นแนวตั้ง
125}}}} ปีกกาขวา
126~~~~ ตัวหนอน
127DEL   
128    เครื่องหมายยูโร
129     ไม่ได้ใช้
130    -9 ต่ำเครื่องหมายคำพูดเดียว
131 ƒ   อักษรตัวเล็กละตินฉกับตะขอ
132    -9 ต่ำเครื่องหมายอัญประกาศ
133    จุดไข่ปลาแนวนอน
134    กริช
135    กริชคู่
136 ˆ   จดหมายปรับปรุงสำเนียงหมวก
137    ต่อสัญญาณพัน
138 Š   ละตินตัวอักษร S กับรอน
139    เครื่องหมายคำพูดมุมซ้ายชี้เดียว
140 Œ   ทุนละตินมัด OE
141     ไม่ได้ใช้
142 Z   ละตินตัวอักษร Z ทุนกับรอน
143     ไม่ได้ใช้
144     ไม่ได้ใช้
145    ซ้ายเครื่องหมายคำพูดเดียว
146    เครื่องหมายคำพูดเดียวที่เหมาะสม
147    ซ้ายเครื่องหมายอัญประกาศ
148    เครื่องหมายคำพูดขวาสองครั้ง
149    กระสุน
150    en ประ
151    em ประ
152 ˜   ตัวหนอนขนาดเล็ก
153    ป้ายเครื่องหมายทางการค้า
154 š   อักษรตัวเล็กละติน S กับรอน
155    ขวาชี้เครื่องหมายคำพูดเดียวมุม
156 œ   ละติน OE มัดเล็ก
157     ไม่ได้ใช้
158 z   ละตินตัวอักษร Z ขนาดเล็กที่มีรอน
159 Ÿ   ตัวอักษรละติน Y กับ diaeresis
160     ไม่มีการแบ่งพื้นที่
161     เครื่องหมายอัศเจรีย์คว่ำ
162 ¢¢¢ เข้าสู่ระบบร้อย
163 £££ เครื่องหมายปอนด์
164     เข้าสู่ระบบสกุลเงิน
165 ¥¥¥ สัญญาณเยน
166 ¦¦¦ บาร์หัก
167 §§§ เข้าสู่ระบบส่วน
168 ¨¨¨ diaeresis
169 ©©© เครื่องหมายลิขสิทธิ์
170 ªªª ตัวบ่งชี้ลำดับผู้หญิง
171 ««« ซ้ายชี้เครื่องหมายคำพูดมุมคู่
172     ได้ลงนามใน
173 ­­­ ยัติภังค์นุ่ม
174 ®®® ลงทะเบียนเข้าสู่ระบบ
175 ¯¯¯ ขีดขวางบนสระเพื่อบอกว่าเป็นสระเสียงยาว
176 °°° เข้าสู่ระบบการศึกษาระดับปริญญา
177 ±±± บวกลบเครื่องหมาย
178 ²²² ยกสอง
179 ³³³ ยกสาม
180     สำเนียงเฉียบพลัน
181 µµµ เข้าสู่ระบบไมโคร
182     สัญญาณ Pilcrow
183 ··· จุดตรงกลาง
184 ... cedilla
185 ªªª ยกหนึ่ง
186     ตัวบ่งชี้ลำดับผู้ชาย
187 »»» ชี้ขวามุมคู่เครื่องหมายคำพูด
188 1/41/41/4 ส่วนหยาบคายหนึ่งในสี่
189 1/21/21/2 ส่วนหยาบคายครึ่งหนึ่ง
190 3/43/43/4 ส่วนหยาบคายสามในสี่
191     เครื่องหมายคำถามคว่ำ
192 ÀÀÀ ละตินตัวอักษร A กับหลุมฝังศพ
193 ÁÁÁ ละตินตัวอักษร A กับเฉียบพลัน
194 ÂÂÂ ละตินตัวอักษร A กับหมวก
195 ÃÃÃ ละตินอักษรตัวใหญ่กับตัวหนอน
196 ÄÄÄ ละตินตัวอักษร A กับ diaeresis
197 ÅÅÅ ละตินตัวอักษร A กับแหวนดังกล่าวข้างต้น
198 ÆÆÆ ตัวอักษรละติน AE
199 CCC ละตินตัวอักษร C ที่มี cedilla
200 EEE ละตินตัวอักษร E กับหลุมฝังศพ
201 EEE ละตินตัวอักษร E กับเฉียบพลัน
202 EEE ละตินตัวอักษร E กับหมวก
203 EEE ละตินตัวอักษร E กับ diaeresis
204 III ตัวอักษรละตินฉันกับหลุมฝังศพ
205 III ตัวอักษรละตินฉันกับเฉียบพลัน
206 III ตัวอักษรละตินฉันกับหมวก
207 III ตัวอักษรละตินฉันกับ diaeresis
208 ÐÐÐ ตัวอักษรละตินผลประโยชน์ทับซ้อน
209 ÑÑÑ ละติน N อักษรตัวใหญ่กับตัวหนอน
210 OOO ละตินตัวอักษร O กับหลุมฝังศพ
211 OOO ละตินตัวอักษร O กับเฉียบพลัน
212 OOO ละตินตัวอักษร O กับหมวก
213 OOO ละตินตัวอักษร O กับตัวหนอน
214 OOO ละตินตัวอักษร O กับ diaeresis
215 ××× ตีนกา
216 ØØØ ละตินตัวอักษร O โรคหลอดเลือดสมอง
217 UUU ตัวอักษรละติน U กับหลุมฝังศพ
218 UUU ตัวอักษรละติน U กับเฉียบพลัน
219 UUU ตัวอักษรละติน U กับหมวก
220 UUU ตัวอักษรละติน U กับ diaeresis
221 YYY ตัวอักษรละติน Y กับเฉียบพลัน
222 ÞÞÞ ลาติน ธ อร์นตัวอักษร
223 ßßß อักษรตัวเล็กละตินคม s
224 aaa ละตินตัวอักษรขนาดเล็กที่มีหลุมฝังศพ
225 aaa ละตินตัวอักษรขนาดเล็กที่มีเฉียบพลัน
226 aaa ละตินตัวอักษรขนาดเล็กที่มีหมวก
227 aaa ละตินตัวอักษรขนาดเล็กที่มีตัวหนอน
228 aaa ละตินตัวอักษรขนาดเล็กที่มี diaeresis
229 aaa ละตินตัวอักษรขนาดเล็กที่มีแหวนดังกล่าวข้างต้น
230 aaa ละติน AE อักษรตัวเล็ก
231 ccc อักษรตัวเล็กละตินคกับ cedilla
232 eee ละตินตัว e ขนาดเล็กที่มีหลุมฝังศพ
233 eee ละตินตัว e ขนาดเล็กที่มีเฉียบพลัน
234 eee ละตินตัว e ขนาดเล็กที่มีหมวก
235 eee ละตินตัว e ขนาดเล็กที่มี diaeresis
236 iii อักษรตัวเล็กละตินฉันกับหลุมฝังศพ
237 iii อักษรตัวเล็กละตินฉันกับเฉียบพลัน
238 iii อักษรตัวเล็กละตินฉันกับหมวก
239 iii อักษรตัวเล็กละตินฉันกับ diaeresis
240     ผลประโยชน์ทับซ้อนละตินอักษรตัวเล็ก
241 nnn ละติน n ตัวอักษรขนาดเล็กที่มีตัวหนอน
242 ooo อักษรตัวเล็กละติน o กับหลุมฝังศพ
243 ooo อักษรตัวเล็กละติน o กับเฉียบพลัน
244 ooo อักษรตัวเล็กละติน o กับหมวก
245 ooo อักษรตัวเล็กละติน o กับตัวหนอน
246 ooo อักษรตัวเล็กละติน o กับ diaeresis
247 ÷÷÷ เข้าสู่ระบบส่วน
248     อักษรตัวเล็กละติน o โรคหลอดเลือดสมอง
249 uuu อักษรตัวเล็กละติน U กับหลุมฝังศพ
250 uuu อักษรตัวเล็กละติน U กับเฉียบพลัน
251 uuu อักษรตัวเล็กละตินกับหมวก
252 uuu อักษรตัวเล็กละติน U กับ diaeresis
253 yyy ละตินตัวอักษร y ขนาดเล็กที่มีเฉียบพลัน
254 þþþ ละตินหนามอักษรตัวเล็ก
255 yyy ละตินตัวอักษร y ขนาดเล็กที่มี diaeresis

ชุดอักขระ ASCII

ASCII ใช้ค่าจาก 0 ถึง 31 (and 127) สำหรับตัวควบคุม

ASCII ใช้ค่า 32-126 สำหรับตัวอักษรตัวเลขและสัญลักษณ์

ASCII ไม่ได้ใช้ค่าที่ 128-255


มาตรฐาน ANSI ชุดอักขระ (Windows-1252)

ANSI เป็นเหมือน ASCII สำหรับค่าที่ 0-127

ANSI มีชุดที่เป็นกรรมสิทธิ์ของตัวละครสำหรับค่าที่ 128-159

ANSI เป็นเหมือน UTF-8 สำหรับค่าที่ 160-255


ชุดอักขระ ISO-8859-1

8859-1 เป็นเหมือน ASCII สำหรับค่าที่ 0-127

8859-1 ไม่ได้ใช้ค่าที่ 128-159

8859-1 เป็นเหมือน UTF-8 สำหรับค่าที่ 160-255


ชุด UTF-8 ตัวอักษร

UTF-8 เป็นเหมือน ASCII สำหรับค่าที่ 0-127

UTF-8 ไม่ได้ใช้ค่าที่ 128-159

UTF-8 เป็นเหมือนทั้ง ANSI และ 8859-1 สำหรับค่าที่ 160-255

UTF-8 ต่อจากมูลค่า 256 ที่มีมากกว่า 10 000 ตัวอักษรที่แตกต่างกัน

เพื่อให้ดูใกล้ชิดและการศึกษาของเรา ตัวอักษร HTML สมบูรณ์ชุดอ้างอิง