Jirattikarn Prompong Blog: รหัสแทนข้อมูล

รหัสแทนข้อมูล ( รหัส ASCII และ รหัส Unicode )

รหัสแอสกี้ (ASCII : American Standard Code for Information Interchange)

รหัสแอสกี (ASCII) เป็นเป็นรหัสที่กำหนดขึ้นโดยหน่วยงานกำหนดมาตรฐานของสหรัฐอเมริกา ย่อมาจาก American Standard Code for Information Interchange เป็นรหัส 8 บิต ใช้แทนสัญลักษณ์ต่าง ๆ ได้ 256 ตัว นิยม ใช้กันแพร่หลายกับระบบคอมพิวเตอร์ทั่วไปและระบบสื่อสารข้อมูล

บิดที่

โครงสร้างของรหัสแอสกี มีดังนี้

บิตที่ 4 - 7 ประเภทของตัวอักขระ

0010 เครื่องหมายต่าง ๆ

0011 ตัวเลขและเครื่องหมายต่าง ๆ

0100 A - O

0101 P - Z และเครื่องหมายต่าง ๆ

0110 a - o

0111 p - z และเครื่องหมายต่าง ๆ

บิตที่ 0 ถึง 3 เป็นรหัสแทนอักขระแต่ละตัวในกลุ่ม

ตัวอย่าง รหัสแทนข้อมูลแบบ ASCII

บิตที่	7	6	5	4	3	2	1	0
	0	0	1	1	0	1	1	1	แทน 7
	0	1	0	0	0	1	1	1	แทน G
	0	1	1	0	0	1	1	1	แทน g
	0	1	0	0	1	0	1	0	แทน J
	0	0	1	0	1	0	1	1	แทน +

จากหลักการของระบบเลขฐานสอง แต่ละบิตสามารแทนค่าได้ 2 แบบ คือ เลข 0 หรือเลข 1 ถ้าเราเขียนเลขฐานสอง เรียงกัน 2 บิต ในการแทนอักขระ เราจะมีรูปแบบในการแทนอักขระได้ 2 หรือ 4 รุปแบบคือ 00 ,01 ,10 ,11 ดังนั้นในการใช้รหัสแอสกีซึ่งมี 8 บิต ในการแทนอักขระแล้ว เราจะมีรูปแบบที่ใช้แทนถึง 28 หรือ 256 รูปแบบ ซึ่งเมื่อใช้แทนตัวอักษรภาษาอังกฤษแล้ว ยังมีเหลืออยู่ สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรม หรือ สมอ.จึงได้กำหนดรหัสภาษาไทยเพิ่มลงไปเพื่อให้ใช้งานร่วมกัน

ตัวอย่าง การแทนข้อมูลในเครื่องคอมพิวเตอร์

A	0100 0001	X	0101 1000
B	0100 0010	Y	0101 1001
C	0100 0011	Z	0101 1010
D	0100 0100	0	0011 0000
E	0100 0101	1	0011 0001
F	0100 0110	2	0011 0010
G	0100 0111	3	0011 0011
H	0100 1000	4	0011 0100
I	0100 1001	5	0011 0101
J	0100 1010	6	0011 0110
K	0100 1011	7	0011 0111
L	0100 1100	8	0011 1000
M	0100 1101	9	0011 1001
N	0100 1110	.	0010 1110
O	0100 1111	(	0010 1000
P	0101 0000	+	0010 1011
Q	0101 0001	$	0010 0100
R	0101 0010	*	0010 1010
S	0101 0011	)	0010 1001
T	0101 0100	-	0010 1101
U	0101 0101	/	0010 1111
V	0101 0110	'	0010 1100
W	0101 0111	=	0010 1101

รหัสยูนิโคด (Unicode)

เป็นรหัสแบบใหม่ล่าสุด ถูกสร้างขึ้นมาเนื่องจากรหัสขนาด 8 บิตซึ่งมีรูปแบบเพียง 256
รูปแบบ ไม่สามารถแทนภาษาเขียนแบบต่าง ๆ ในโลกได้ครบหมด โดยเฉพาะภาษาที่เป็นภาษาภาพ
เช่น ภาษาจีนหรือภาษาญี่ปุ่นเพียงภาษาเดียวก็มีจำนวนรูปแบบเกินกว่า 256 ตัวแล้ว

UniCode จะเป็นระบบรหัสที่เป็น 16 บิต จึงแทนตัวอักษรได้มากถึง 65,536 ตัว ซึ่ง
เพียงพอสำหรับตัวอักษรและสัญลักษณ์กราฟฟิกโดยทั่วไป รวมทั้งสัญลักษณ์ทางคณิตศาสตร์ต่าง ๆ
ในปัจจุบันระบบ UniCode มีใช้ในระบบปฏิบัติการ Window NT ระบบปฏิบัติการ UNIX
บางรุ่น รวมทั้งมีการสนับสนุนชนิดข้อมูลแบบ UniCode ในภาษา JAVA ด้วย

JIRATTIKARN PROMPONG

0100 1010 J

0100 1001 I

0101 0010 R

0100 0001 A

0101 0100 T

0100 1001 I

0100 1011 K

0100 0001 A

0101 0010 R

0100 1110 N

0101 0000 P

0101 0010 R

0100 1111 O

0100 1101 M

0101 0000 P

0100 1111 O

0100 1110 N

0100 0111 G

*** ใช้พื้นที่จัดเก็บจำนวน 152 bit 19 byte ***

credit : http://neung.kaengkhoi.ac.th/mdata/rsdata4.html#d3

Jirattikarn Prompong Blog

วันจันทร์ที่ 8 กรกฎาคม พ.ศ. 2556

รหัสแทนข้อมูล

ไม่มีความคิดเห็น:

แสดงความคิดเห็น