รหัสแทนข้อมูล ( รหัส ASCII และ รหัส Unicode )
- รหัสแอสกี้ (ASCII : American Standard Code for Information Interchange)
รหัสแอสกี (ASCII) เป็นเป็นรหัสที่กำหนดขึ้นโดยหน่วยงานกำหนดมาตรฐานของสหรัฐอเมริกา ย่อมาจาก American Standard Code for Information Interchange เป็นรหัส 8 บิต ใช้แทนสัญลักษณ์ต่าง ๆ ได้ 256 ตัว นิยม ใช้กันแพร่หลายกับระบบคอมพิวเตอร์ทั่วไปและระบบสื่อสารข้อมูล
บิดที่
7
|
6
|
5
|
4
|
3
|
2
|
1
|
0
|
โครงสร้างของรหัสแอสกี มีดังนี้
บิตที่ 4 - 7
ประเภทของตัวอักขระ
0010
เครื่องหมายต่าง ๆ
0011
ตัวเลขและเครื่องหมายต่าง
ๆ
0100
A - O
0101
P - Z และเครื่องหมายต่าง
ๆ
0110
a - o
0111
p - z และเครื่องหมายต่าง
ๆ
บิตที่ 0 ถึง 3 เป็นรหัสแทนอักขระแต่ละตัวในกลุ่ม
ตัวอย่าง รหัสแทนข้อมูลแบบ ASCII
บิตที่
|
7
|
6
|
5
|
4
|
3
|
2
|
1
|
0
|
|
0
|
0
|
1
|
1
|
0
|
1
|
1
|
1
|
แทน 7
|
|
0
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
แทน G
|
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
แทน g
|
|
0
|
1
|
0
|
0
|
1
|
0
|
1
|
0
|
แทน J
|
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
แทน +
|
จากหลักการของระบบเลขฐานสอง
แต่ละบิตสามารแทนค่าได้ 2 แบบ คือ เลข 0 หรือเลข 1 ถ้าเราเขียนเลขฐานสอง เรียงกัน 2 บิต ในการแทนอักขระ เราจะมีรูปแบบในการแทนอักขระได้ 2 หรือ 4 รุปแบบคือ 00 ,01 ,10 ,11 ดังนั้นในการใช้รหัสแอสกีซึ่งมี 8 บิต
ในการแทนอักขระแล้ว เราจะมีรูปแบบที่ใช้แทนถึง 28 หรือ 256
รูปแบบ ซึ่งเมื่อใช้แทนตัวอักษรภาษาอังกฤษแล้ว ยังมีเหลืออยู่
สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรม หรือ
สมอ.จึงได้กำหนดรหัสภาษาไทยเพิ่มลงไปเพื่อให้ใช้งานร่วมกัน
ตัวอย่าง การแทนข้อมูลในเครื่องคอมพิวเตอร์
A
|
0100
0001
|
X
|
0101
1000
|
B
|
0100
0010
|
Y
|
0101
1001
|
C
|
0100
0011
|
Z
|
0101
1010
|
D
|
0100
0100
|
0
|
0011
0000
|
E
|
0100
0101
|
1
|
0011
0001
|
F
|
0100
0110
|
2
|
0011
0010
|
G
|
0100
0111
|
3
|
0011
0011
|
H
|
0100
1000
|
4
|
0011
0100
|
I
|
0100
1001
|
5
|
0011
0101
|
J
|
0100
1010
|
6
|
0011
0110
|
K
|
0100
1011
|
7
|
0011
0111
|
L
|
0100
1100
|
8
|
0011
1000
|
M
|
0100
1101
|
9
|
0011
1001
|
N
|
0100
1110
|
.
|
0010
1110
|
O
|
0100
1111
|
(
|
0010
1000
|
P
|
0101
0000
|
+
|
0010
1011
|
Q
|
0101
0001
|
$
|
0010
0100
|
R
|
0101
0010
|
*
|
0010
1010
|
S
|
0101
0011
|
)
|
0010
1001
|
T
|
0101
0100
|
-
|
0010
1101
|
U
|
0101
0101
|
/
|
0010
1111
|
V
|
0101
0110
|
'
|
0010
1100
|
W
|
0101
0111
|
=
|
0010
1101
|
- รหัสยูนิโคด (Unicode)
รูปแบบ ไม่สามารถแทนภาษาเขียนแบบต่าง ๆ ในโลกได้ครบหมด โดยเฉพาะภาษาที่เป็นภาษาภาพ
เช่น ภาษาจีนหรือภาษาญี่ปุ่นเพียงภาษาเดียวก็มีจำนวนรูปแบบเกินกว่า 256 ตัวแล้ว
UniCode จะเป็นระบบรหัสที่เป็น 16 บิต จึงแทนตัวอักษรได้มากถึง 65,536 ตัว ซึ่ง
เพียงพอสำหรับตัวอักษรและสัญลักษณ์กราฟฟิกโดยทั่วไป รวมทั้งสัญลักษณ์ทางคณิตศาสตร์ต่าง ๆ
ในปัจจุบันระบบ UniCode มีใช้ในระบบปฏิบัติการ Window NT ระบบปฏิบัติการ UNIX
บางรุ่น รวมทั้งมีการสนับสนุนชนิดข้อมูลแบบ UniCode ในภาษา JAVA ด้วย



credit : http://neung.kaengkhoi.ac.th/mdata/rsdata4.html#d3
เพียงพอสำหรับตัวอักษรและสัญลักษณ์กราฟฟิกโดยทั่วไป รวมทั้งสัญลักษณ์ทางคณิตศาสตร์ต่าง ๆ
ในปัจจุบันระบบ UniCode มีใช้ในระบบปฏิบัติการ Window NT ระบบปฏิบัติการ UNIX
บางรุ่น รวมทั้งมีการสนับสนุนชนิดข้อมูลแบบ UniCode ในภาษา JAVA ด้วย
JIRATTIKARN PROMPONG
0100 1010 J
0100 1001 I
0101 0010 R
0100 0001 A
0101 0100 T
0101 0100 T
0100 1001 I
0100 1011 K
0100 0001 A
0101 0010 R
0100 1110 N
0101 0000 P
0101 0010 R
0100 1111 O
0100 1101 M
0101 0000 P
0100 1111 O
0100 1110 N
0100 0111 G
*** ใช้พื้นที่จัดเก็บจำนวน 152 bit 19 byte ***




ไม่มีความคิดเห็น:
แสดงความคิดเห็น