วันจันทร์ที่ 8 กรกฎาคม พ.ศ. 2556

รหัสแทนข้อมูล

รหัสแทนข้อมูล ( รหัส ASCII และ รหัส Unicode )


  • รหัสแอสกี้ (ASCII : American Standard Code for Information Interchange)

          รหัสแอสกี (ASCII) เป็นเป็นรหัสที่กำหนดขึ้นโดยหน่วยงานกำหนดมาตรฐานของสหรัฐอเมริกา ย่อมาจาก American Standard Code for Information Interchange เป็นรหัส 8 บิต ใช้แทนสัญลักษณ์ต่าง ๆ ได้ 256 ตัว นิยม ใช้กันแพร่หลายกับระบบคอมพิวเตอร์ทั่วไปและระบบสื่อสารข้อมูล


บิดที่    
7
6
5
4
3
2
1
0

โครงสร้างของรหัสแอสกี มีดังนี้
                              บิตที่ 4 - 7                                             ประเภทของตัวอักขระ
                              0010                                                        เครื่องหมายต่าง ๆ 
                              0011                                                        ตัวเลขและเครื่องหมายต่าง ๆ
                              0100                                                        A - O 
                              0101                                                        P - Z และเครื่องหมายต่าง ๆ
                              0110                                                        a - o
                              0111                                                        p - z และเครื่องหมายต่าง ๆ

                             บิตที่ 0 ถึง 3 เป็นรหัสแทนอักขระแต่ละตัวในกลุ่ม

        ตัวอย่าง รหัสแทนข้อมูลแบบ ASCII

บิตที่
7
6
5
4
3
2
1
0


0
0
1
1
0
1
1
1
แทน 7

0
1
0
0
0
1
1
1
แทน G

0
1
1
0
0
1
1
1
แทน g

0
1
0
0
1
0
1
0
แทน J

0
0
1
0
1
0
1
1
แทน +

        จากหลักการของระบบเลขฐานสอง แต่ละบิตสามารแทนค่าได้ 2 แบบ คือ เลข 0 หรือเลข 1 ถ้าเราเขียนเลขฐานสอง เรียงกัน 2 บิต ในการแทนอักขระ เราจะมีรูปแบบในการแทนอักขระได้ 2 หรือ 4 รุปแบบคือ 00 ,01 ,10 ,11 ดังนั้นในการใช้รหัสแอสกีซึ่งมี 8 บิต ในการแทนอักขระแล้ว เราจะมีรูปแบบที่ใช้แทนถึง 28 หรือ 256 รูปแบบ ซึ่งเมื่อใช้แทนตัวอักษรภาษาอังกฤษแล้ว ยังมีเหลืออยู่ สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรม หรือ สมอ.จึงได้กำหนดรหัสภาษาไทยเพิ่มลงไปเพื่อให้ใช้งานร่วมกัน

        ตัวอย่าง การแทนข้อมูลในเครื่องคอมพิวเตอร์

A
0100 0001
X
0101 1000
B
0100 0010
Y
0101 1001
C
0100 0011
Z
0101 1010
D
0100 0100
0
0011 0000
E
0100 0101
1
0011 0001
F
0100 0110
2
0011 0010
G
0100 0111
3
0011 0011
H
0100 1000
4
0011 0100
I
0100 1001
5
0011 0101
J
0100 1010
6
0011 0110
K
0100 1011
7
0011 0111
L
0100 1100
8
0011 1000
M
0100 1101
9
0011 1001
N
0100 1110
.
0010 1110
O
0100 1111
(
0010 1000
P
0101 0000
+
0010 1011
Q
0101 0001
$
0010 0100
R
0101 0010
*
0010 1010
S
0101 0011
)
0010 1001
T
0101 0100
-
0010 1101
U
0101 0101
/
0010 1111
V
0101 0110
'
0010 1100
W
0101 0111
=
0010 1101




  • รหัสยูนิโคด (Unicode)
          เป็นรหัสแบบใหม่ล่าสุด ถูกสร้างขึ้นมาเนื่องจากรหัสขนาด 8 บิตซึ่งมีรูปแบบเพียง 256
รูปแบบ ไม่สามารถแทนภาษาเขียนแบบต่าง ๆ ในโลกได้ครบหมด โดยเฉพาะภาษาที่เป็นภาษาภาพ
เช่น ภาษาจีนหรือภาษาญี่ปุ่นเพียงภาษาเดียวก็มีจำนวนรูปแบบเกินกว่า 256 ตัวแล้ว

          UniCode จะเป็นระบบรหัสที่เป็น 16 บิต จึงแทนตัวอักษรได้มากถึง 65,536 ตัว ซึ่ง
เพียงพอสำหรับตัวอักษรและสัญลักษณ์กราฟฟิกโดยทั่วไป รวมทั้งสัญลักษณ์ทางคณิตศาสตร์ต่าง ๆ
ในปัจจุบันระบบ UniCode มีใช้ในระบบปฏิบัติการ Window NT ระบบปฏิบัติการ UNIX
บางรุ่น รวมทั้งมีการสนับสนุนชนิดข้อมูลแบบ UniCode ในภาษา JAVA ด้วย





JIRATTIKARN PROMPONG


0100 1010          
0100 1001          I
0101 0010          R
0100 0001          A  
0101 0100          T 
0101 0100          T 
0100 1001           
0100 1011           
0100 0001           A  
0101 0010           R
0100 1110           N

0101 0000           P 
0101 0010           R
0100 1111           
0100 1101          
0101 0000           P
0100 1111           O
0100 1110           N 
0100 0111          

*** ใช้พื้นที่จัดเก็บจำนวน 152 bit 19 byte ***




         


credit : http://neung.kaengkhoi.ac.th/mdata/rsdata4.html#d3

ไม่มีความคิดเห็น:

แสดงความคิดเห็น