2015年8月18日 星期二

字元編碼 Unicode


1.  編碼最早是  ASCII 有 1 byte , 8 bits

2. 微軟發展出 Big 5 支援其他語系, 有 2 bytes, 16bits
    缺點是:  a. 有些文字是 2 bytes, 但此時英文語系還是 1 byte
                 b. 固定每個國家不同
                 c. 會有 許功蓋 問題, 因為跳脫字元


3.  Unicode 出現
    a.  支援所有國家的字元, 用 2 bytes 表示所有字元
    b.  是一個 Table 來存所有國家字元


4. UTF8
    a. 是個編碼方法,為了動態決定 Unicode 長度
    b. 在記憶體的字元是 Unicode, 但寫到檔案, 網路傳輸 將字元編碼成 UTF8
    c. 在讀取檔案時, 指定 UTF8 才會解碼 UTF8 到 Unicode string

沒有留言:

張貼留言