EUC
维库,知识与思想的自由文库
|
EUC全名为Extended Unix Code,是一个使用8位编码来表示字符的方法。 它使用了一些兼容于ISO/IEC 2022区位码的94x94编码表,把每个区位加上0xA0来表示,以便兼容于ASCII。
[编辑] EUC-CNEUC-CN是GB 2312最常用的表示方法。浏览器编码表上的“GB2312”,通常都是指“EUC-CN”表示法。 GB 2312字元使用两个字节来表示。
举例来说,“啊”字是GB 2312之中的第一个汉字,它的区位码是1601。 在EUC-CN之中,它把0xA0+16=0xB0,0xA0+1=0xA1,得出0xB0A1。 [编辑] EUC-JPEUC-JP用来储存日本JIS X 0208(旧称JIS C 6226)及JIS X 0212字集的字符。但是,日语文字较多使用ISO-2022-JP或Shift_JIS的方法来表示。 半角片假名使用两个字节来表示。
JIS X 0208字元使用两个字节来表示。
JIS X 0212字元使用三个字节来表示。
[编辑] EUC-JISX0213EUC-JISX0213是一个制定中的EUC规格,用来表示JIS X 0213字集的字符。 半角片假名使用两个字节来表示。
JIS X 0213第一字面字元使用两个字节来表示。
JIS X 0213第二字面字元使用三个字节来表示。
[编辑] EUC-KREUC-KR用来储存韩国KS X 1001字集(旧称KS C 5601)的字符。此规格由KS X 2901(旧称KS C 5861)定义。 KS X 1001字元使用两个字节来表示。
[编辑] EUC-TWEUC-TW本来是台湾使用的其中一个汉字储存方法,以CNS 11643字表为基础。但是台湾普遍使用大五碼,EUC-TW甚少使用。 CNS 11643第一字面的字元使用两个字节来表示。
CNS 11643其他字面的字元使用四个字节来表示。
(CNS 11643第一字面可选择使用两个字节或四个字节来表示) [编辑] 参看[编辑] 参考文献
|


