正體中文版 Windows 的內碼是 Big5,它的造字區如下:
FA40-FEFE:
這一區有 1215 個碼位,但有 15 個碼位被保留,所以可以用來造字的碼位有 1200 個。
8E40-A0FE:
這一區有 4799 個碼位,但有 57 個碼位被保留,所以可以用來造字的碼位有 4742 個。
8140-8DFE:
這一區有 3263 個碼位,但有 39 個碼位被保留,所以可以用來造字的碼位有 3224 個。
C6A1-C8FE:
這一區有 606 個碼位,但有 8 個碼位被保留,所以可以用來造字的碼位有 598 個。
四區合計可用來造字的碼位共有 9764 個。

簡體中文版 Windows 的內碼是 GB2312,它的造字區如下:
AAA1-AFFE:
這一區有 1374 個碼位,但有 12 個碼位被保留,所以可以用來造字的碼位有 1362 個。
F8A1-FEFE:
這一區有 1630 個碼位,但有 14 個碼位被保留,所以可以用來造字的碼位有 1616 個。
A140-A7A0:
這一區有 1633 個碼位,但有 112 個碼位被保留,所以可以用來造字的碼位有 1521 個。
三區合計可用來造字的碼位共有 4499 個。

以上數據是從兩種版本 Windows XP 的造字程式得出來的。
不過,實際上可能無法使用那麼多的碼位來造字,
因為它的說明檔裡有提到:
「使用 [TrueType 造字程式 (PCE)],字型庫中最多可建立 6,400 個唯一的字元 (如特殊字母及標誌) 以供使用。」
就算全部可用來造字的碼位都能使用,
Big5 的漢字只能擴充為 13070+9764=22834 個漢字;
GB2312 的漢字只能擴充為 6763+4499=11262 個漢字。
和 CJK 的 20902 個漢字相比,
Big5 原來的字集加上造字的方案,可以達到支援所有 CJK 字元的境界;
但是,GB2312 原來的字集加上造字的方案,則只能支援一半左右的 CJK 字元。

中共似乎很瞭解這種處境,
聽說 Windows ME 或是不支援 GB 18030 標準的軟體不能在中國大陸上市,
也就是說:2000 年之後,中共用的軟體大多已支援 Unicode 編碼了!
但反觀台灣方面,有些官方的系統至今還在用 Big5 加造字區的方案,實在落伍太多了!

不可否認的,造字區一定會有用到的機會!
像最近陳菊打的高雄縣市合併的廣告裡,創了一個新字──「県市」,還幫它注音為「ㄉㄨ」(都),
在 Unicode 組識尚未收錄這個字,而且任何字型都還沒有支援這個字之前,用造字方案是確有必要的。
但是在 Windows Vista/7 都已內建支援 70195 個漢字的字型這種情況下,
再用大量造字的方式來解決漢字顯示問題的話,無疑是一種緣木求魚的方式。

arrow
arrow
    全站熱搜

    terryhung 發表在 痞客邦 留言(0) 人氣()