要讓一個網頁、一群可以編輯的電子檔案或一套系統能完整支援 Unicode,
至少要具備下列條件:
一、檔案或資料庫編碼:
必須儲存為 UTF-16 LE、UTF-16 BE、UTF-8 或其他 Unicode 格式,
或者兼容 Unicode 編碼(如 Word 97 及其以後的 Word 檔案)。
如果是網頁的話,還要在原始檔中宣告使用字集為 Unicode 的任一種字集。
二、字型:
能夠支援最新版本 Unicode 收納的字元的字型,才是一套好的字型。
例如:Windows Vista/7 內建的新細明體支援 CJK 和 CJK Ext-A 字集,
Windows XP 內建的新細明體只支援 CJK 字集,
所以 Windows Vista/7 內建的新細明體優於Windows XP 內建的新細明體。
三、輸入法:
能夠支援最新版本 Unicode 收納的字元的輸入法,才是一套好的輸入法。
如果是編輯者,以上三者缺一不可;
如果是使用者,字型才是最關鍵的因素。
最近幾個月來,我看到公文電子交換檔已經陸續改用 Unicode 編碼,
深感這一天來得太慢了!但至少政府已經踏出了一大步。
不過,因為行政院研究發展考核委員會制定的公文格式,
指定須以標楷體做為公文字型,
(該會94年2月21日頒布、96年1月增訂的「政府文書格式參考規範」第5頁中明確指出:
字型:中文採楷書)
無疑的,這又讓支援 Unicode 的程度因此受限,
因為不管是 Windows XP、Vista 或 Windows 7,
它們內建的標楷體字型都只能只援 CJK 字集的 20,902 個字。
(即使是 CNS11643 網站上提供的楷書字型也不支援 CJK Ext-B 字集)
關於這一點,我曾經口頭反映給研考會的承辦人,
請她協調行政院主計處的 CNS11643 團隊,
將他們已經造好的單字楷書字型整理成兩套公文楷書字型,
(CJK 和 CJK Ext-A 一套,CJK Ext-B 一套)
造好後就可以做為 Freeware 讓大家使用
(當然也可以強制政府機關都用這兩套字型)。
不過,她的想法是她會問看看台灣微軟願不願意幫忙,
當時看她很認真的記著筆記,希望未來公文字型的問題能因此解決,
否則一篇公文如果同時出現標楷體和新細明體,
甚至是空白字元、問號或奇怪的字元,那可是大家所不願樂見的。
輸入法的話,
只要系統字型(如:Windows 的新細明體)有支援較新版本的 Unicode,
那麼泰瑞倉頡輸入法是一套不錯的選擇(老王賣瓜一下)。
公文電子交換檔之所以不能直接用 PDF 檔來交換,
是因為公文電子交換時必須由交換系統先解讀格式,
所以公文電子交換檔一向都用類似 XML 的 DI 格式,
(用 PDF 的好處是造字可以嵌在檔案裡一起送出,不用管對方是否有正確對應的字型)
這一點是無可厚非的,
但因為政府腳步太慢,之前沒有讓 DI 檔用 Unicode 編碼格式儲存,
以致於這些陳年儲存下來的 DI 檔,因為裡頭儲存了很多利用造字區造出來的外字,
所以現在要回溯將這些陳年的 DI 檔轉換為 Unicode 編碼格式儲存的話,
恐怕會有造字對應到錯誤字元的問題,
如果政府早些年就強制規定 DI 檔必須儲存為 Unicode 格式,
那麼今天面臨的這種困擾就可以減輕多了!
看來政府還是要好好加油!