要讓一個網頁、一群可以編輯的電子檔案或一套系統能完整支援 Unicode,
至少要具備下列條件:
一、檔案或資料庫編碼:
  必須儲存為 UTF-16 LE、UTF-16 BE、UTF-8 或其他 Unicode 格式,
  或者兼容 Unicode 編碼(如 Word 97 及其以後的 Word 檔案)。
  如果是網頁的話,還要在原始檔中宣告使用字集為 Unicode 的任一種字集。
二、字型:
  能夠支援最新版本 Unicode 收納的字元的字型,才是一套好的字型。
  例如:Windows Vista/7 內建的新細明體支援 CJK 和 CJK Ext-A 字集,
     Windows XP 內建的新細明體只支援 CJK 字集,
     所以 Windows Vista/7 內建的新細明體優於Windows XP 內建的新細明體。
三、輸入法:
  能夠支援最新版本 Unicode 收納的字元的輸入法,才是一套好的輸入法。

如果是編輯者,以上三者缺一不可;
如果是使用者,字型才是最關鍵的因素。

最近幾個月來,我看到公文電子交換檔已經陸續改用 Unicode 編碼,
深感這一天來得太慢了!但至少政府已經踏出了一大步。

不過,因為行政院研究發展考核委員會制定的公文格式,
指定須以標楷體做為公文字型,
(該會94年2月21日頒布、96年1月增訂的「政府文書格式參考規範」第5頁中明確指出:
字型:中文採楷書)
無疑的,這又讓支援 Unicode 的程度因此受限,
因為不管是 Windows XP、Vista 或 Windows 7,
它們內建的標楷體字型都只能只援 CJK 字集的 20,902 個字。
(即使是 CNS11643 網站上提供的楷書字型也不支援 CJK Ext-B 字集)

關於這一點,我曾經口頭反映給研考會的承辦人,
請她協調行政院主計處的 CNS11643 團隊,
將他們已經造好的單字楷書字型整理成兩套公文楷書字型,
(CJK 和 CJK Ext-A 一套,CJK Ext-B 一套)
造好後就可以做為 Freeware 讓大家使用
(當然也可以強制政府機關都用這兩套字型)。
不過,她的想法是她會問看看台灣微軟願不願意幫忙,
當時看她很認真的記著筆記,希望未來公文字型的問題能因此解決,
否則一篇公文如果同時出現標楷體和新細明體,
甚至是空白字元、問號或奇怪的字元,那可是大家所不願樂見的。

輸入法的話,
只要系統字型(如:Windows 的新細明體)有支援較新版本的 Unicode,
那麼泰瑞倉頡輸入法是一套不錯的選擇(老王賣瓜一下)。

公文電子交換檔之所以不能直接用 PDF 檔來交換,
是因為公文電子交換時必須由交換系統先解讀格式,
所以公文電子交換檔一向都用類似 XML 的 DI 格式,
(用 PDF 的好處是造字可以嵌在檔案裡一起送出,不用管對方是否有正確對應的字型)
這一點是無可厚非的,
但因為政府腳步太慢,之前沒有讓 DI 檔用 Unicode 編碼格式儲存,
以致於這些陳年儲存下來的 DI 檔,因為裡頭儲存了很多利用造字區造出來的外字,
所以現在要回溯將這些陳年的 DI 檔轉換為 Unicode 編碼格式儲存的話,
恐怕會有造字對應到錯誤字元的問題,
如果政府早些年就強制規定 DI 檔必須儲存為 Unicode 格式,
那麼今天面臨的這種困擾就可以減輕多了!
看來政府還是要好好加油!

arrow
arrow
    全站熱搜

    terryhung 發表在 痞客邦 留言(0) 人氣()