我打造的「泰瑞倉頡輸入法」結合了以下三個輸入法的優點:
1.「亂倉打鳥輸入法」在符號支援上的優點
2.「倉頡之友 。馬來西亞─第五代倉頡輸入法」在支援字元集上的優點
2.「中標倉頡輸入法」在支援字元集上的優點
不僅可以輕鬆輸入符號,還可兼容第三代和第五代倉頡拆碼原則,
最重要的是支援 CJK、CJK Ext-A、CJK Ext-B 這三個 Unicode Block 的所有字元!
(有關 Unicode 各 Block 名稱及碼位,可參考:
https://zh.wikipedia.org/wiki/Unicode字元平面對映

「泰瑞倉頡輸入法對照表」的下載網址是:
http://www.mediafire.com/file/cwicp98a065lxda/THCJ5.zip
(壓縮檔內已放置「ReadMe.txt」說明檔)

在打造這個輸入法的過程中,意外發現下列幾個心得,
列出來和有興趣的網友一起分享。

心得一:
「泰瑞倉頡輸入法」支援的字元比下列兩者還多:
1.Windows Vista 內建的倉頡、新倉頡
2.Office 2007 內附的新倉頡
(以上兩者都已經事先勾選支援全部的字元集)
舉例來說:「㲿」這個字(倉頡碼為「水戈」),
使用「泰瑞倉頡輸入法」軟體可以打得出來,但使用以上兩者都不行。

心得二:
倉頡的重碼字比嘸蝦米、大易、行列還少!
從「鯨魚、我的倉頡輸入法」網站上可以取得以上所述各種輸入法的 Big5 重碼字列表,
倉頡的重碼字只有 3 頁,遠低於嘸蝦米的 16 頁!
所以如果您挑選輸入法的重點考量為「避免太多重碼字」,
那就應該挑選倉頡輸入法。
如果您不需要用到 CJK Ext-A、CJK Ext-B 的罕見字,
可以仿照前述文章提到的方法,自行打造一套只支援 CJK 字元的改良式倉頡輸入法,
除支援輕鬆輸入符號的方式外,並可把重碼字問題完全解決,
例如:「未」、「宋」雖然都拆「十木」,
但可將第二常用的「宋」字,改成必須拆「重十木」,
這是以前「零壹中文」及《第五代倉頡輸入法手冊》採取的方式,它們沒有重碼字的情形。
倉頡字母中的「重」就是為了應付「重碼字」的問題而設立的,
只是使用者遇到重碼字時,必須將重碼字死背下來,
而且有些 Big5 字元的倉頡碼會有四個重碼字,
第三常用和第四常用的重碼字,需要花心思想一下如何重新取一個適當的組字字根。

心得三:
支援中日韓統一表意文字及其擴展 A、B 區字元的「字型」,
不是只有「新細明體更新套件」、「Vista 新細明體字型」,
hanazono」字型也有支援。
「新細明體更新套件」只支援中日韓統一表意文字及其擴展 A、B 區的漢字
(至於是哪些字,可查看「漢字碼表」)。
hanazono」字型有支援別的 Unicode Block 的字元,
但是它的書寫方式不符合教育部頒布的標準字體,
而且在 Windows 中,也不方便把它作為「系統字型」。
我很期待會有一種字型把 Unicode 5.0.0 的所有字元全部收錄,
雖然這樣的字型檔應該會很大,但可以免除造字的問題
(這樣的話,除非字型不好看,或者 Unicode 5.0.0 沒有為某個異體字編碼才需要造字)。
微軟只發布支援 Unicode 3.1(包含 CJK、CJK Ext-A/B)漢字的新細明體,是合乎常理的,
因為 Windows 應用程式的 GUI 以及不指定字型的網頁,大部份情況都是顯示為新細明體,
所以 Microsoft 推出的字型只有新細明體支援 CJK、CJK Ext-A、CJK Ext-B 也就夠了!
畢竟該留點獲利空間讓商業字型製造者賺取,
只是 Unicode 3.1 的標準在 2001 年就公布了!
但至今華康字型、文鼎字型大多仍只援 CJK(1993 年公告的 Unicode 1.0)的字元,
最多支援到 CJK Ext-A(2000 年公告的 Unicode 3.0)的字元,
支援 CJK Ext-B(2001 年公告的 Unicode 3.1)字元的字型至今仍不多見。

心得四:
想要知道某個無法正常顯示的字元(或可以正常顯示的字元)的資訊
(比如想要知道它是屬於 CJK、CJK Ext-A、CJK Ext-B 或其他 Block),
可以先將該字元複製起來
(系統找不到對應字型而顯示成空白、□或其他符號的字元同樣可以複製起來),
貼到這個網頁的「Characters」欄裡,再按其上方的「Convert」鈕,
算出「Hexadecimal code points」的數值後,
將數值貼到下列網址的後端,
以算出的數值是「2F85D」為例,網址是:
http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=2F85D
即可得到該字的相關資訊。

我研究「顯示及輸入罕見字」的文章已經寫了不少篇了!
這裡的「罕見字」是指 CJK 以外的字
(也就是 CJK Ext-A、CJK Ext-B 的字,
因為 CJK 已內含 Big5 碼的字,所以這兩區的字也算是 Big5 以外的字),
我的解決方案是用「新細明體更新套件」來顯示罕見字
(如果是用 Vista 及其以後版本的正體中文 Windows 則不需安裝任何軟體或字型,
僅需確定檔案使用的編碼格式是 Unicode,而不是使用 ANSI 編碼,
並且設定的字型為「新細明體」或「新細明體-ExtB」);
輸入方面則用「泰瑞倉頡輸入法」來輸入罕見字,
這樣的解決方案應該可以滿足大多數有罕見字需求的人,
所以這方面的研究,後續更新部份應該只會補充在這篇文章裡,
如果有需要獨立出來的部份,
會放在「電腦─字碼、字型」、「電腦─輸入法」這兩個分類下,
有興趣交流的網友歡迎寫信給我:terryhorng@hotmail.com

arrow
arrow
    全站熱搜

    terryhung 發表在 痞客邦 留言(0) 人氣()