重要提醒:
以下內容及對應的輸入法對照表(碼表)發布於 2009 年,
近年來,筆者已將輸入法課題的重心移至「小小輸入法」,
因此,不再提供 for 「通用輸入法編輯工具」、「奇摩輸入法」、「香草輸入法」版本的對照表,
如需取得最新版的對照表,請至【新版「泰瑞系列中文輸入法對照表」簡介】一文內下載。
或下載最新版【泰瑞版小小輸入法】,

解壓縮後,查看「mb」資料夾下的 txt 檔,即可得到最新版的對照表。
保留本文的用意是讓一些讀者研究筆者早年發表的輸入法相關文章(重碼字分析)時,有所輔助,特此聲明。


目前泰瑞系列「中文輸入法對照表」已整理出倉頡、嘸蝦米、注音、拼音(漢語)四種輸入法的對照表,
這些對照表有下列特色:

一、優點
 1.支援 Unicode 3.1(CJK、CJK Ext-A、CJK Ext-B)的 70,195 個漢字,沒有一個字被遺漏。
 2.倉頡輸入法對照表、注音輸入法對照表都支援更方便的符號輸入方式。
 3.倉頡輸入法對照表支援第三代倉頡和第五代倉頡(但並非全部的字都合乎這兩代正統的規則)。

二、缺點
 1.重碼字變多,可能要浪費一些時間從候選字窗格裡挑選所欲輸入的字元。
 2.如果用「通用輸入法編輯工具」來產生輸入法軟體的話,
  產生的輸入法軟體在後天上會有一些限制,
  詳情請參考《「輸入法對照表」的妙用與「通用輸入法編輯工具」的限制》這一篇文章。


我將這三種輸入法的對照表分成不同的版本,
*.txt 檔可支援 Windows 附屬應用程式的「通用輸入法編輯工具」;
*.cin 檔可支援「Yahoo! 奇摩輸入法」及「OpenVanilla 香草輸入法」。
另外還區分「完整版」及「精簡版」,
如果您不需要用到 CJK Ext-A、 CJK Ext-B 的字元,
可以使用精簡版(Lite 版),可以大幅減少「遇到重碼字需花時間去找候選字」的問題。

這三種輸入法對照表的使用說明如下:


一、(舊版)泰瑞倉頡輸入法對照表:

  下載網址:http://www.mediafire.com/download/cwicp98a065lxda/THCJ5.zip
  穩定版本,遇到重碼字的機率雖然變高了,但仍在可接受的範圍內,
  遇到重碼字時,常用字大多在候選字窗格的第一位,所以連續輸入字元時幾乎不受影響;
  使用由此對照表而產生的輸入法軟體,可以感受到符號的輸入方式變得很簡便。

  此對照表分為:
  1.第三代版
  2.第五代版(「馬來西亞。倉頡之友」的版本,加補完檔)
  3.第三代和第五代混合版
  4.調整後的第三代和第五代混合版
  不過,cin 檔方面,只有調整後的第三代和第五代混合版。

  第三代版採用 CNS 全字庫(2006-2-22 版本)的組字字根,
  經過整理後,我發現它缺少 CJK 三區合計 70,195 個字裡的 253 個字,
  大部分缺字的組字字根,我已經從 CNS11643 網站上取得,
  只有 6 個字(亠、冫、勹、皼、、)是依我個人的判斷而補上組字字根的,
  另外,CNS11643 網站上將「椩」的組字字根中的「O」(英文)誤植為「0」(數字),
  亦一併補正。

  建議熟悉倉頡輸入法的人捨棄 Windows 內建的倉頡輸入法軟體,
  改用由「THCJA.txt」(調整後的第三代和第五代混合版)而產生的輸入法軟體
  (我平常就會使用由這個混合版的對照表而產生的輸入法軟體,
  一發現有什麼問題就會記錄下來,當日後改版維護的依據,
  並將「改版建議」寫在:
  《支援 CJK Ext-B 字元的「泰瑞倉頡輸入法對照表」(改版建議篇)》這一篇文章裡,
  曾經下載並正在使用這個對照表的人,
  可以不定期回來看看多了哪些修改項目)。


二、(舊版)泰瑞嘸蝦米輸入法對照表:

  下載網址:http://www.mediafire.com/download/42n9yovrdiz2zsx/THLiu.zip
  測試版本,完整版的重碼字非常多,
  尤其是二碼、三碼出字的部分會大大降低原本應有的輸入速度,
  建議有 CJK Ext-A、CJK Ext-B 字元需求的人(或是熟悉修改對照表的人)才可使用。

  這個對照表的精簡版可支援「吔」字的字根,
  不必使用加字加詞檔的功能即可確保 CJK 的 20,902 個字都能被支援,
  看著別人用倉頡就能打出字,
  而用行易的嘸蝦米輸入法軟體卻可能要切換四種模式才能打出想要的 CJK 字元的蝦米族,
  可以試試精簡版的對照表,
  但是,因為我平常不會使用嘸蝦米輸入法,
  所以這個版本的對照表並不會被維護到,
  建議不會修改對照表的人,還是購買行易公司出的輸入法軟體來用,
  雖然他們的輸入法軟體支援的字元集不足,但至少比較穩定。


三、(舊版)泰瑞注音輸入法對照表:

  下載網址:http://www.mediafire.com/download/zhcyb7ac6196a62/THPho.zip
  穩定版本,但完整版的重碼字非常多(多得非常離譜)!
  而且受限於「通用輸入法編輯工具」匯入同一條組字字根時,
  只能匯入前 256(或 257)個字元,
  超過的部分不會被匯入 IME 檔裡,
  所以要讓完整版對照表發揮最大功用的話,就只能搭配「OpenVanilla 香草輸入法」使用。

  如果您執意要使用「通用輸入法編輯工具」來產生完整版的輸入法軟體的話,
  提醒您注意:在全部的 1524 種讀音裡,因為有 30 種讀音對應的字元超過 256 字,
  所以會造成 IME 檔有缺字的現象,
  因此您無法使用由此對照表而產生的輸入法軟體來輸入全部 Unicode 3.1 的漢字。

  此對照表最好是當作各個由「通用輸入法編輯工具」而產生的軟入法軟體
  彼此間反查 CJK、CJK Ext-A 讀音的依據
  (因為由「通用輸入法編輯工具」而產生的軟入法軟體有後天上的缺陷,
  所以不能反查 CJK Ext-B 字元的讀音),
  建議有 CJK Ext-A、CJK Ext-B 字元需求的人還是去學倉頡輸入法比較實際,
  一般使用者請繼續使用 Microsoft 的新注音輸入法軟體或您喜好的泛注音輸入法軟體,
  不要嘗試使用由完整版對照表而產生的輸入法軟體來輸入 CJK Ext-A、CJK Ext-B 的字元。

  習慣使用 Windows 注音輸入法軟體(ㄅ半)的人,可以試試精簡版的對照表,
  它與 Windows 內建的注音輸入法軟體的差別不大,但輸入符號的方式比較簡便。

  值得一提的是:
  完整版所有字的注音幾乎都是依照 CNS11643 網站上的定義,
  但有 45 個字的注音是我自創的,
  詳見《支援 CJK Ext-B 字元的「泰瑞注音輸入法對照表」(補完計畫篇)》一文的說明。


四、泰瑞拼音輸入法對照表:

  下載網址:http://www.mediafire.com/download/rdycllfo1csf3k2/THPY.zip
  穩定版本,但完整版的重碼字非常多(多得非常離譜)!
  它是由「泰瑞注音輸入法對照表」轉換而成的對照表。
  由於某些字的拼音加聲調會用到 7 個字根來組字(例如「床」的組字字根為「chuang2」),
  「通用輸入法編輯工具」在此種情形下只能定義 15 個字根,
  但漢語拼音必須使用 26 個英文字母作為字根,
  結果是:泰瑞拼音輸入法對照表不能搭配「通用輸入法編輯工具」來產生輸入法程式。
  所以要讓完整版對照表發揮最大功用的話,就只能搭配「OpenVanilla 香草輸入法」使用。


提醒您注意:
「Yahoo! 奇摩輸入法」目前並不支援 CJK Ext-B 的字元,
所以即使匯入完整版的對照表後,仍無法輸入CJK Ext-B 的字元。
如果您需要使用 CJK Ext-B 的字元,
請用「通用輸入法編輯工具」產生您需要的輸入法軟體
或改用「OpenVanilla 香草輸入法」。

另外,我並未逐一校對原始 CIN 檔的組字字根是否正確,
所以,我雖然將 CJK 及其擴展 A、B 區的 70,195 個漢字都包含在輸入法對照表裡了,
但不一定用直覺的、合乎理論的拆碼規則就能打出字。
例如:我在找 HKSCS 字元集的漢字時,發現了這兩個字:「曱」、「甴」,
「曱」在「Office 2007 新倉頡」或「Vista 內建的倉頡」這兩套軟體裡都是拆「田一中」;
「甴」在「Office 2007 新倉頡」或「Vista 內建的倉頡」這兩套軟體裡都是拆「中田一」;
但因為「倉頡之友 。馬來西亞」的輸入法軟體把這兩個字
「囗」內的直線與「囗」外的直線,看成是兩條線,
所以,「曱」要拆「田一中中」;「甴」要拆「中田中一」。
雖然我之後有加入 CNS 全字庫的第三代倉頡組字字根,可以解決部分的問題,
但因為「倉頡之友 。馬來西亞」的輸入法軟體有一萬多個缺字,
gcin 網站是用 CNS 全字庫的第三代倉頡組字字根來補完,
所以有一些「THCJ5.txt」裡的組字字根並不符合第五代倉頡的理論。
確認全部字元的組字字根都沒有錯誤的校對工作還是只能靠人工作業,
而由我獨自一人逐條校對實在是一件很浩大的工程,
所以只好先擱置這個缺點,不去管它!

歡迎下載「泰瑞系列中文輸入法對照表」回去使用,
並修改成另一個符合您使用習慣的對照表版本。
修改的方式可以參考壓縮檔內的 ReadMe.txt。

arrow
arrow
    全站熱搜

    terryhung 發表在 痞客邦 留言(1) 人氣()