廣告贊助

其實我寫前三篇文章的背後動機是為了研究一個課題──
「發布嘸蝦米輸入法對照表是否會構成侵權行為?」
這個課題的答案是:應該不會!

對我這樣一個長期使用倉頡輸入法的人來說,
嘸蝦米使用者的權益根本就不關我的事,
而且冷血一點的話,還可以對蝦米族說:

你們在學無蝦米之前就應該知道:
學會以後要打字就要用行易出的軟體,
行易的軟體要付費購買授權才能無限制的使用,
不付錢就只能用盜版或試用版的。
如果知道了還學,不是自討苦吃嗎?
還花錢去買正版的人,是不是錢太多了?
其實有更好的替代方案就是學倉頡,
倉頡只用 25 個字根,好學、好記又免費,
為何不學倉頡?

但話說回來,有很多人其實並不是自願學嘸蝦米的。
許多高職商科、文書科的學生,
都要修「中打」(中文打字)這一門課程,
一些情況是老師教什麼輸入法,學生就得學什麼輸入法;
一些情況則是老師先讓學生表決,少數服從多數!
(我有位朋友在唸高職時學會大易,
當時他們班就用表決的方式決定學大易)
這些人一旦學會了嘸蝦米,也就只能「隨波逐流」了!
所以不能苛責他們為何要學嘸蝦米。

要說服只會注音的人來學倉頡,
不要去學行列、大易、嘸蝦米,
就要花一番功夫研究各種輸入法的優缺點。
甚至必須提出一些客觀的數據當作比較的依據,
而這也正是我編製各種中文輸入法對照表的用意。

有許多人不認為輸入法支援的字元集不足會是個缺點,
因為對他們來說,Big5 字元集的 13,053 個漢字就夠用了;
各種輸入法的學習難易度又見仁見智;
那我們就拿「重碼率」來比較吧!
「重碼字」少的話,
就可以省去選字、背誦重碼字順序(或「替代組字字根」)的麻煩,
所以它可以作為選擇輸入法的重要考慮因素之一。
從「鯨魚、我的倉頡輸入法」網站上可以取得以上所述各種輸入法的重碼字列表,
雖然它只列出 Big5 字元集的 13,053 個漢字共用同一輸入法組字字根的情況,
無法明確得知 Unicode 3.1 收錄的 70,195 個漢字共用同一輸入法組字字根的情形,
但畢竟平常的中文打字,大多只打 Big5 碼的漢字,所以比較這些列表也就足夠了!
我將這些列表由 PDF 檔轉成 Excel 工作表,並儲存於同一活頁簿(檔案)裡,
下載網址是:
http://www.mediafire.com/file/5dku48ke61b95mh/IME_Repeated_Code_in_Big5.zip
分析結果是:
大易3碼:重碼字的組字字根共計 2,087 條,5,031 字。
大易4碼:
重碼字的組字字根共計 593 條,1,284 字。
行列30:
重碼字的組字字根共計 1,117 條,2,396 字。
倉頡第三代:
重碼字的組字字根共計 500 條,1,034 字。
嘸蝦米:
重碼字的組字字根共計 3,007 條,6,946 字。
(另外,我分析「馬來西亞。倉頡之友」的倉頡輸入法對照表中的 Big5 漢字後,結論為:
倉頡第五代:重碼字的組字字根共計 504 條,1,046 字。
它使用的組字字根與朱邦復所著《第五代倉頡輸入法手冊》一書裡的組字字根不完全相同,
《第五代倉頡輸入法手冊》一書裡的組字字根沒有重碼字,
比如:書中列出「未」的組字字根為「十木」,「宋」的組字字根為「重十木」;
但該對照表裡列出「未」和「宋」的組字字根同為「十木」,
只是「宋」又多了「難十木」這條組字字根,
原本該用「重」作為起始字根,但「馬來西亞。倉頡之友」用「難」作為起始字根。
上述的分析結果,代表第五代倉頡只是把取碼規則變簡單了,但並沒有降低重碼率。)
有些人可能會認為嘸蝦米重碼字較多是因為一些重碼字可以有不同的拆法,
像「贏、嬴、羸、蠃、鸁、臝」這 6 個字都拆作「foua」,也都可以拆作「fouz」,
這樣就重複計算 6 個字。
所以我特別對這 6,946 個字做了「不選重複的紀錄」(唯一化)的動作,
唯一化後,仍有 5,614 個字會發生重碼的問題,
結論是:嘸蝦米的重碼字高居 4 種字形輸入法之冠。

Big5 碼的漢字是由 5,401 個「常用字」,和 7,652 個「次常用字」組成的。
將各輸入法的重碼字「唯一化」後,我們再進一步探討這個命題:
「用各種輸入法來輸入這些〝常用字〞(每字只打一次),
會遇到候選字的機率各是多少?」
答案是:
大易3碼:2,115/5,401≒39.16%
大易4碼:613/5,401≒11.35%
行列30:1,064/5,401≒19.70%
倉頡第三代:434/5,401≒8.04%
嘸蝦米:2,515/5,401≒46.57%
結果仍然一樣!

有的人會認為「選字率」比「重碼率」重要
以倉頡的 434 個重碼的「常用字」來說,
可能有一半的字已經被放在第一個候選字了!
連續輸入時,這些字是不必去選字的,
也就是選字率其實會比重碼率低很多
有一項統計資料是這樣的:
「嘸蝦米在 6000 個常用字裡約有 311 個字需要選字,
選字率為 311/6000≒5.18%(倉頡選字率約為 2.2%),
若用簡碼,選字率約為 3.9%;
在 2000 個常用字裡,嘸蝦米只有 33 個字需要選字,
選字率為 33/2000=1.65%(倉頡約為 1.4%),
若用簡碼,選字率約為 0.3%;
在 1000 個常用字裡,嘸蝦米只有 8 個字需要選字,
選字率為 8/1000=0.8%(倉頡約為 0.7%),
若用簡碼,選字率為 0.1%!」
這項統計資料沒有原始來源可供驗證,
但高重碼率往往伴隨高選字率卻是不爭的事實
嘸蝦米較具優勢的地方是每字最多取四碼,
但這也讓重碼的問題因而提高,
嘸蝦米的解決方法是發明簡碼來解決這個問題,
只是這種解決方式卻必須讓想求快的蝦米族不斷的「背~背~背」!
(難怪我妹會用嘸蝦米,
以她小學時就能背下全班電話號碼的功力,
來背嘸蝦米還真是適合!)

日後,我會不定期將一些心得或說服的理由補充在先前寫的
重碼字數量分析的心得》、
想學中文輸入法?就該學倉頡輸入法(一)》、
想學中文輸入法?就該學倉頡輸入法(二)》、
對嘸蝦米輸入法發明人劉重次先生一些言論的淺見
那四篇文章裡,
或是單獨發表成文章。

對於想學嘸蝦米、大易、行列的人,
我只能對你們說:先看看我的文章,再來考慮吧!


後記:

沒想到這篇文章在 2009 年 5 月 28 日經過「冷!很低調」在他的 Plurk 宣傳後,
竟然在文章標題旁出現了「」這個圖案!
(痞客邦的部落格才有,無名小站的沒有!
冷!很低調」的網址是從痞客邦管理後台的「拜訪紀錄」追蹤來的)
真是讓人驚喜!(我的 Blog 的單日瀏覽人次也因此創下了歷史新高)

為感謝各位的點閱,我提供想學倉頡輸入法的人一個教學網址:
http://www.fed.cuhk.edu.hk/readwrite/typing/

建議各位先看「字母分類」,從一些例子去記倉頡字母的輔助字形,
然後找張草稿紙,把各字母對應的輔助字形默寫下來,
如果全部默寫正確,那您已經學會一半的倉頡輸入法了!
接下來再看取碼原則及例外字,然後再做練習題
(它的練習題必須輸入倉頡字母而不是英文字母,作答時請注意這點)。
學會後,就要勤加練習(寫網誌、聊 msn 時都用倉頡輸入法)。
一開始可能會覺得比打注音還慢,但如果換回用注音就半途而廢了!
換回用注音只能是為了使用它的「反查組字字根」功能來查詢倉頡碼,
一旦理解不會拆的字的倉頡碼後,應該持續用倉頡輸入法。

指法是較難學的課程,我到現在幾乎都還是用左右手的食指敲鍵盤,
而且一定要看鍵盤的字母排列才能打出字來,
所以中打只有每分鐘三、四十個字的水準。
如果各位想打得更快,那就非學指法不可了!

創作者介紹

泰瑞的世界

terryhung 發表在 痞客邦 PIXNET 留言(0) 人氣()