廣告贊助

就目前最常見的中文輸入法而言,
使用人數最多的應該是「泛注音輸入法」,
所謂「泛注音輸入法」包括注音輸入法、新注音輸入法、自然輸入法……等,

因為中華民國的國語教育是以注音符號為教學基礎,
所以受過國語教育的人不需要學習別的技能就自然會使用「泛注音輸入法」。
反觀偽「中華人民共和國」的國語教育是以漢語拼音為教學基礎,
因此大陸同胞也不需要學習別的技能就自然會使用「拼音輸入法」。

漢字因為有太多的同音字,
所以用注音符號或漢語拼音字母來輸入某個讀音後,
電腦會出現很多候選字等待使用者選擇,
就這樣,輸入文字的速度被大大的拖累了!
儘管新注音輸入法、自然輸入法會依常見詞庫來自動幫使用者選好正確的詞語,
可以省去使用者必須反覆選字的麻煩,
但是使用者免不了還是必須自行更正輸入法軟體選錯的字,
而且如果不知道某個字的讀音時還需要查字典,
可以說相當的不方便!

於是,倉頡、行列、大易、嘸蝦米輸入法因應而生,
這些輸入法的好處是「不太」需要選字,
而且只要知道字怎麼寫就夠了!不需要理會字怎麼唸。
這四種輸入法的前三種,自 1980 年代以來都不行使專利權保護,
所以任何作業系統(不管是 Windows、Mac OS、Linux)內建的輸入法軟體,
想支援這三種輸入法的話,都不必另外付費給原本的發明人。
唯獨只有嘸蝦米輸入法,自 1989 年以來都行使專利權保護,
使用時必須由使用者另外取得輸入法軟體!
(儘管嘸蝦米輸入法的專利權在 2003 年 11 月 11 日因未依限繳費,而使專利權消滅了!
但至今衍生出來的輸入法軟體並不多,大部份皆為免費但並不實用的對照表)。

在台販售的電腦鍵盤,
除了印有 37 個注音符號(位於各按鍵右上角),
以及二、三、四、輕聲(一聲直接按空白鍵完成組字)外,
還印有 26 個英文字母(位於各按鍵左上角)、
26 個倉頡字根(各對應一個英文字母,位於各按鍵左下角),
加上 46 個大易字根(位於各按鍵右下角;不過,筆記型電腦不一定有印),
所以,使用注音、倉頡、大易、嘸蝦米輸入字元時,可以直接看鍵盤來得知字根的位置,
而行列的字根位置則需要由使用者自行背誦、記憶。

嘸蝦米輸入法以 26 個英文字母為字根;
倉頡輸入法雖然有 26 個字根,
但「重」這個字根只有「零壹中文」和兼容「第五代倉頡」的輸入法軟體才有用到,
它最理想的情況是用來實現輸入所有漢字時,不會有重碼字的問題,
但因為使用「重」字根的時機(規則)太難理解,
比如:為何「未」的倉頡碼是「十木」,「宋」的倉頡碼是「重十木」,而不是顛倒過來?
(也就是為何不是「宋」的倉頡碼取「十木」,「未」的倉頡碼取「重十木」?)
雖然「未」可能比「宋」常用,但有些重碼字的常用頻率並不是這麼好理解,
所以倚天中文及 Windows(Vista 除外)內建的倉頡輸入法軟體並不採用「重」字根,
以致造成輸入一萬三千多個 Big5 碼的漢字時,
仍有 1,034 個字會出現等待使用者選擇候選字的情況,
另外「難」字根沒有對應固定形狀的輔根,
所以也有人說倉頡輸入法只有 24 個字根。

對於行列輸入法及大易輸入法,
因為我涉獵不深,所以以下先輕輕帶過!

行列是 4 種字形輸入法裡,較好背誦的輸入法,
最懶的情況是只需背誦由它的 10 類基本筆形所衍生出來的 50 種基本輔根。
這 10 類基本筆形是:
1─;2└;3│;4+;5┐;6、;7ㄇ;8\;9/;0口
由於使用時常常需要將兩種筆形組合成一個較大的輔根來進行拆字,
所以為求打字打得快,有必要背誦它變化出來的所有輔根(約 250 種左右)。
一般常見的「行列 30」運用 1 下方的「Q A Z」,
一直到 0 下方的「P ; /」這三排的按鍵(共 30 鍵,所以稱為「行列 30」);
Q 代表的代碼為 10~14;A 代表的代碼為 15、1-;Z 代表的代碼為 16~19,
W 代表的代碼為 20~24;S 代表的代碼為 25、2-;X 代表的代碼為 26~29…依此類推。
(「-」代表只用它對應類別裡的基本筆形或基本輔根,
沒有搭配其他類別的基本筆形或基本輔根)。
例如:「土」這個字是由「4+」和「1─」組成的,
所以這個字的代碼為「41」,對應鍵盤上的「R」。
「口」這個字只由「0口」組成,
所以這個字的代碼為「0-」,對應鍵盤上的「;」。
「吉」字因為可以拆為「土」(41;對應「R」)和「口」(0-;對應「;」),
所以它的「組字字根」便是「R;」。
行列的缺點為拆字時需要從很細的形狀著手!
初學者如果不背下所有輔根的話,
在拆一個字時,需要在腦中分解、結合多次,才能決定按哪些鍵!

例如:要拆「調」字時,第一次大分解是將它分解為「言、ㄇ、土、口」,
第二次小分解是將「言」分為「、口」;「土」分為「十一」;
「ㄇ」(7-;對應「J」)、「口」(0-;對應「;」)已是完整的輔根,所以不必再分解。
第一次小結合是將「言」該取的「6、」及「0口」結合為「60」,對應「Y」;
將「土」該取的「4十」及「1一」結合為「41」,對應「R」;
最後大結合時,再將「言、ㄇ、土、口」對應的「Y J R ;」組合,然後出字!
另外,「; , . /」四個按鍵被定義為字根,不利作為全形標點符號的快速鍵。

大易用 46 個按鍵作為字根,本身就是一大敗筆!
不只手指要移動的範圍變大,
使用一般的筆記型電腦(鍵盤右邊沒有九宮格的鍵字鍵)
來輸入阿拉伯數字夾帶漢字的字串時,
必須
在大易、英數兩種輸入法軟體之間反覆切換,徒增麻煩。
另外,它也有全形標點符號快速鍵的問題,
而且,它的輔根多達 250 個左右,也不容易初學者背誦。

它與嘸蝦米較為類似的一點是拆字時「有時」可以從「較大的形狀」著手,
這有利於初學者不必從細微處去思考要怎麼拆字

(例如:「米」部的字,
大易取「米」開頭,嘸蝦米取「M」開頭;倉頡卻要取「火木」開頭)
所以很多初學者會覺得大易和嘸蝦米雖然要背的輔根比較多,
但至少拆字上比較便利。

不過,漢字是由一些「共同的細微字形」來做變化的,
這些「共同的細微字形」切割到最細的話,就是四十多種「筆形」,
與行列的十大類基本筆形不同的地方是:
它們是計算漢字筆劃時的依據,書寫時需要一筆寫完。
取「較大的形」時,就需要為這些「較大的形」各編一個對應的字根,
當這些「較大的形」數量太多,字根又被限定只能用 26 鍵時,
就會變成一個字根需要對應很多「較大的形」,
無形之中忽略了「字形輸入法應取漢字共同的細微字形」的重點,
加上碼長最多只取四碼,因此助長了重碼字的機會,
嘸蝦米重碼字高居 4 種字形輸入法之冠,主要肇因於此。

倉頡輸入法掌握了漢字「共同的細微字形」(公約數、基因)這項特徵,
比較 4 種字形輸入法的「字根表」時,
各位可以發現「倉頡字根表」裡輔根的筆劃都很少!
筆劃多的大多為倉頡字母(即字根)本身!
而且倉頡字母大多為常見的部首,
字典裡的每個部首大多又對應到不同的倉頡碼,
因此「字首」重碼率變低了,「字身」重碼率又低的話,
全部漢字的倉頡碼重碼率自然就會降低。
加上考慮到「共用」這項特性,所以輔根是最少的,
雖然拆字時要思考到較細微的部分,但卻可以有效降低重碼率的問題。
註:除了這項特徵之外,
  倉頡重碼字相對較少的另一個主因是取碼長度可以取到五碼,
  (行列、大易、嘸蝦米取碼長度最多只取到四碼)
  排列組合數較多,重碼率自然也會較少。
  由最多取五碼的規則可以猜到:
  朱邦復先生當初發明倉頡輸入法時,
  並不是要讓使用者在輸入常見的幾千個漢字時有絕對的便利性,
  (另外,他也沒有發明違反取碼原則一致性的「簡碼」,
  因為那樣做只是討好只有常見字需求的使用者)
  他思考的是如何應付數萬個漢字的輸入、處理、運用…等問題。
  在 Unicode 3.1 加入了近五萬個 CJK Ext A/B 區的漢字之後,
  只要系統字型有支援,要處理罕見漢字的顯示問題變得容易多了,
  事實也證明朱先生當初將倉頡的最大碼長定為五碼是有其道理的,
  因為在不改變輸入模式、不區分輸入模式的情況下,
  倉頡輸入法仍舊能輕易應付全部 Unicode 3.1 的 70,195 個漢字,
  而且重碼率依然比行列、大易、嘸蝦米低。
  目前,能完整支援這七萬多個漢字的輸入法都是倉頡系列的,而且都是免費的!
  這是倉頡族最大的福利!
  (蝦米族網站上,在 2009 年 4 月發表的加字加詞檔短缺七百多字;
  香草輸入法內建的行列短缺近一萬字;
  大易系列方面,有支援 CJK Ext A/B 區漢字的作品並不常見;
  所以「泰瑞系列中文輸入法對照表」並沒有整理出行列、大易的對照表,
  因為要補一萬多個行列碼、近五萬個大易碼,並不是一件容易的事!)

下一篇我將接續比較倉頡輸入法和嘸蝦米輸入法的優缺點,
日後有機會再拿倉頡輸入法與行列輸入法、大易輸入法做進一步的比較。
針對「容易背誦」、「重碼率低」、「使用一種模式可輸入 70,195 個漢字」這三點而言,
倉頡輸入法是四種字形輸入法裡最具優勢的!
(儘管有人覺得它的取碼原則較難理解、最大取碼長度也較長,
但它仍然有其他方面的優勢,請繼續看下一篇的講述)。

創作者介紹

泰瑞的世界

terryhung 發表在 痞客邦 PIXNET 留言(0) 人氣()