事先聲明:
本文據以評判用字正確與否的標準是所用字詞是否符合中華民國教育部「國語辭典」、「筆順網」(字形)的規定。
雖然教育部的規範受到不少批評,但是如果沒有一套統一的標準,筆者評判時將無所依歸。


使用支援大字集的輸入法有個缺點就是難免會輸入錯誤,而且有些人打錯字了還不知道!
這個字集不需要很大,Unicode CJK 字元集(收錄 20,902 個漢字)就很大了!
而且它也不一定只會發生在特定的輸入法族群上,注音族、倉頡族、蝦米族…都有可能會犯錯。

筆者經常會看到某些注音族將國字的「一」打成注音符號的「ㄧ」,也曾看過有人將「登場」打成「豋場」。
某些倉頡族則是對於若干漢字的書寫方式有所誤解,以致拆錯編碼、打成「異體字」或錯字。
畢竟我們身處的環境會遇到各式各樣的字型,書籍文件、報章雜誌、電視節目、廣告看板…都有各種字體,
而這些字型的「字形」又不統一,例如:有的草字頭為分開的「十十」,有的則是連在一起的「卄」。
看久了就難免會誤以為錯誤的書寫方式是正確的,再加上 Unicode 又收錄很多有問題的漢字,於是更加造成人們的混淆。
例如:沒没、敘敍、獎奬、致𦤶、刊刋、霸覇…(詳見【因為「字形相似」而造成的常見「錯誤用字」一覽表】一文)
這些正體字與異體字的注音可能都一樣、倉頡碼也類似,因此拆錯字的情況也就很可能會發生。

筆者很喜歡微軟將輸入法候選字以不同顏色標示這一點,如下圖:
WinVista_Input_5.jpg  
圖中黑色字為 CJK 漢字、綠色字為 CJK Ext-A 漢字、紅色字則為 CJK Ext-B 漢字。
可惜的是小小輸入法不支援這樣的分色顯示功能!
但是我們卻可以透過編修碼表的方式來賦予輸入過程有類似的功能,
於是本文的「倉頡字區輸入法碼表」就在這樣的背景下誕生了!

筆者曾在【新版「泰瑞系列中文輸入法對照表」Excel 檔(使用說明篇)】一文談過「將碼表裡的字元分區存放」的概念,
它正好可以和小小輸入法的「調整顯示」功能相結合,
而作出「輸入法候選字」與「字元集代號」相伴隨的效果,同時又不影響正常的打字功能。
小小輸入法的「調整顯示」功能簡單來說,就是在碼表裡輸入這樣的內容:
編碼 $[顯示的字詞]輸出的字詞
假設碼表內容有下列這三行:
hqi $[我(Big5)]我
hqi $[牫(CJK)]牫
hqi $[𥫻(ExtB)]𥫻
打字時,鍵入「hqi」就會出現「1.我(Big5)  2.牫(CJK)  3.𥫻(ExtB)」,
選1或用空白鍵直接讓第1個候選字上屏時,只會打出「」字,而不會打出「我(Big5)」。
在碼表裡採用上述的方法後,打字時就可以順便觀察到各個漢字所屬的分區。

本文的「倉頡字區輸入法碼表」收錄於「特殊碼表系列」壓縮檔的「mbs」目錄下,檔名為「Chajei_Block.txt」。
(因為「調整顯示」是小小輸入法程式的特殊功能,所以筆者就沒有另外製作成 CIN 檔的必要)
下載網址是:http://www.mediafire.com/file/bcaqpbyl1cd3ytr/Special.zip
(警告!使用「調整顯示」功能的碼表,會使得小小輸入法的反查字根【Ctrl+/】功能失靈,請斟酌使用!)
有鑑於使用「調整顯示」功能附加上去的「分區代號」應儘量簡化,以免候選字窗格過於複雜,
因此筆者採用的字元集分區代號如下:
㈠:Big5 碼常用漢字。
㈡:Big5 碼次常用漢字。
㈢:Big5 碼「類符號」漢字。
㈣:CJK 字元集扣除 Big5 碼以外的「外字」。
㈤:CJK 相容表意文字區漢字及符號。
(A):CJK Ext-A 字元集漢字。
(B):CJK Ext-B 字元集漢字。
(C):CJK Ext-C 字元集漢字。
(D):CJK Ext-D 字元集漢字。
(E):CJK Ext-E 字元集漢字(因為大部分字型尚未支援 CJK Ext-E,所以使用者可自行刪除碼表裡的 CJK Ext-E 段落)。
註:Big5 碼的所有漢字都被納入 CJK 字元集當中,
  有關各字元集的基本知識,請參閱【Big5、Unicode 中文字集總整理】一文。

對於使用正體中文的人來說,
編寫一篇一般性的文章大多使用 Big5 常用漢字(代號1),少部分使用 Big5 次常用漢字(代號2)。
因此如果您用這套「倉頡字區輸入法」來打字的話,
打了「odye」後,出現「敍(4)」這樣的候選字提示,就要懷疑您是否有打錯字的可能。
您可以轉換到注音輸入法打「ㄒㄩˋ」,看看排在前面的候選字與您打出的字有何不同;
再不然就是連到教育部的【國語小字典】,利用畫面上的注音符號來組字,
找到正確的字再來做「複製、貼上」的動作,如此即可避免不少錯誤的情況發生。

arrow
arrow
    全站熱搜

    terryhung 發表在 痞客邦 留言(0) 人氣()