Selected Category: 電腦─輸入法 (47)

View Mode: Post List Post Summary

Windows 8.1 預覽版已經在2013年6月發布了!
任何人都可以從 Microsoft 的官方網站下載到光碟映像檔,
下載網址是:http://windows.microsoft.com/zh-tw/windows-8/preview-iso
微軟提供的產品金鑰是:NTTX3-RV7VB-T7X7F-WQYYY-9Y92F

為了測試小小輸入法在 Windows 8.1 傳統桌面及 Metro UI 環境下的相容性,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

一年前,我使用 Google 搜尋「大易 cin」、「大易 碼表」…
都找不到完整支援 CJK 字元集的大易輸入法對照表。
期間曾經找到 App Shopper 網站有販售「大易輸入法字典」,
它支援繁體、簡體、香港字及標點符號,
雖然以不到新台幣 100 元的價格就能取得,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

第一階段:檢查是否有設定範圍內的漏字

我們設定的字元集範圍是 CJK、CJK Ext-A、CJK Ext-B 合計的 70,195 個字,
那麼最終版的對照表裡應該要能找出這 70,195 個不同的字,
否則就是有漏字的問題。

Posted by terryhung at 痞客邦 PIXNET 留言(1) 引用(0) 人氣()

無論是使用 gcin、Yahoo! 奇摩輸入法、小小輸入法平台搭配對照表,
或是使用「通用輸入法編輯工具」將對照表轉成輸入法程式,
對照表的排序方式將會影響候選字的排列順序。
一般而言,遇到重碼而必須選字時,候選字的排列順序最好是:
1.先排 CJK 字元集的熱門字,使用頻率較高的排在較前面。

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

一、第一階段:產生「字面-編碼 V.S. 字元」的表格

全字庫屬性檔(倉頡、注音、拼音、筆劃…)全為純文字檔,
雖然具有 CSV 格式的特性,
(差別在於 CSV 有標題列,並以逗點分隔;

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

一、瞭解整理目的:

我們整理的目的是利用全字庫屬性(碼表)製成「組字字根 字元」格式的對照表。
全字庫屬性的電子檔,可透過公司、組織或個人名義向全字庫授權小組提出申請,
申請方式請參閱:http://www.cns11643.gov.tw/AIDB/cns_authorization_apply.do

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

自從 Windows NT 4.0 支援 Unicode 編碼,
而其內建的新細明體字型又支援 Unicode 1.0 收錄的 CJK 字元集以來,
繁體中文版 Windows 內建的輸入法基本上都能支援這 20,902 個漢字,
雖然輸入法編碼錯誤、漏字在所難免,
但至少朝著逐步脫離 Big5 字元集而往擁抱大字元集的方向邁去!

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

測試目的:瞭解行易嘸蝦米輸入法「繁體中文模式」對 CJK 字元集的支援程度

測試環境:行易有限公司嘸蝦米輸入法 7.0 版

測試工具:蝦米族樂園網站「查碼程式」

測試結果1:
以下這 2461 個字在行易嘸蝦米輸入法 7.0 版的「無半」模式下是打不出來的,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

從 Windows 95 以來,微軟就賦予視窗作業系統內建的注音輸入法有這樣的功能:
組字時,不一定要先打聲母(ㄅㄆㄇㄈ…ㄗㄘㄙ),
先打韻母(ㄧㄨㄩㄚ…ㄤㄥㄦ)也可以!

好比說要打「設」字,依照「ㄕㄜˋ」的順序打;或依照「ㄜㄕˋ」的順序打都是通的!
這個功能在新注音輸入法上也行得通!

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

測試目的:瞭解微軟注音輸入法對 CJK 字元集的支援程度
測試環境:Windows XP Professional with Service Pack 3 繁體中文版
(沒有安裝 Office,所以它只包含傳統注音和新注音 2002)
測試工具:ImeLib
測試結果:以下這 678 個字沒有被微軟注音輸入法支援

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

前陣子,我在整理倉頡、注音、嘸蝦米的輸入法對照表(碼表)時,
就曾經想過要再整理大易、行列的對照表,
讓這些源自台灣、歷史悠久的輸入法都能支援 Unicode 3.1 收錄的 70,195 個漢字。
當時以 Google 搜尋過「大易 cin」、「行列 cin」,
得到的大易對照表幾乎都只支援一萬多字,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

Unicode 3.1 的 70,195 個漢字裡,
共用「zkkfi」這個行列碼的漢字高達 17 個,
是重碼字最嚴重的例子!
這 17 個字是:
麯、䴵、䴶、䴸、䴽、𡙹、𢩟、𪌃、𪌉、𪌚、𪌰、𪌸、𪌻、𪍈、𪍎、𪍪、𪍵

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

輸入法對照表或軟體是屬於「著作」,
而輸入方法則是屬於「專利」。
在行易公司已經喪失嘸蝦米輸入方法的專利權後,
行易公司的著作和別人的著作可以用這樣例子來看待:
兩個不同的人用相同的思維撰寫出來的對照表,

Posted by terryhung at 痞客邦 PIXNET 留言(1) 引用(0) 人氣()

整理好「泰瑞注音輸入法對照表」之後,
我們當然可以將它轉換成拼音輸入法的對照表,
但是如果沒有好的工具程式來輔助的話,
注音轉拼音其實不是件容易的事!

先將「泰瑞注音輸入法對照表」裡的「1」取代成「ㄅ」…「g」取代成「ㄕ」…「-」取代成「ㄦ」…

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

我多次使用「txt2uni.exe」這支程式將對照表轉成參考檔的經驗裡,
發現這支程式有個限制:
「原始對照表的行數不能超過 32,000 行
(可能可以再超過一些,但絕不能超過 33,000 行)」。
CJK 字元有 20,902 個漢字,符號又佔 1,580 個字元;

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

近來,我發現在我所發表的中文輸入法文章當中,有些名詞用得不大妥當,
所以利用這篇文章來解釋或定義一些名詞,
雖然別人用這些名詞來表達的概念,可能和我解釋的意義不盡相同,
但為方便讀者有更精確的認知,
因此在我發表的中文輸入法文章裡,我會統一使用本篇文章所定義的名詞。

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

隨著嘸蝦米輸入法的專利權在 2003 年 11 月 11 日消滅後,
自行製作出嘸蝦米輸入法的對照表或軟體來供大眾使用(不管免費或收費)
已經不會有法律上的問題了!
不過,這裡有個前提:
不可擅自拿有著作權保護的作品(例如:行易公司出的參考檔)來修改,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

本文要製作給「偽‧蝦米」使用的「參考檔」(以下簡稱「偽參考檔」)
並不是由行易有限公司發行的參考檔(以下簡稱「行易參考檔」)!

有鑑於上一篇所採用的「偽參考檔」和「加字加詞檔」有太多的缺點,
所以我建議各位重新製作新的「偽參考檔」和「加字加詞檔」。

製作方向說明如下:

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

本文要製作給「偽‧蝦米」使用的「參考檔」(以下簡稱「偽參考檔」)
並不是由行易有限公司發行的參考檔(以下簡稱「行易參考檔」)!

這個「偽參考檔」在轉換前只是一個純文字檔,
而且內容只有一行字──「0000 ○」。
說穿了!這個「偽參考檔」只是用來騙過「偽‧蝦米」的主程式──「XLiu.exe」

Posted by terryhung at 痞客邦 PIXNET 留言(1) 引用(0) 人氣()

Yahoo! 奇摩輸入法的符號表功能在 MSN 8.5.1302.1018 似乎不能用!
(此處的 MSN 是指 Windows Live Messenger,
我用的是執行過 Patch 檔來移除廣告、實現多重登入的版本)
可能在 9.0 版也有同樣的問題!
雖然可以打開符號表,但按了符號後,無法上字

Posted by terryhung at 痞客邦 PIXNET 留言(1) 引用(0) 人氣()

有些人推崇嘸蝦米輸入法和劉重次先生的理由讓我感到疑惑,
或許是他們太客氣,也或許是他們不知道事實真相,
就像這一篇網路文章中的一段話,搞得我霧煞煞!
引述如下:

Posted by terryhung at 痞客邦 PIXNET 留言(1) 引用(0) 人氣()

其實我寫前三篇文章的背後動機是為了研究一個課題──
「發布嘸蝦米輸入法對照表是否會構成侵權行為?」
這個課題的答案是:應該不會!

對我這樣一個長期使用倉頡輸入法的人來說,
嘸蝦米使用者的權益根本就不關我的事,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

昨天我用 Google 查詢嘸蝦米專利權的小道消息時,
發現了一篇部落格的文章
從這篇文章中可以得知行易公司的一些想法和走向。
我覺得其中最有趣的一段話是行易公司負責人的回答
(行易公司目前的負責人為劉重次先生的兒子─劉晁亨先生):

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

有關「中文輸入法程式是否受著作權法保護」這個議題,
我們可以參考「章忠信的著作權筆記」的這兩篇文章:
1.標題:電腦的中文輸入法程式是否受著作權法保護?
 網址:http://www.copyrightnote.org/crnote/bbs.php?board=3&act=read&id=303
2.標題:專利期間已屆滿之中文輸入法能以著作權保護字碼表嗎?

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

一般常見的嘸蝦米輸入法軟體為行易有限公司發行的商業軟體,
商業軟體是指使用者必須付費購買授權,才能合法的使用。
這套輸入法軟體除了使用介面外,最重要的是「參考檔」,
這些「參考檔」通常在安裝時被複製到「C:\Windows\System32」,
檔名是「liu-uni*.tab」(其中的「*」可能是「2」、「3」、「4」或沒有任何字元),

Posted by terryhung at 痞客邦 PIXNET 留言(1) 引用(0) 人氣()

從前三篇文章的分析,我們可以瞭解到:
由字形結構來輸入漢字的輸入法,
肯定會比用注音、拼音來輸入漢字的輸入法來得有效率
(雖然新注音有智慧選字的功能,
但命中率不會比倉頡、嘸蝦米、大易、行列來得高)。

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

Unicode 3.1 的 70,195 個漢字(再外加一些 CJK 相容字區的漢字)裡,
共用「yneu」這個嘸蝦米碼的漢字高達 45 個,
是重碼字最嚴重的例子!

這是用 Excel 的「=COUNTIF()」函數跑出來,再去篩選的。
因為 Excel 跑大量資料的「=COUNTIF()」函數和篩選會跑得非常慢,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

Unicode 3.1 的 70,195 個漢字(再外加一些 CJK 相容字區的漢字)裡,
共用「nnmrb」(弓弓一口月)這個倉頡碼的漢字高達 32 個,
是重碼字最嚴重的例子!

這是用 Excel 的「=COUNTIF()」函數跑出來,再去篩選的。
因為 Excel 跑大量資料的「=COUNTIF()」函數和篩選會跑得非常慢,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

用 Excel 的「=COUNTIF()」函數來分析「泰瑞注音輸入法對照表」
中的「THPho.txt」裡的漢字部分,將可發現:
有 135個組字字根不須選字,可直接出字
有 62 個組字字根必須從 2 個候選字中選字
有 43 個組字字根必須從 3 個候選字中選字

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

前陣子,我看過一篇網路論壇的回應文章裡有提到:
「可以將嘸蝦米輸入法對照表匯入 Yahoo! 奇摩輸入法」,
雖然文章裡並沒有教學和詳細說明,
但引起我想下載 Yahoo! 奇摩輸入法來試一試的興趣。

我試用後,衡量了利弊得失,

Posted by terryhung at 痞客邦 PIXNET 留言(1) 引用(0) 人氣()

我打造的「泰瑞倉頡輸入法」結合了以下三個輸入法的優點:
1.「亂倉打鳥輸入法」在符號支援上的優點
2.「倉頡之友 。馬來西亞─第五代倉頡輸入法」在支援字元集上的優點
2.「中標倉頡輸入法」在支援字元集上的優點
不僅可以輕鬆輸入符號,還可兼容第三代和第五代倉頡拆碼原則,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

下表列出《支援 CJK Ext-B 字元的「泰瑞注音輸入法對照表」(製作過程篇)
一文中所提到的原始檔案(也就是「全字庫注音輸入法參考檔」)在
比較 CJK、CJK Ext-A、CJK Ext-B 的所有漢字後發現的 299 個缺字,
以及我為這些字所補上的注音(組字字根)。

您可以使用蝦米族樂園的「嘸蝦米查碼程式」來查詢這些字的讀音,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

一、使用工具:
(一)字型:
   系統字型必須支援 CJK、CJK Extension A、CJK Extension B 的字元,
   在 Windows XP/Server 2003 中可安裝「新細明體更新套件」,
   在 Windows Vista/Server 2008(或以後版本的 Windows)則不需安裝字型。

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

「輸入法對照表」有很大的妙用!
有了「組字字根 V.S. 詞組」這樣格式的檔案,
就可以用「通用輸入法編輯工具」來産生想要的輸入法軟體,
想改良注音、倉頡、行列、大易、嘸蝦米的輸入法軟體也就沒那麼困難了!
(行列和大易用到「/」按鍵時可能會比較麻煩)

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

目前泰瑞系列「中文輸入法對照表」已整理出倉頡、嘸蝦米、注音、拼音(漢語)四種輸入法的對照表,
這些對照表有下列特色:

一、優點
 1.支援 Unicode 3.1(CJK、CJK Ext-A、CJK Ext-B)的 70,195 個漢字,沒有一個字被遺漏。
 2.倉頡輸入法對照表、注音輸入法對照表都支援更方便的符號輸入方式。

Posted by terryhung at 痞客邦 PIXNET 留言(1) 引用(0) 人氣()

首先聲明一下:
朱邦復先生在發明倉頡輸入法時就已經想到
「字形」、「字音」、「字義」、「字碼」、「字序」、「字辨」這六大問題了!
依照他的理念,一字只能有一碼(倉頡碼,也就是組字字根),
唯有一字一碼才能實現他的理想境界(一套完整的倉頡系統),

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

「泰瑞倉頡輸入法」與「泰瑞注音輸入法」的符號是共通的,
但因為「泰瑞注音輸入法」最大組字字根為 4 碼,所以將第 5 碼直接刪除;
唯一例外的有兩個:
1. yyyaa-yyyyo:將前 3 碼的「yyy」,縮減為「yy」。
2. table:改為「tab」。

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

「THCJC.txt」這個對照表是依照
支援 CJK Ext-B 字元的「泰瑞倉頡輸入法對照表」(正式製作篇)
該篇文章所述的程序及後記的說明而產生的純文字檔。

它保留「倉頡之友 。馬來西亞」(及補完檔)的第五代倉頡字根及 CNS 全字庫的第三代倉頡字根,
但為增加容錯的能力及提高輸入的速度,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

◎下載網址:
 http://terryhung.net23.net/Software/IME/THCJ5.zip

◎官方網址:
 http://terryhung.pixnet.net/blog

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

有了「初次試作篇」的製作經驗後,
我對輸入法對照表的蒐集、整理,也有了更深刻的領悟,
因此,我想整理出一系列像樣一點的「中文輸入法對照表」,
並希望能對各位有所幫助!

本文將介紹我製作「泰瑞倉頡輸入法對照表」的過程,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

雖然「亂倉打鳥」輸入法對符號的支援已經達到令我滿意的程度,
但它的懶人詞庫說穿了對我一點用處也沒有!
藉由編輯它的對照表的過程,
我發現它其實並沒有支援 CJK 擴展 B 區的字元,
(擴展 A 區的可能也沒有支援;以下為方便解說,姑且把這些字稱作「罕見字」)

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

「亂倉打鳥」輸入法的官方網址是:
http://cle.linux.org.tw/trac/wiki/NewCJ3Cin
官方網站上有提供 for Windows、Linux、Mac OS X 的檔案,
本文講述則以 Windows 環境為主。

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

有感於用 Windows 內建的倉頡輸入法軟體來輸入符號還是不太方便,
(因為只能用下列三個方式來輸入符號:
①呼叫「螢幕小鍵盤」;
②死背像「ZXAL=…」這種拆碼方式;
③使用 Vista 倉頡或 Office 新倉頡的「輸入法整合器」)

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

◎ 緣起:
Windows 7/Vista/Server 2008 內建的中文輸入法,
改良了倉頡、速成、注音三種輸入法,
除了使其具備「輸入法整合器」(可支援符號及手寫輸入)之外,
還支援 CNS11643 的組字字根,可用來輸入 CJK、CJK Ext-A/B 區字元集的漢字。

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

昨天我詢問一位經常使用「←」這個符號的網友,
請教她平常打出「←」是採用什麼方式,
她回答是用「Alt+41462」!
(必須在「英數模式」下,同樣也必須搭配鍵盤右方的九宮格數字鍵)

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

本篇文章將比較一下嘸蝦米輸入法和倉頡輸入法。
為便於解說,以下將使用兩個專有名詞:
「倉頡族」:使用倉頡輸入法的人,但不限於使用哪一套倉頡輸入法軟體。
「蝦米族」:使用嘸蝦米輸入法的人,但不限於使用哪一套嘸蝦米輸入法軟體。
還有,為了讓您更清楚的瞭解我所要表達的內容,

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

就目前最常見的中文輸入法而言,
使用人數最多的應該是「泛注音輸入法」,
所謂「泛注音輸入法」包括注音輸入法、新注音輸入法、自然輸入法……等,

因為中華民國的國語教育是以注音符號為教學基礎,
所以受過國語教育的人不需要學習別的技能就自然會使用「泛注音輸入法」。

Posted by terryhung at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()