廣告贊助

以下針對 Big5、CJK、CJK Ext-A/B/C/D/E 字元集作成簡單的整理,
有幾點先說明如下:
一、Big5 碼普遍被認為包含 13,053 個字(5,401 個常用字 + 7,652 個次常用字),
  但計入「兙、兛、兞、兝、兡、兣、嗧、瓩、糎」9 個度量衡單位用字(Big5 十進位碼由 41561 至 41569),
  及「碁、銹、裏、墻、恒、粧、嫺」 7 個倚天造字區的漢字(Big5 十進位碼由 63958 至 63964),
  加上「卄」這 1 個被 Big5 編入符號區的漢字(Big5 十進位碼為 41677),
  再減去重複收錄 2 次的「兀」(42081)、「兀」(51530)及「嗀」(56529)、「嗀」(56828) 後(後者不算),
  應為 13,068 個字(13,053+9+7+1-2=13,068),
  這 13,068 個字被編入 CJK 字元集(Unicode 十進位碼由 19968 至 40869 此一範圍)。
二、Big5 碼主要分為 2 個部分:
  常用漢字區:Big5 十進位碼(有部分碼位被保留)由 42048(一) 至 50814(籲),共 5,401 個字。
  次常用漢字區:Big5 十進位碼(有部分碼位被保留)由 51520(乂) 至 63957(龘),共 7,652 個字。
三、Big5 各區排序方式皆為先按筆劃排序,同筆劃再按部首排序。
  Unicode 各區排序方式則為先按部首排序,同部首再按筆劃排序。
四、CJK 應再包含 12 個位於「相容表意文字區」中但實則獨一的漢字,它們分別是:
  U+FA0E(﨎)、U+FA0F(﨏)、U+FA11(﨑)、U+FA13(﨓)、
  U+FA14(﨔)、U+FA1F(﨟)、U+FA21(﨡)、U+FA23(﨣)、
  U+FA24(﨤)、U+FA27(﨧)、U+FA28(﨨)、U+FA29(﨩),
  這 12 個字並不在 4E00 - 9FA5(Unicode 十進位碼由 19968 至 40869 此一範圍)的碼位,
  所以常常被忽略(微軟倉頡無法打出這些字,泰瑞倉頡已補上這些字的字根)。
  這 12 個字被放到兼容區並不是因為和其他字同形或為異體,
  而是因為它們只收錄在廠商用字中,但未收錄在官方標準(C-, T-, J-, K-Source)中。
  他們有獨立的形、音、義,即「獨一」(Unique),參見:Unicode 5.0,第 412 頁

三、Big5 和 Unicode 的字元集合,表列如下:

字集

Big5 CJK CJK Ext-A CJK Ext-B CJK Ext-C CJK Ext-D CJK Ext-E
發表時間 1984 1993 2000 2001 2009 2010 2015
收納漢字字數 13,060 20,902 6,582 42,711 4,149 222 5,762
Unicode
版本
- 1.0 3.0 3.1 5.2 6.0 8.0
Unicode
累積字數
- 20,902 27,484 70,195 74,344 74,566 80,328
Unicode
平面
- 基本多文種平面
(BMP)
基本多文種平面
(BMP)
第二輔助平面
(SIP)
第二輔助平面
(SIP)
第二輔助平面
(SIP)
第二輔助平面
(SIP)
Unicode
字碼位置
(十六進位)
- 4E00~
9FA5
3400~
4DB5
20000~
2A6D6
2A700~
2B734
2B740~
2B81D
2B820~
2CEA1
Unicode
字碼位置
(十進位)
- 19968~
40869
13312~
19893
131072~
173782
173824~
177972
177984~
178205
178208~
183969
每個字元
佔用長度
2位元組 2位元組 2位元組 4位元組 4位元組 4位元組 4位元組
Windows
新細明體
版本需求
任何版本 3.21
及其以後版本
5.03
及其以後版本
新細明體-ExtB
1.05 及其以後
新細明體-ExtB
7.01 及其以後
新細明體-ExtB
7.01 及其以後
(尚未支援)

四、Windows 預設的新細明體版本,表列和說明如下:

作業系統版本 字型名稱 檔案大小 版本
Windows 95 細明體 6171 KB 15 May, 1966: 2.00, second release
Windows NT 4.0 細明體 6171 KB 15 May, 1966: 2.00, second release
Windows 98 細明體 6902 KB Version 2.10
Windows 2000 細明體 8617 KB Version 3.21
Windows ME 細明體 8436 KB Version 3.00
Windows XP 細明體 8617 KB Version 3.21
Windows 2003 細明體 8623 KB Version 3.21
Windows Vista 細明體 26.2 MB Version 6.02
細明體-ExtB 32.2 MB Version 5.00
Windows 7 細明體 30.7 MB Version 7.00
細明體-ExtB 32.2 MB Version 7.00
Windows 8/8.1 細明體 26.2 MB Version 7.01
細明體-ExtB 35.0 MB Version 7.01
Windows 10 細明體 26.1 MB Version 7.02
細明體-ExtB 35.0 MB Version 7.01
新細明體更新套件 細明體 22.8 MB Version 5.03
細明體-ExtB 30.8 MB Version 1.05

不能顯示 CJK-ExtA 的細明體,有人稱為「舊版細明體」
(指 3.21 及其以前版本的新細明體及細明體),它們不符合教育部公佈的國字標準字體。
可以顯示 CJK-ExtA 的細明體,則被稱為「新版細明體」
(指 5.03 及其以後版本的新細明體及細明體),它們符合教育部公佈的國字標準字體。

27484
創作者介紹

泰瑞的世界

terryhung 發表在 痞客邦 PIXNET 留言(0) 人氣()