以下針對 Big5、CJK、CJK Ext-A/B/C/D/E 字元集作成簡單的整理,
有幾點先說明如下:
一、Big5 碼普遍被認為包含 13,053 個字(5,401 個常用字 + 7,652 個次常用字),
但計入「兙、兛、兞、兝、兡、兣、嗧、瓩、糎」9 個度量衡單位用字(Big5 十進位碼由 41561 至 41569),
及「碁、銹、裏、墻、恒、粧、嫺」 7 個倚天造字區的漢字(Big5 十進位碼由 63958 至 63964),
加上「卄」這 1 個被 Big5 編入符號區的漢字(Big5 十進位碼為 41677),
再減去重複收錄 2 次的「兀」(42081)、「兀」(51530)及「嗀」(56529)、「嗀」(56828) 後(後者不算),
應為 13,068 個字(13,053+9+7+1-2=13,068),
這 13,068 個字被編入 CJK 字元集(Unicode 十進位碼由 19968 至 40869 此一範圍)。
二、Big5 碼主要分為 2 個部分:
常用漢字區:Big5 十進位碼(有部分碼位被保留)由 42048(一) 至 50814(籲),共 5,401 個字。
次常用漢字區:Big5 十進位碼(有部分碼位被保留)由 51520(乂) 至 63957(龘),共 7,652 個字。
三、Big5 各區排序方式皆為先按筆劃排序,同筆劃再按部首排序。
Unicode 各區排序方式則為先按部首排序,同部首再按筆劃排序。
四、CJK 應再包含 12 個位於「相容表意文字區」中但實則獨一的漢字,它們分別是:
U+FA0E(﨎)、U+FA0F(﨏)、U+FA11(﨑)、U+FA13(﨓)、
U+FA14(﨔)、U+FA1F(﨟)、U+FA21(﨡)、U+FA23(﨣)、
U+FA24(﨤)、U+FA27(﨧)、U+FA28(﨨)、U+FA29(﨩),
這 12 個字並不在 4E00 - 9FA5(Unicode 十進位碼由 19968 至 40869 此一範圍)的碼位,
所以常常被忽略(微軟倉頡無法打出這些字,泰瑞倉頡已補上這些字的字根)。
這 12 個字被放到兼容區並不是因為和其他字同形或為異體,
而是因為它們只收錄在廠商用字中,但未收錄在官方標準(C-, T-, J-, K-Source)中。
他們有獨立的形、音、義,即「獨一」(Unique),參見:Unicode 5.0,第 412 頁。
三、Big5 和 Unicode 的字元集合,表列如下:
字集 |
Big5 | CJK | CJK Ext-A | CJK Ext-B | CJK Ext-C | CJK Ext-D | CJK Ext-E |
發表時間 | 1984 | 1993 | 2000 | 2001 | 2009 | 2010 | 2015 |
收納漢字字數 | 13,060 | 20,902 | 6,582 | 42,711 | 4,149 | 222 | 5,762 |
Unicode 版本 |
- | 1.0 | 3.0 | 3.1 | 5.2 | 6.0 | 8.0 |
Unicode 累積字數 |
- | 20,902 | 27,484 | 70,195 | 74,344 | 74,566 | 80,328 |
Unicode 平面 |
- | 基本多文種平面 (BMP) |
基本多文種平面 (BMP) |
第二輔助平面 (SIP) |
第二輔助平面 (SIP) |
第二輔助平面 (SIP) |
第二輔助平面 (SIP) |
Unicode 字碼位置 (十六進位) |
- | 4E00~ 9FA5 |
3400~ 4DB5 |
20000~ 2A6D6 |
2A700~ 2B734 |
2B740~ 2B81D |
2B820~ 2CEA1 |
Unicode 字碼位置 (十進位) |
- | 19968~ 40869 |
13312~ 19893 |
131072~ 173782 |
173824~ 177972 |
177984~ 178205 |
178208~ 183969 |
每個字元 佔用長度 |
2位元組 | 2位元組 | 2位元組 | 4位元組 | 4位元組 | 4位元組 | 4位元組 |
Windows 新細明體 版本需求 |
任何版本 | 3.21 及其以後版本 |
5.03 及其以後版本 |
新細明體-ExtB 1.05 及其以後 |
新細明體-ExtB 7.01 及其以後 |
新細明體-ExtB 7.01 及其以後 |
(尚未支援) |
四、Windows 預設的新細明體版本,表列和說明如下:
作業系統版本 | 字型名稱 | 檔案大小 | 版本 |
Windows 95 | 細明體 | 6171 KB | 15 May, 1966: 2.00, second release |
Windows NT 4.0 | 細明體 | 6171 KB | 15 May, 1966: 2.00, second release |
Windows 98 | 細明體 | 6902 KB | Version 2.10 |
Windows 2000 | 細明體 | 8617 KB | Version 3.21 |
Windows ME | 細明體 | 8436 KB | Version 3.00 |
Windows XP | 細明體 | 8617 KB | Version 3.21 |
Windows 2003 | 細明體 | 8623 KB | Version 3.21 |
Windows Vista | 細明體 | 26.2 MB | Version 6.02 |
細明體-ExtB | 32.2 MB | Version 5.00 | |
Windows 7 | 細明體 | 30.7 MB | Version 7.00 |
細明體-ExtB | 32.2 MB | Version 7.00 | |
Windows 8/8.1 | 細明體 | 26.2 MB | Version 7.01 |
細明體-ExtB | 35.0 MB | Version 7.01 | |
Windows 10 | 細明體 | 26.1 MB | Version 7.02 |
細明體-ExtB | 35.0 MB | Version 7.01 | |
新細明體更新套件 | 細明體 | 22.8 MB | Version 5.03 |
細明體-ExtB | 30.8 MB | Version 1.05 |
不能顯示 CJK-ExtA 的細明體,有人稱為「舊版細明體」
(指 3.21 及其以前版本的新細明體及細明體),它們不符合教育部公佈的國字標準字體。
可以顯示 CJK-ExtA 的細明體,則被稱為「新版細明體」
(指 5.03 及其以後版本的新細明體及細明體),它們符合教育部公佈的國字標準字體。