無論你是撰寫研究論文的學生,還是爬格子的文字工作者,應該都脫離不了終日與電腦為伍的日子。如果你正巧也是 Mac 使用者,這篇文章應可讓你瞭解 OS X 系統在處理漢字方面的能耐。

蘋果7/20推出Mac迷們眾所期盼的新一代作業系統OS X 10.7 (Lion) 之後,筆者第一時間也自 Mac App Store 下載了Lion;筆者身為文字工作者,對於各家系統支援中文的友善程度,自是比一般使用者來得注重。可惜根據筆者先前的測試結果中發現,蘋果前一代作業系統OS X 10.6 (Snow Leopard) 系統中文字型「黑體-繁」及其他內建的中日韓漢字字型缺字嚴重,對於漢字的支援程度並不算好(請參考筆者的部落格文章),新版Lion作業系統對於漢字的支援程度究竟有無改進,同樣是筆者關心的議題,於是便再度為OS X 10.7來一次大體檢。

接下來,就由筆者為大家揭露測試的過程與結果吧。

▲Mac OS X 10.6 (Snow Leopard) 系統中文字型缺字嚴重

中日韓統一表意文字

Unicode業已成為當今主流作業系統(如Windows、OS X及Linux等)處理古今中外各種文字所使用的內碼。其中在正體/簡體中文、日文及韓文漢字的處理方面,是透過Unicode組織定義的「中日韓統一表意文字」(CJK Unified Ideographs) 作為各方遵循的漢字統一內碼。

Unicode隨著時間演進,目前最新的版本為6.0版。其中的「中日韓統一表意文字」定義的中日韓漢字內碼範圍,亦從最初版的20,902字,進化到6.0版的75,616字。在本文接下來的部分,筆者將以中日韓統一表意文字 (CJK Unified Ideographs),來測試 OS X 10.7 (Lion) 對Unicode漢字的支援程度。中日韓統一表意文字的字碼範圍如下:

▼Unicode 中日韓統一表意文字的Unicode版本及字碼範圍

Unicode版本 內碼範圍 字數 說明
1.0 U+4E00~U+9FA5
U+F900~U+FA2D
20,902
302
中日韓統一表意文字(初版)
中日韓相容表意文字
3.0 U+3400~U+4DB5 6,582 延伸A區 (Ext-A)
3.1 U+20000~U+2A6D6
U+2F800~U+2FA1D
42,711
542
延伸B區 (Ext-B)
中日韓相容表意文字補充
3.2 U+FA30~U+FA6D 62  
4.1 U+9FA6~U+9FBB
U+FA70~U+FAD9
22
106
 
5.1 U+9FBC~U+9FC3 8  
5.2 U+2A700~U+2B734
U+9FC4~U+9FCB
4,149
8
延伸C區 (Ext-C)
6.0 U+2B740~U+2B81D 222 延伸D區 (Ext-D)
  合計 75,616  

使用「字元檢視器」

OS X 10.7 (Lion) 的「字元檢視器」提供了實用的Unicode內碼表,請於「系統偏好設定」中點選「輸入來源」標籤,將「鍵盤與字元檢視器」項目打勾:

▲勾選「鍵盤與字元檢視器」

接下來,你便可在輸入法選單中選擇「顯示字元檢視器」:

▲顯示字元檢視器

在此之後,你即可逐一檢視OS X 10.7 (Lion) 支援的各種字碼範圍了。

驗收成果

OS X 10.7 (Lion) 對於漢字的支援情形如何,由接下來的螢幕擷圖便知一二:

中日韓統一表意文字U+4E00~U+9FA5:支援。

▲OS X 10.7 (Lion) 支援U+4E00~U+9FA5範圍

中日韓相容表意文字U+F900~U+FA2D:支援。

▲OS X 10.7 (Lion) 支援中日韓相容表意文字

Unicode 3.0

中日韓統一表意文字延伸A區 (Ext-A) U+3400~U+4DB5:支援。

▲OS X 10.7 (Lion) 支援中日韓統一表意文字延伸A區

(後面還有關於Unicode 3.1等版本的漢字支援程度)

Unicode 3.1

中日韓統一表意字元延伸B區 (Ext-B) U+20000~U+2A6D6:僅部分支援,缺字情形如同前一版系統OS X 10.6 (Snow Leopard) 一樣嚴重。

▲OS X 10.7 (Lion) 在中日韓統一表意文字延伸B區缺字嚴重

中日韓相容表意文字補充U+2F800~U+2FA1D:這一區同樣是Unicode 3.1所字義的字碼範圍,和中日韓統一表意字元延伸B區的測試結果相同,蘋果僅部分支援此區域:

▲OS X 10.7 (Lion)在中日韓相容表意文字補充區域,也是缺字連連

Unicode 3.2

中日韓相容表意文字U+FA30~U+FA6D:支援。

▲OS X 10.7 (Lion)支援U+FA30~U+FA6D範圍

Unicode 4.1

雖然OS X 10.7完全支援Unicode 4.1的U+9FA6~U+9FBB範圍,但是對於U+FA70~U+FAD9這範圍,顯然並非這一回事:

▲OS X 10.7支援Unicode 4.1的U+9FA6~U+9FBB範圍

 

▲Unicode 4.1的U+FA70~U+FAD9範圍完全無字

Unicode 5.1

U+9FBC~U+9FC3:這個區域緊接著Unicode 4.1的U+9FA6~U+9FBB區塊。從上面的圖可知,蘋果有支援到這個部分。

Unicode 5.2

中日韓統一表意文字延伸C區U+2A700~U+2B734:蘋果顯然忘了將這一塊列入支援:

▲OS X 10.7 (Lion) 在中日韓統一表意文字延伸C區完全無字

U+9FC4~U+9FCB:這個區域中只有U+9FC4及U+9FC6這2個字有支援(請參考Unicode 4.1區域的螢幕畫面。

Unicode 6.0

中日韓統一表意文字延伸延伸D區U+2B740~U+2B81D:如果你認為和中日韓統一表意文字延伸C區一樣(完全無字),那你就猜錯了;出乎意料地,蘋果在這一區域有部分支援。

▲OS X 10.7 (Lion) 僅部分支援中日韓統一表意文字擴充D區

事實真相以及解決方式

打開OS X「應用程式」中的「字體簿」,原來預設的系統字型「黑體-繁」僅支援52,263字,難怪缺字一大堆:

▲OS X 10.7 (Lion) 內定的系統字「黑體-繁」僅支援52,263字

解決OS X 10.7缺字問題的方法也很簡單:只需在「字體簿」中安裝支援完整中日韓漢字的字型即可。筆者建議你安裝日本花園大學製作的「花園明朝」免費字型 (HanaMin),其下載網址(最新版本發行日期為2011年5月16日)為http://fonts.jp/hanazono/hanazono-20110516.zip。花園明朝字型的官網(日英雙語)是http://fonts.jp/hanazono/

把花園明朝字型安裝入OS X之後,你將有2套字型可以使用:

  • HanaMinA:包括非漢字及漢字(中日韓統一表意文字及延伸A區、相容表意文字等)共31,608字。
  • HanaMinB:包括中日韓統一表意文字延伸B區、延伸C區及延伸D區,共47,086字。

當你重新打開「字體簿」檢視原先系統缺字的漢字字碼區域時,你將發現不再有缺碼的遺憾了。

▲HanaMinA 的字型資訊

▲安裝HanaMinB 字型之後,便可完全支援Ext-B、Ext-C及Ext-D漢字