無論你是撰寫研究論文的學生,還是爬格子的文字工作者,應該都脫離不了終日與電腦為伍的日子。如果你正巧也是 Mac 使用者,這篇文章應可讓你瞭解 OS X 系統在處理漢字方面的能耐。
蘋果7/20推出Mac迷們眾所期盼的新一代作業系統OS X 10.7 (Lion) 之後,筆者第一時間也自 Mac App Store 下載了Lion;筆者身為文字工作者,對於各家系統支援中文的友善程度,自是比一般使用者來得注重。可惜根據筆者先前的測試結果中發現,蘋果前一代作業系統OS X 10.6 (Snow Leopard) 系統中文字型「黑體-繁」及其他內建的中日韓漢字字型缺字嚴重,對於漢字的支援程度並不算好(請參考筆者的部落格文章),新版Lion作業系統對於漢字的支援程度究竟有無改進,同樣是筆者關心的議題,於是便再度為OS X 10.7來一次大體檢。
接下來,就由筆者為大家揭露測試的過程與結果吧。
▲Mac OS X 10.6 (Snow Leopard) 系統中文字型缺字嚴重
Unicode業已成為當今主流作業系統(如Windows、OS X及Linux等)處理古今中外各種文字所使用的內碼。其中在正體/簡體中文、日文及韓文漢字的處理方面,是透過Unicode組織定義的「中日韓統一表意文字」(CJK Unified Ideographs) 作為各方遵循的漢字統一內碼。
Unicode隨著時間演進,目前最新的版本為6.0版。其中的「中日韓統一表意文字」定義的中日韓漢字內碼範圍,亦從最初版的20,902字,進化到6.0版的75,616字。在本文接下來的部分,筆者將以中日韓統一表意文字 (CJK Unified Ideographs),來測試 OS X 10.7 (Lion) 對Unicode漢字的支援程度。中日韓統一表意文字的字碼範圍如下:
▼Unicode 中日韓統一表意文字的Unicode版本及字碼範圍
Unicode版本 | 內碼範圍 | 字數 | 說明 |
1.0 | U+4E00~U+9FA5 U+F900~U+FA2D |
20,902 302 |
中日韓統一表意文字(初版) 中日韓相容表意文字 |
3.0 | U+3400~U+4DB5 | 6,582 | 延伸A區 (Ext-A) |
3.1 | U+20000~U+2A6D6 U+2F800~U+2FA1D |
42,711 542 |
延伸B區 (Ext-B) 中日韓相容表意文字補充 |
3.2 | U+FA30~U+FA6D | 62 | |
4.1 | U+9FA6~U+9FBB U+FA70~U+FAD9 |
22 106 |
|
5.1 | U+9FBC~U+9FC3 | 8 | |
5.2 | U+2A700~U+2B734 U+9FC4~U+9FCB |
4,149 8 |
延伸C區 (Ext-C) |
6.0 | U+2B740~U+2B81D | 222 | 延伸D區 (Ext-D) |
合計 | 75,616 |
OS X 10.7 (Lion) 的「字元檢視器」提供了實用的Unicode內碼表,請於「系統偏好設定」中點選「輸入來源」標籤,將「鍵盤與字元檢視器」項目打勾:
▲勾選「鍵盤與字元檢視器」
接下來,你便可在輸入法選單中選擇「顯示字元檢視器」:
▲顯示字元檢視器
在此之後,你即可逐一檢視OS X 10.7 (Lion) 支援的各種字碼範圍了。
OS X 10.7 (Lion) 對於漢字的支援情形如何,由接下來的螢幕擷圖便知一二:
中日韓統一表意文字U+4E00~U+9FA5:支援。
▲OS X 10.7 (Lion) 支援U+4E00~U+9FA5範圍
中日韓相容表意文字U+F900~U+FA2D:支援。
▲OS X 10.7 (Lion) 支援中日韓相容表意文字
中日韓統一表意文字延伸A區 (Ext-A) U+3400~U+4DB5:支援。
▲OS X 10.7 (Lion) 支援中日韓統一表意文字延伸A區
(後面還有關於Unicode 3.1等版本的漢字支援程度)
中日韓統一表意字元延伸B區 (Ext-B) U+20000~U+2A6D6:僅部分支援,缺字情形如同前一版系統OS X 10.6 (Snow Leopard) 一樣嚴重。
▲OS X 10.7 (Lion) 在中日韓統一表意文字延伸B區缺字嚴重
中日韓相容表意文字補充U+2F800~U+2FA1D:這一區同樣是Unicode 3.1所字義的字碼範圍,和中日韓統一表意字元延伸B區的測試結果相同,蘋果僅部分支援此區域:
▲OS X 10.7 (Lion)在中日韓相容表意文字補充區域,也是缺字連連
中日韓相容表意文字U+FA30~U+FA6D:支援。
▲OS X 10.7 (Lion)支援U+FA30~U+FA6D範圍
雖然OS X 10.7完全支援Unicode 4.1的U+9FA6~U+9FBB範圍,但是對於U+FA70~U+FAD9這範圍,顯然並非這一回事:
▲OS X 10.7支援Unicode 4.1的U+9FA6~U+9FBB範圍
▲Unicode 4.1的U+FA70~U+FAD9範圍完全無字
U+9FBC~U+9FC3:這個區域緊接著Unicode 4.1的U+9FA6~U+9FBB區塊。從上面的圖可知,蘋果有支援到這個部分。
中日韓統一表意文字延伸C區U+2A700~U+2B734:蘋果顯然忘了將這一塊列入支援:
▲OS X 10.7 (Lion) 在中日韓統一表意文字延伸C區完全無字
U+9FC4~U+9FCB:這個區域中只有U+9FC4及U+9FC6這2個字有支援(請參考Unicode 4.1區域的螢幕畫面。
中日韓統一表意文字延伸延伸D區U+2B740~U+2B81D:如果你認為和中日韓統一表意文字延伸C區一樣(完全無字),那你就猜錯了;出乎意料地,蘋果在這一區域有部分支援。
▲OS X 10.7 (Lion) 僅部分支援中日韓統一表意文字擴充D區
打開OS X「應用程式」中的「字體簿」,原來預設的系統字型「黑體-繁」僅支援52,263字,難怪缺字一大堆:
▲OS X 10.7 (Lion) 內定的系統字「黑體-繁」僅支援52,263字
解決OS X 10.7缺字問題的方法也很簡單:只需在「字體簿」中安裝支援完整中日韓漢字的字型即可。筆者建議你安裝日本花園大學製作的「花園明朝」免費字型 (HanaMin),其下載網址(最新版本發行日期為2011年5月16日)為http://fonts.jp/hanazono/hanazono-20110516.zip。花園明朝字型的官網(日英雙語)是http://fonts.jp/hanazono/。
把花園明朝字型安裝入OS X之後,你將有2套字型可以使用:
當你重新打開「字體簿」檢視原先系統缺字的漢字字碼區域時,你將發現不再有缺碼的遺憾了。
▲HanaMinA 的字型資訊
▲安裝HanaMinB 字型之後,便可完全支援Ext-B、Ext-C及Ext-D漢字