電子書的編碼問題,最容易出現在TXT純文字檔上,因為TXT並不會特別在檔案內容裡標明文字所使用的編碼,所以軟體常常會讀出亂碼。以中文世界來說,最容易產生的就是簡體與正體中文的衝突問題,比如大家在下載電影的字幕檔時,就一定常會遇到簡體中文字幕無法正常顯示,得需要用ConvertZ或Word重新轉換文件才行。
基本上,不管電子書或是其他格式文件,只要是放在網路上流通的格式,存成UTF-8還是最理想的。以電子書來說,採用UTF-8編碼的文件也會有比較高的成功率。
在中文文件裡,最常出現的編碼是GB、Big-5以及UTF-16,前兩種分別適用於簡體與繁體中文就不說了,UTF-16則是最容易讓人誤會。很多文書處理軟體儲存檔案時,會詢問使用者編碼格式,不少使用者會捨UTF-8而就UTF-16,以為數字大就比較好,其實並非如此。就相容性來說,UTF-8是很多網路服務、協議都得支援的格式,UTF-16不管在數字上的涵義或者是實際的使用範圍,之於UTF-8都沒有「大於」的關係。
所以了,要怎麼把文件轉成UTF-8呢?用最簡單的記事本就行了。但是遇到大量文件要處理時,靠專門的程式比較快,筆者覺得最好用的非「Encoding Master」莫屬。
▲ Encoding Master會自動偵測原文編碼, 預設的輸出格式就是UTF-8,所以你幾乎不需要做任何設置,等於是一鍵轉檔。
▲ 一次有大量的文字檔要轉,就直接選擇目錄吧。
Encoding Master跨Mac跟PC兩種平台,它幾乎可以轉換這世界上所有登記在案、流通廣泛的文字格式,重點是會自動幫你偵測原始的文件格式,所以這個軟體也可以用來看亂碼,如果你有UTF-8的檔案仍然是亂碼,Encoding Master也能幫你修復,遇到根本就不知道是什麼的編碼時,一樣就交給它來辨識吧!除非是火星文。
▲ 如果是簡繁互轉的話,問題倒不是在編碼,要靠Word或ConvertZ才能真正轉換字元。
▲ MPlayer OSX Extended在開字幕檔時就可以先選編碼,懶得轉字幕就用這套播吧。