說真的筆者自己平常會上網試聽音樂,覺得不錯才會去唱片行購買。不過網路上這麼多檔案,無法用文字去了解別人轉的音樂是否具有一定品質(尤其是那種突然來個爆音的比比皆是)。但是網路上越來越多人強調是由EAC所轉出來的,究竟是如何做到公認的好品質,接下來就看我們的逐步分析。

音樂CD的規範—紅皮書

比較資深的玩家們,應該都還記得當初從錄音帶時期躍進到光儲存媒體的震撼吧!CD想聽那一首就聽那一首,不像錄音帶聽過一遍還要倒帶,放久了會消磁,聽太多遍磁帶還會被拉長,從電音舞曲變成悲傷情歌。體積方面也縮小許多,從兩塊七七新貴派的大小縮成一片薄薄的法蘭酥。

音樂CD最初是由Sony和Philips於1980年共同推出,其中定義了光碟片的物理規格(8或12公分)、光碟厚度、雷射光的頻率及碟片反射率、將資料打散的CIRC糾錯,還有將8bits資料換成14bits資料的調變系統,使得光碟片有一些刮傷時還可以讀得出資料。在資料內容方面則是規定了音訊的規格,雙聲道,資料量化區間為16bit(-32,768~32,767),取樣頻率44100Hz,這表示可收錄真實世界中22050Hz以下的聲音。

74分鐘怎麼來

相傳當時CD規格制訂有相當多的爭議,光是要放入幾分鐘的音樂就足以爭吵不休。飛利浦方面希望訂為60分鐘,當時的Sony社長大賀典雄則發表了另一種意見,「74分鐘長度的CD就可以完整收錄貝多芬第九號交響曲,為什麼不加長一下?」,於是CD變成為了現在74分鐘這一種規格。

讀取光碟時會發生的情況

音樂怎麼變光碟?

  • 第一步:一個取樣=16bits×2聲道=32bits。
  • 第二步:一個frame包含6個取樣=32bits×6=192bits=24Bytes。
  • 第三步:經CIRC(Cross-Interleaved Reed-Solomon Coding)處理後會多出8Bytes校正用資料,再加上子通道1Byte,所以資料量變為24+8+1=33Bytes。
  • 第四步:這33Bytes資料再分別以8bits為單位,經過8至14調變和加入同化(merging)位元3bit,之後變成33×17=561bits資料。
  • 第五步:接著再加入27bit的同步位元,最終出來的資料為588bits,這長度就是一個frame,而98個frame組成一個7203Bytes扇區(sector),但其中音訊資料只佔24Bytes×98=2352Bytes,之後就實際儲存在光碟片上。

驗算:CD播放機每秒讀取75個扇區,也就是每秒讀出2352Bytes×75=176,400Bytes,將這一個數字除以雙聲道和2Bytes(一個取樣16位元),176,400÷2÷2=44,100,剛好就是CD取樣頻率44,100Hz。

問題一:C1、C2錯誤

由於日常生活環境不是無塵室,難免都會沾黏到一點灰塵,而一粒灰塵小則幾十微米,大則幾百微米,遠遠超過CD軌距的1.6微米,勢必在讀取中造成一些錯誤。不過在紀錄時就先經過CIRC將資料打散了,如果只是單一個bit出錯,很容易將資料修正過來,此時的錯誤稱為C1錯誤。但若是連續的資料錯誤,則需要更多的資料及冗餘檢查碼來修正資料,此時就是C2錯誤。那如果連C2都修不好呢?資料CD就會直接回報錯誤,音樂CD可能就會直接在錯誤的資料區段上填入靜音,或是使用前後資料的內插值去補,就會聽起來怪怪的。

問題二:偏移值(offset)

如果讀者電腦裡有多台光碟機的話可以測試看看,不同品牌、型號的光碟機讀出來的音軌檔案,在資料開頭和結尾的部分會有稍稍的不同,感覺上像是資料被「位移」過。

這種情形幾乎都會發生在每一台光碟機上,在讀取或是燒錄時都會發生超前讀取幾個取樣,或延後讀取的事情發生。雖然音樂聽起來都一樣,但是在開頭或是結尾處的音樂其實並不正確﹙影響比較大的會是演唱會CD,因為音軌與音軌中間並沒有2秒鐘靜音的間隔,所以當擷取出某一段音軌時,會包含上一段或是下一段音軌的些許資料﹚。

▲如果說上方的資料為CD音軌的開頭,而下方為某A牌光碟機所讀出的開頭。兩相比較之下發現A光碟機讀出的資料向後偏移了三個單位,此時就會判定A牌光碟機的讀取位移值為+3。

問題三:時基誤差(jitter)

CD的讀取方式是恆定線速度(CLV)方式讀取,在內圈時轉得比較快,讀外圈時轉得比較慢,如何精準控制馬達的轉速變成了一大課題,就算是常用的石英震盪器也會存在著誤差。所以有些hi-end級的CD播放機,便宣稱調校過這個部分的精確度。至於效果如何?等筆者哪天樂透中獎再告訴你。另一種jitter則是由於製作時的不精確,光碟片上的pit和land長度不一致所造成。

延伸閱讀:

EAC 真的可以完美擷取 CD 音軌?小編實測給你看

(後面還有:EAC如何校正)

EAC如何校正

Secure Mode重複讀取音軌

在EAC中有著不同的讀取選項,其中Secure Mode(安全模式)至少會讀取同一音軌兩次,將資料前後比對。如果兩次所讀出的資料不相符時,則會再次讀取同一音軌,直到16次的讀取中有8次的資料是相同的為止。而這份作業依使用者設定的不同,最多會反覆進行5次,也就是同一音軌最多會被讀到82次(2+16×5),這也是為什麼EAC讀取音軌速度比較慢的原因之一。

另外由於電腦光碟機裡都有緩衝記憶體,要求讀取同一音軌時,會直接從光碟機的快取輸出之前的資料,而不是實際再去讀取一次。EAC在此處的解決方法相當簡單,叫光碟機先去讀取其他的音軌,等快取內容被清掉之後,再回過頭來讀取原本的音軌,所以使用EAC抓音軌時,光學讀取頭常常來回移動,發出嘰乖機乖的聲音。

▲這台在CD-RW燒錄機末期所出的一代名機,使用了獨家技術Audio Master功能,可以降低jitter的影響。大家都知道在CD上所實際紀錄的方式為pit和land,也就是藉由在光碟片上的凹和凸來儲存資料。這台燒錄機可以將pit的長度稍微拉長一點,讓CD播放器比較容易讀取,進而提升品質。但是每張CD所能容納的資料空間將減少,80分鐘∕700MB的光碟只能容納68分鐘的音樂;74分鐘∕650MB的光碟只能容納63分鐘的音樂。

▲從當時的宣傳文宣上截下來的圖,左邊是沒有使用Audio Master的示波圖,右邊則有,可以清楚看見右邊的訊號較為凝聚,jitter較小。

Tips:凹凸不等於0、1

在這裡小小釐清大家一個觀念,當光學讀取頭讀取到pit和land的交界就是為1,其他不變的地方皆為0,而不是凸起來為1,凹下去為0這種方式。

偏移值補償

EAC受到大家的推崇,便是有著偏移值補償的功能。前文提到每一台光碟機在讀取或燒錄時,或多或少都會有著資料位移的現象,可是這麼多光碟機,又要如何去測量每一台光碟機的偏移值呢?網路上有個專門收集光碟機偏移值的AccurateRip網站,資料庫裡有著各種光碟機的資料,從CD到藍光光碟機都有,讀者可以依自己的光碟機型號去搜尋。

▲放入CD時,AccurateRip的外掛會先檢測這張CD是否在資料庫裡註冊過,出現這畫面表示這張CD可以用來校正光碟機偏移值。

那麼這些數據資料是怎麼來的呢?首先在資料庫裡會有所謂的「標準測試光碟」,大多都是古典音樂或是發行量較龐大的CD,把這些光碟放入不同的光碟機裡去讀取,將讀取出來的資料和資料庫的音軌資料做比對,便可以知道這台光碟機的偏移資料量是多少,再交由EAC去做校正。

▲與資料庫連線比對後,會出現這台光碟機的偏移值,像是這台光碟機為+6 Sample,按下確定即可套用。

不過要上網去找自己的光碟機偏移值實在是累了點,在最近這幾版的EAC中已經內建AccurateRip外掛。當放進去的音樂光碟有在資料庫裡登記過音軌資料,EAC便可以為光碟機自動校正,不用再去網路上找資料手動填入。筆者實際測試幾片CD,國外的音樂都可以抓到,成功校正,國語音樂CD則是無法進行校正程序。

▲之後再放入CD時,若是在EAC右下角有出現AccurateRip的圖示,表示這張CD可以用來測校正光碟機偏移值,反之則不行。

結論:永遠的Beta版──EAC

了解EAC在抓取音軌正確性所做的努力,便不難理解為何大家都推崇這套軟體的原因,尤其近幾版紛紛加入了實用的功能,可以替你在網路上搜尋音樂資訊,歌詞,唱片封面等,減少過去須手動輸入的時間。

從EAC的網站上也得知,這套軟體發展已經十多年了,去年9月22日發出了1.0 beta 3版,在更新日誌裡提到,或許這版會是真正穩定1.0版本。筆者試用的結果,比起以往版本會莫名其妙的當機,此版算是穩定許多,想玩的讀者可以下載看看。

不過在此還是要呼籲大家一下,有好音樂還是要多多支持,懶得去唱片行就在網路商店點一點就送到你家啦。否則之後不出唱片的話,再強大的擷取音軌軟體也不再有用武之地。

後記:LAME、noath

有了抓取音軌軟體,當然也要有一個壓縮軟體來配合,否則從一片上百MB的CD擷取出來的音樂實在太大了,不適合隨身帶著走。常與EAC並行的MP3編碼器LAME就是扮演這種角色,強大的選項調整功能和音質一直受到玩家們的愛戴。但是由於沒有圖形化介面,所有設定參數都必須使用命令列。還好某些圖形化介面軟體支援LAME的編碼,如EAC和foobar等,讓LAME使用起來輕鬆許多。

最近大家也特別強調,在使用LAME編碼時加上-noath這個參數。-noath就是不使用LAME內建的ATH(absolute threshold of hearing;絕對聽覺極限)濾波器,一般LAME在壓縮時會經過這個濾波器,把人耳聽不到的微小聲音給濾除,以便將檔案體積縮小。可是每個人的聽覺極限不同,LAME只能依大多數人的聽覺極限下去濾波,所以某些人會宣稱使用這個參數後,聽起來音質會有所提升,聲音細節也變多。

Tips:44100Hz怎麼來

通常人類的耳朵可以聽到20Hz~20,000Hz的聲音,根據奈奎斯特定理(Nyquist Theorem:取樣頻率>兩倍最高頻率),使用40,000Hz的取樣頻率就可以重建原始的類比波型。44,100Hz相傳是從錄影帶上繼承來的規格,當時錄影帶上記錄方式為每秒30個畫面,每個畫面有490條掃描線,每一條掃描線可以記錄3個音訊取樣,所以就變成30×490×3=44,100。