192s、CD、Mp3聲音大不同

大家是否和我一樣,在一段日子裡,把零花錢都用作買CD了?

DSD、24/192s、CD、Mp3聲音大不同

我最後一次買CD,是在鼓樓西的這家唱片店,那是2017年的4月,買了三張,三個月後唱片店拆了。說實話在那之前,我就好久沒買CD了!

這期亮測評不聊情懷,只做橫評,一首莫扎特D大調小提琴協奏曲的DSD文件,下轉成高格式WAV(24bit/192kHz)、WAV(24bit/96kHz)、標準CD制式WAV(16bit/44.1kHz)及Mp3(192kbps)

此視頻看為主、聽為輔,網絡視頻音質無法代表源音質。

我們先從最常用的說起吧

Mp3

Mp3大多是從CD制式WAV壓縮來的,CD為16bit/44.1kHz,比特率為1411.2kbps,那麼192kbps的Mp3就相當於CD的1/7,128kbps的Mp3相當於CD的1/11。

Mp3是如何壓縮的呢,首先讓我們看下圖

DSD、24/192s、CD、Mp3聲音大不同

這是人耳的等響曲線圖,體現了人耳對頻率的敏感程度,我們一般聽音樂,會在80dBSPL——100dBSPL之間,所以我們只看最下面這兩條線。

人耳對低頻和高頻敏感程度下降,尤其是16kHz以上的高頻,所以這部分就是Mp3首先要抽取的部分,高比特率的Mp3先拿掉了這個區域(如256kbps Mp3)

DSD、24/192s、CD、Mp3聲音大不同

左為16bit/44.1kHzWAV,右為Mp3

科學家認為這個Mp3文件還是太大,無法跟上撥號上網的大環境。為了加大抽取力度,他們開始研究音樂。

來看頻率與音高對照表

DSD、24/192s、CD、Mp3聲音大不同

由於音樂上運用了十二平均律,就可以計算出音樂中每一個音的頻率,中央A為440Hz,那麼向上的降B就等於440×12√2=466.164,

表中最低的A(27.5Hz)和降B(29.1Hz)之間只有1.6Hz的空隙,而表中最高的B(3951Hz)和C(4186Hz)之間有235Hz的空隙。顯然高頻留給科學家的可抽取空間更多,於是就有了我們最常聽到的128k、192kMP3。

他們認為抽取掉其中的部分內容不會影響聽覺,就這樣比特率越低就有越多的中高頻聲音被抽取,且隨著比特率越低抽取越向頻率下方延伸,直至中頻。美其名曰:

心理聲學模型

下圖中的Mp3波形顯然已經失真,動態也嚴重不足。

DSD、24/192s、CD、Mp3聲音大不同

這大大影響了音樂的完整性,拿人聲來說,音高、諧頻只是一方面,喉音、胸腔共鳴、鼻音、齒音、呼吸聲都是音樂表達的一部分,且含有大量的感情成份,這些都會因Mp3的壓縮而變的不成樣子。

這裡補充一個題外話

AutoTune

工作原因,我經常給一些主持人錄音(你懂的),我在混音時經常發現,原本工程裡(24bit/48kHz或96kHz)修的音高已經很準了,但一旦壓成Mp3還是顯得不準,不得不再修狠一點。這與Mp3的抽取方式是否有關聯呢?

Mp3 的發明者和專利持有方“德國夫琅和費集成電路研究所”( Fraunhofer IIS”)聲明,Mp3 的全部專利已於 2017 年 4 月 16日全數過期,他們終止了對 Mp3相關軟件的專利授權,並直接建議大眾使用效率更高、音質更好的格式。

當然壓縮格式還有AAC等等,大同小異吧。

這些壓縮格式讓我們聽到音樂的信息量大大降低,細節不復存在,而細節即情感的真實和連續表達,壓縮格式讓音樂在很大程度上失去了感動人的能力。

CD

讓我們先從一道數學題說起。

25(視頻幀數)×2(視頻場數)×294(視頻行數)×3 =44100。

沒錯,這就是44.1kHz的由來。為了聲畫對位,必須把聲音記錄在錄像帶上,要在每個視頻場上記錄3個音頻採樣點。

若設計為2個採樣點採樣頻率為29400,這樣的話根據乃奎斯特取樣定理,頻率只能滿足到14.7kHz,顯然不能滿足人耳要求,而乘以4被認為記錄在磁帶上有些浪費,乘以3,則剛好滿足人耳對20kHz的要求。

這沒有問題,畢竟視頻磁帶用於新聞、紀錄、足球轉播,即使是綜藝晚會也是完全可以的,但是拿它做音樂的載體,與模擬時代的音頻指標相比,這個標準就有點低了。

下面是我用聲卡32bit/192kHz轉錄的黑膠唱片和CD抓軌,左圖黑膠30kHz-50kHz清晰可見,諧波甚至可以達到65kHz。

DSD、24/192s、CD、Mp3聲音大不同

要知道自然界的聲音隨隨便便就可達到50kHz,20kHz以上對於模擬設備來講是一個緩慢的下降過程,而對於CD則是硬生生的閹割,即截止頻率(右圖),22kHz以上,一丁點兒都不剩。

再說說bit,早期的8bit聲音,80後再熟悉不過了,8bit的採樣為256階,小霸王音質,信噪比48dB,這可是遠遠不夠的,要知道80年代卡帶的信噪比大概60dB。

量化精度決定了信噪比,於是飛利浦提出了14bit可以讓CD的信噪比達到前所未有的84dB(1bit≈6dB),而索尼則高瞻遠矚的堅持16bit即信噪比96dB,65536階,最後索尼的標準獲得了通過,保住了多出來的這珍貴的12dB動態範圍。

16bit到24bit

那麼24bit是否有意義呢,當然有,信噪比提升至144dB。我用同一文件24bit/48kHz對比16bit/48kHz。 變化在聲底,樂段連接處,空氣感、混響殘響這些地方,這是實實在在的動態提升,用耳機更容易聽出來。可理解為在0到-96dB間兩者表現接近,差別存在於-96到-144dB的這些微小信號上。說實話,我並不確定我聽到了-96dB以下的聲音,但一定是向下的這些微小信號對聲音整體起了作用。聽交響樂這種動態較大的音樂時,24bit優勢明顯。

延伸一下,32bit理論上擁有信噪比192dB,是否會更好呢,對於浮點運算的混音工程它肯定是有意義的,比如一個動態很大的信號經過壓縮器,原來-145dB的信號壓縮到了-110dB,音色當然會更飽滿,而到了用戶這裡我個人覺得並沒有什麼卵用。要知道信噪比144dB已經是一個很大的數字了。

比較下,24bit聲底的內容確實更豐富,因為這裡有16bit不存在的聲音內容,是可辨識的。

位數越高,拾取信號能力越強,抗干擾能力反而越差,設備的製作成本更高。

因此對於用戶而言16bit是基礎,24bit需要有設備支撐,32bit則只適用於製作環節。設備上DAC一定要有24bit的解碼能力,喇叭和耳機要有比較好的動態表現,而且音量要開的大一些。

24bit的階數巨大,已超千萬,但所謂的精度提高對聲音音質起到的作用卻有限,24bit的意義更多在於信噪比,在於動態範圍。

44.1kHz-192kHz

再來看另一個指標——採樣頻率,從視頻中頻譜可以看出,16bit/44.1kHz的頻譜真的是很慘了,高品質音樂錄製,24bit/96kHz真的應該是低標準。96kHz和192kHz採樣率很大程度上緩和了截止頻率產生的聽感問題,高頻趨向自然。

DSD、24/192s、CD、Mp3聲音大不同

192kHz採樣率高頻確實更加豐富,在60kHz以上有超高頻量化噪聲出現(與DSD源文件有關),我認為這可視為聲音錄製可參考的頻率上限,96kHz採樣率的頻率上限未達到這個頻率,192kHz採樣率則突破了這個頻率。可以看到聲音在40kHz後信號逐漸變弱,而60kHz則是聲音信號和超高頻噪聲的分水嶺。

這種超高頻量化噪聲,無論是PCM還是DSD都會有,DSD更明顯一點,解碼器生產者會設計一個低通濾波器,具體是50kHz、60kHz,更高還是更低,要看廠家對指標、音質的考量。

不往高了說,把20kHz-40kHz放在整個頻率響應上,其實就是一個倍頻程,一個八度而已,20Hz-20kHz為10個倍頻程,20Hz-40kHz就為11個倍頻程,一個八度就能讓聲音有一個良好的高頻延展,此段聲音非常豐富,含有大量的泛音信息及空間信息。

人耳不是用來聽音樂的,而是用來感受自然的,不敏感不代表沒有,人耳並不是聽不到20kHz以上的聲音,17kHz以上的聲音已經沒有了尖得刺耳的感覺,無音高概念,更多的是空間信息,難以記憶,也難以形容。

可以明顯感受到,44.1kHz到96kHz、再到192kHz,是能量在增多,是高頻越來越順滑,是瞬態爆發力越來越充沛,是空間感更真實。

96kHz採樣頻率是保留聲音信息的基本保障,放大波形可以看出96kHz鋸齒仍然明顯,而192kHz更趨於平滑。

DSD、24/192s、CD、Mp3聲音大不同

同一段落,192kHz、96kHz、44.1kHz的波形比較

我們主觀去比較兩個不同指標的同一片段,一定是先評價頻率,再評價動態,因為頻率在高處,而動態變化存在於底層,聽起來採樣頻率的提升顯得比bit數的增加要明顯一點。但隨著採樣頻率的逐步提高,我們實際感受到的音質變化,卻非常微小。

除了DAC,喇叭和揚聲器是24bit/192kHz能否完整還原的關鍵,索尼剛剛推出了可以回放100kHz的耳機,喇叭可以還原到50kHz以上的也不少了。

從16bit/44.1kHz到24bit/192kHz,從頻率到動態再到細節表現,音質確實在提升;從圖形上來看,採樣頻率越高越接近平滑,但卻始終不是模擬的味道。在採樣規格上做文章對音質的改善是有益的,但也是有限的,問題出在哪呢?

高品質聲音錄製24bit/96kHz是個基本標準,那192kHz就是高標準了麼?

DSD、24/192s、CD、Mp3聲音大不同

說到底還是PCM。採樣頻率決定了聲音的頻率上限,16bit相當於定好了65536個小格子,每個採樣點為了在格子裡找到相應的位置而四捨五入,造成量化失真,這讓量化噪聲平均分佈在全部頻段上,這不是幾個採樣的問題,而是全局,說到底是個保真度的問題。

著名的調音臺之父Neve大師1995年在中國接受採訪時曾說:以我之見,未來的數字標準應是1bit、上兆赫茲或更高的採樣頻率,這樣才可能同現在的模擬技術相比。

DSD、24/192s、CD、Mp3聲音大不同

此文章亮測評曾轉載,地址如下:Neve大師1995年在北京-永恆的主題A POINTOF REFERENCE(參考點)

DSD(1bit 2.8224MHz)

如Neve大師所料想,一年後的1996年索尼和飛利浦共同提出把1bit的DSD作為SACD的編碼模式。

PCM為脈衝編碼調製,DSD則為脈衝密度調製。DSD64的採樣率為2.8224MHz,這並不是為了得到超高頻率的聲音,而是為了更真實的記錄波形。由於只採用1bit即0和1,省去了位轉化程序,大大降低了量化失真和噪聲。

DSD的採樣頻率最低為CD的64倍,密度極大。而動態的描述方式不像PCM直接在格子裡定位,而是定一個極小的固定值(得兒塔)Δ-∑,當下一個採樣和上一個採樣相減大於Δ,則為1,若小於Δ或為負數則為0(具體規則要複雜的多,我只是簡述)。

PCM每個採樣都是獨立存在的,而DSD每個採樣都是和上一個採樣相減得出,因此採樣點之間密不可分,無法斷開和離散使用,這使DSD的聲音聽起來有了模擬的味道。

DSD、24/192s、CD、Mp3聲音大不同

DSD、24/192s、CD、Mp3聲音大不同

PCM為非線性,DSD為線性;

PCM 為絕對值,DSD為相對值;

PCM像爬樓梯,DSD更像卷鏈條。

DSD64,64倍於CD採樣率但只記錄1bit,數據量大概是CD的4倍,DSD64與24bit/96kH數據量接近,並不誇張。

DSD64為DSD的最低標準格式,向上還有DSD128,DSD256,DSD512,後綴數字顧名思義,就是CD採樣頻率的倍數。

DSD的指標上,頻率響應自不必說,輕鬆超越100kHz。動態範圍也足夠大,但並沒有類似96dB、144dB這樣的理論指標,動態範圍直接取決於真實電平值,回到我說過的那個問題,120dB即達到人耳的痛域,從最前端的麥克風到最後端的喇叭,並沒有哪個模擬音頻設備的動態範圍真正達到130dB, 因為那不現實。

我說了半天頻率、動態,但決定DSD特性的其實並不是這些硬指標(日後細聊)。

當然DSD也有硬傷,那就是無法直接編輯,畫音量線、剪切一概別想,VST、Autotune更是沒門。

辦法也有,就是把錄製好的DSD音軌,每一軌線路輸出到模擬調音臺上,完全在模擬調音臺上做音量調整、EQ、壓縮,並軌、縮混,母線輸出信號再錄製成DSD,流程和三十年前的模擬錄音極為類似,國家大劇院就有一套這樣的DSD錄製系統。

瑞士的Merging公司還有一套折中的方案。那就是依託24bit/352.8kHz,用超高採樣率以PCM的方式打開並編輯DSD文件,稱之為DXD,編輯後再生成為DSD文件。實際上DXD也是現行可編輯的最高質量PCM制式文件了,現有很多高品質數字唱片直接採用DXD的方式錄製及發行。

DSD、24/192s、CD、Mp3聲音大不同

這是Sony 2018年推出的Hi-res精選音樂APP,可提供DXD音源及DSD音源的付費下載。

為了還原聲音的本來面貌,不知多少人花費了多少精力。

本期先到這裡,本文涉及內容如果有錯誤一定幫我指出,大家一起學習,別讓我將錯就錯,下一期亮測評,我將和大家交流DSD的聲音特點、優缺點及應用心得,敬請關注!

此文敬請分享!


分享到:


相關文章: