超能課堂(220)：數字視頻編碼的發展歷程

2020-03-19 18:50:18 超能網

大家久等了，這是多媒體文件格式系列課堂文章的第三篇，前面已經講過了容器與音頻編碼，現在我們要看到最為複雜的視頻編碼了，人們一直在想盡辦法提高視頻編碼的效率，讓它在儘可能小的體積內提供最好的畫面質量，從而滿足人們對於視頻傳輸、存儲的需求。和前兩篇文章中介紹的容器與音頻編碼不同的是，視頻編碼有一條較為清晰的發展脈絡，比種類繁多且不統一的音頻編碼要容易理順，目前國際通行的視頻編碼標準基本上都是由MPEG（動態圖像專家組）和ITU-T（國際電信聯盟電信標準化部門）等組織牽頭開發的，另外還有一些零星的編碼，它們可能在一段短暫的時間內佔據主流地位，不過最終還是讓位於國際通行標準。

國際上主要通行的編碼標準為ITU-T組織的H.26x系列視頻編碼和MPEG組織制定的部分編碼標準，有一點需要說明的是，同樣的一個標準在不同組織那兒可能會叫成不同名字，比如最典型的就是AVC（高級視頻編碼），大家可能更熟悉它的另一個名字——H.264，AVC是MPEG組織在標準中給它起的名字，MPEG組織從屬於國際標準化組織（ISO）和國際電工委員會（IEC），所以在ISO標準中，它的正式名字是“MPEG-4 Part 10, Advanced Video Coding”。這種情況多見於H.26x系列編碼，下文會注出。

而在這條主要脈絡中，基本上囊括了接近半個世紀以來，視頻編碼的技術發展，我們將主要沿著H.26x以及MPEG這條主要脈絡，為各位讀者簡單梳理出一條視頻編碼的發展歷程。

為什麼我們需要對視頻進行壓縮編碼？

很簡單，就是為了減小視頻佔用的容量大小。

數字視頻實質上就是一幀幀連續的圖像，雖然一幀圖像的大小並不大，但每秒至少得有24幀圖像（一般情況），它們累計起來就會佔據非常大的空間，我們沒有那麼多的地方存儲原始數據，那麼只有一條路可以走，對它進行壓縮。而視頻的編碼過程就是這個壓縮過程，但與音頻一樣，在傳統數據壓縮算法來看視頻文件裡面基本上是沒有什麼冗餘信息的，所以人們就有必要去開發針對視頻的壓縮算法，把實際存在的冗餘信息給去掉，從而減少它的數據量，達到減小佔用容量的目的。因此，目前的視頻編碼基本上都是有損的，意味著編碼過後的視頻在畫面質量上會有損失。

前藍光時代的視頻編碼發展之路

讓我們首先沿著國際標準，按時間順序來看看視頻編碼是怎麼一步一步“現代化”的。

在模擬電視和膠片電影時代，我們看到的內容都是模擬信號還原出來的。但隨著人們的需求不斷提高，和計算機、網絡的蓬勃發展，我們需要新的、能夠承載視頻內容的數字編碼，用來支持視頻內容在互聯網上的傳輸，或是將其存儲在數字化的存儲設備中。

在上世紀七十年代末八十年代初的時候，人們已經研究出了不少新的針對圖像等多媒體內容的壓縮算法，此時開發數字視頻編碼的條件已經基本成熟，而第一個開發出實際編碼的，就是後來在數字視頻編碼領域中起領頭作用的視頻編碼專家組（VideoCodingExpertsGroup），他們是當時名字還是“國際電報和電話諮詢委員會（CCITT）”的ITU-T（國際電信聯盟電信標準化部門）組織下面的專家組。這個編碼被命名為H.120，它誕生於1984年，是一種偏向於實驗性質的早期編碼，主要基於差分PCM編碼，用來保存電視內容，但是它並沒有大規模的實際運用。

H.261：引入各種特性，奠定現代視頻編碼基礎

在制定完H.120過後幾年，VCEG並沒有停止他們在視頻編碼上面的研究。此時很多跨國公司已經使用網絡進行視頻會議的需求了，在互聯網帶寬尚不充裕的年代裡，人們需要新的視頻編碼來實現流暢而優質的實時視頻通信，H.261就應運而生了。

H.261與首個數字視頻編碼標準H.120並沒有直接的繼承關係，它可以說是完全另起爐灶的一種編碼。在針對圖像的壓縮算法上，H.261使用了我們現在比較熟悉的離散餘弦變換（DCT）算法，它在後來的JPEG編碼中起主要作用。但不止於此，它引入了一系列針對視頻的特性，奠定了現代視頻編碼的基礎，其中主要有宏塊（Macroblock）和基於宏塊的運動補償（Motion Compensation）。

宏塊與基於運動補償的幀間預測

我們知道，視頻是由一幀一幀的圖像組成的組合，一般情況下一秒鐘的視頻中會包含24、25、30、60或更多張圖片，它們按照一定的時間間隔播放出來，基於視覺殘留原理形成了流暢、會動的畫面。在連續的幾幀之間，實際上存在著大量重複的畫面，比如說下面這個例子：

一個白色檯球在綠色桌面上面運動

用小球運動的方向和距離來描述圖像的變化

如果是以傳統的思路對每一幀圖像做壓縮的話，顯然整個視頻在壓縮過後仍存在大量的冗餘。那麼怎麼辦呢？H.261標準引入了宏塊的思維，它將整個畫面切分為許多小塊，然後再引入基於運動補償的幀間預測——畫面的大部分都是不動的，那麼我們將不動部分的區塊沿用之前的壓縮結果，動的部分用運動方向加距離這樣一個矢量來描述不就可以節省出大量的存儲空間了嗎？

DCT算法

將8x8個像素分成一個塊

DCT算法起源於上世紀70年代，到了80年代中後期，有研究者開始將其用於圖像壓縮。這種算法可以將圖像從空間域轉換到頻率域，然後做量化——減少人眼敏感程度較低的高頻信息，保留絕大部分低頻信息，從而減少圖像的體積。最後再用高效的數據編碼方式將處理過後的數據進一步壓縮，這裡使用了Zig-Zag掃描和可變長編碼。

注：圖像的高頻部分存有很多細節信息，而低頻部分則存有輪廓等覆蓋範圍較大的信息。

亮度通道做DCT變換後的圖像，可以看到上方顏色連續部分非常平坦，而下方則擁有諸多細節

在H.261及之後基於H.261框架的視頻編碼中，DCT算法主要針對的是關鍵幀的壓縮，所謂關鍵幀，就是在運動補償中作為基準參考的一幀。打個比方，就像Flash動畫中的關鍵幀一樣，它定義了一個起點，後續的幾幀都是基於這個關鍵幀演算出來的。因為它只做幀內壓縮，不涉及其他幀，又被稱為Intra-frame（幀內編碼幀），簡稱I幀。

小結：創立混合編碼框架，有里程碑意義

H.261設計的目標是編碼出比特率在64~2048kbps範圍內的視頻，以用於實時的視頻電話等應用。它首次確立了幀內預測與幀間預測同時使用的編碼框架，在消除每一幀本身存有的冗餘外，消除了幀與幀之間的冗餘信息，從而大幅度降低了碼率，成為了實際可用性相當高的一種視頻編碼。而它的編碼框架也影響到了之後幾乎所有的視頻編碼，尤其是H.26x和MPEG家族。

需要說明的是，H.261只是規定了該如何解碼，只需要編碼器最終產生的視頻流可以被所有H.261解碼器順利解碼即可。至於你前面怎麼編碼的，具體用的算法如何不同都沒有關係，這點適用於之後幾乎所有的視頻編碼。

MPEG-1 Part 2：引入幀類型概念，成為VCD標準

幾乎在H.261開發的同時間，1988年，ISO和IEC兩大國際標準化組織建立了MPEG（動態圖像專家組，MovingPictureExpertsGroup）以開發國際標準化的音視頻壓縮編碼。他們在1992年11月份完成了MPEG-1整套標準的制定，其中的第二部分標準化了一個新的視頻壓縮編碼，它受到H.261的深刻影響，繼承和發展了分塊、運動補償、DCT算法等思想，並做出了自己的改進，比如引入新的雙向預測幀、亞像素精度的運動補償等新技術。

引入雙向預測幀（B幀）

H.261引入基於運動補償的幀間預測算法之後，視頻中的幀其實就已經分成兩類了，一類是完整的，稱為關鍵幀（Intra-frame），它就是一張完整的靜態圖像，可以直接被解碼出來。另外的幀則是通過運動補償算法在關鍵幀之上計算得到的。

MPEG-1 Part 2引入了幀類別的概念，原來的關鍵幀被稱為“I幀”，基於幀間預測計算得到的幀為P幀。在這兩種H.261已有的幀類型外，它引入了一種新的幀：雙向預測幀，也叫作B幀。

原本的P幀只能夠前向預測，也就是說，它只能夠基於前一幀計算得到。雙向預測，顧名思義，它可以用前面的一幀作為自己的參考，也可以用後面那幀來進行預測。由於參考了更多的信息，B幀自身就可以包含更少的信息量，其壓縮比自然就要比只能做單向預測的P幀還要高了。但是，B幀的引入帶來了一個新的問題，即編解碼難度上升了。

引入幀序列（GroupofPictures）

幀序列是一些按順序排列的圖像幀的組合，簡稱為GOP。一個GOP的頭部是一個I幀，也只會有一個I幀，它包含了該GOP的基準參考圖像信息，其後是數個P幀、B幀，它們都是以開頭的I幀為基礎，經過計算得到的。

上面的圖片就描述了一個完整的GOP，可以看到一個I和P幀之間隔了三個B幀。實際應用中，B幀確實是數量最多的幀類型。

亞像素精度的運動補償

H.261中引入的幀間預測精度為像素級的，對很多分塊的運動瞄準是不精確的，這點在MPEG-1上得到了有效改進。他們引入了亞像素級別的運動補償，可以以1/2像素級別描述像素塊的運動。

小結：成功接棒

MPEG-1成功地繼承了H.261的技術框架，並對其進行了有效的補充，從而達成了不錯的壓縮比。在那個人們普遍還在用VHS錄像帶的年代裡，MPEG-1已經能夠以1~2Mbps的碼率提供類似於VHS錄像帶的畫質了。這也使得它被選用為VCD的標準，在世界範圍，尤其是在我國風行十餘年。

不過MPEG-1主要面向低碼率應用，但實際上它在高碼率下的表現也不差，於是，MPEG很快推出了它的升級版本，也就是MPEG-2。

MPEG-2 Part 2/H.262：DVD與（前）數字電視標準

1994年推出的MPEG-2中標準化了一種新的視頻編碼，它在1995年被ITU-T接納為H.262，在這裡我們簡單稱它為MPEG-2。相對於1993年推出的MPEG-1，它並沒有太大的改動，主要是針對DVD應用和數字時代進行了改良。

支持隔行掃描

隔行掃描放在今天也並不是過時的概念，在九十年代初期，這種掃描方式有效降低了視頻傳輸所需的數據帶寬。平常我們看到的視頻畫面大部分都是逐行掃描（Progressive scan）的，比如說視頻的垂直分辨率為1080像素，那麼每幀畫面的垂直分辨率就是1080像素。

而隔行掃描，顧名思義就是隔一行掃一次，它將每一幀畫面拆分成兩個場，每個場保留原有幀一半的信息。這種掃描方式在保證畫面流暢度的同時降低了對傳輸帶寬的需求，被各國的電視廣播系統採納使用。MPEG-2在制定時充分考慮到了數字電視系統的需求，加入了對隔行掃描的支持。

面向高碼率和標清、高清晰度

從上世紀90年代開始，數字電視系統逐漸開始普及，它帶來了更大的傳輸帶寬。同時，DVD標準也快要塵埃落定，它提供了比CD大幾倍的容量，能夠承載更為清晰的畫面。因此，MPEG-2提升了自己的目標碼率範圍，從MPEG-1時代的1~2Mbps實際豪爽地倍增到6~10Mbps，甚至在高清時代，它能夠用20Mbps左右的碼率傳輸高清畫面。

小結：曾經最為通用的視頻編碼

MPEG-2雖然沒有加入太多新的特性，在壓縮率方面實際沒有太大的提升，但由於它被選中成為DVD-Video、數字電視、DV等等一系列應用的標準編碼，順利地成為了世界範圍內通行的視頻編碼格式，時至今日，它仍然被大量地應用在數字電視等系統中。

H.263：FLV與3GP的好搭檔

原先的H.261和MPEG-1都是偏向於低碼率應用的，隨著互聯網和通訊技術的飛速發展，人們對網絡視頻的需求在提高，在低碼率下追求更高質量的視頻成為了新的目標，而作為通信業的一大標準制定者，ITU-T在1995年推出了H.261的直接繼承者——H.263。

H.263有多個版本，在1995年推出的初版中，它主要引入了在MPEG-1上開始應用的亞像素精度運動補償，同樣支持到1/2像素的精度。另外它改進了使用的DCT算法，加入了新的運動向量中值預測法，在編碼效率上相比H.261有較為明顯的提升。

需要注意的是，以上特性僅僅是它的基礎部分，只需要實現這些新東西就算是支持H.263了，但它還給出了一系列額外的、用於增強壓縮率的特性，比如說，在MPEG-1中新增的B幀，到了H.263中成了額外的PB幀。

H.263是一個被不斷升級的編碼，在初版之後還存在H.263+和H.263++兩個官方升級版。在H.263+中，它著重提升了壓縮率，相對初版有15~25%的總體提升。同時在2001年的修訂中，它還引入了“Profile”的概念，將各種特性分成幾個級別，完整支持某一級別的特性即為支持此Profile，比如說，初版H.263的基礎部分是它的“Baseline”Profile。

H.263在互聯網和通信業中得到了廣泛的應用，它一度活躍在各種視頻網站上面，和Flash播放器一起撐起了互聯網在線視頻的一片天，而在通信業中，被3GPP組織採納成為多種通信標準中的標準視頻編碼，比如說MMS——也就是彩信。

另外它還被MPEG組織參考，作為MPEG-4 Part 2的基礎。

MPEG-4 Part 2：特性很多，實現很多

在MPEG-2之後，MPEG組織有了新的目標——開發一套壓縮率更高的編碼框架，但同時保留對低複雜性的支持。1998年，MPEG-4標準正式誕生，其中第二部分定義了一套新的視覺編碼體系，是的，它並不是僅僅針對於視頻應用，而是廣泛意義上的視覺（Visual），故也被稱為MPEG-4 “Visual”。

它的核心設計實際上與H.263趨同，但是包含了更多關於編碼效率的增強。它定義了複雜度不同的多種Profile，從最基本的Simple Profile到非常複雜的Simple Studio Profile，前者不支持B幀，而後者甚至支持到4K分辨率和12-bit、4:4:4採樣的編碼。

儘管MPEG-4 Visual是一個野心勃勃的編碼，但它遭到了業界的冷待和批評。一個是它的壓縮率相比起MPEG-2並沒有重大提升，而因為授權和專利費用問題，很多廠商選擇自己去實現一套兼容MP EG-4 Visual的編碼，而不是直接採用標準，這其中就有經典的DivX和Xvid兩兄弟，微軟也拿它作為Windows Media Video的基礎，一點點升級到WMV9。

其他編碼

時間已經來到二十一世紀，高清視頻和高清電視開始普及，新的應用帶來了更高的需求，迫使業界開始研究新的更高效的視頻編碼，我們熟知的AVC即將登場，不過在介紹它之前，我們先來看看其他幾個有較多應用的視頻編碼。

MJPEG

JPEG想必大家都很熟悉，這個MJPEG跟JPEG之間有著千絲萬縷的關係。視頻不是一幀一幀的嗎？那每一幀都用JPEG進行壓縮，然後組合起來不就行了嗎？是的，MJPEG就是一個JPEG圖像組合，每一幀包含了完整的圖像信息，正因為如此，它的壓縮率並不高，但是實現起來簡單的特點讓很多數碼相機廠商將它作為相機的視頻編碼，實際上它得到了相當廣泛的利用。

RealMedia

對於國人來說，RealMedia絕對是一個帶有情懷的詞語。他們家的RM系列編碼在十多年前在國內網絡上曾有相當的覆蓋度。實際上它的實現基本上都是參考同時期的國際標準而來的，比如說清晰度和壓縮比都很高，壓過同時期DivX一頭的rv40是參考了H.264而形成的。

RM最大的問題還是支持範圍不廣，在瀏覽器中播放RM需要插件，基於Flash播放器的視頻網站的興起也讓它的用途逐漸變得狹隘，最終在正版H.264的衝擊下，RM慢慢的銷聲匿跡了。

WMV

微軟有自己的客廳夢想，除了Xbox以外，他們想讓PC走進客廳，當然這都與Windows Media Video無關。微軟基於MPEG-4 Part 2創造出了一系列新的編碼，起初它們都被稱為Microsoft MPEG-4或是Microsoft ISO MPEG-4，但很快，微軟將其歸入了Windows Media家族，首個版本是WMV7。

接下來微軟在WMV7的基礎上面不斷加入自家的東西，使得它能夠適應更高分辨率的視頻，最後，他們在WMV9中加入了新的Profile，產生了新的VC-1編碼。

藍光時代標準之爭

在DVD普及之後，高清視頻的時代很快就到來了。人們很快發現，就算是雙層DVD，其容量對1080p視頻來說，也是完全不夠用的。很快，大公司開發出了兩種新的以藍光為激光束的光盤，一種是以DVD論壇為首開發的HD DVD，另一種是Sony牽頭另起爐灶的Blu-ray。兩種光盤格式的戰爭我們按下不表，這裡要講的是，伴隨著新光盤制式一起出現的全新視頻編碼標準——VC-1和H.264。

AVC/H.264：集大成者一統江湖

HD DVD和Blu-ray的標準裡一共支持了三種視頻編碼，其一是古老的MPEG-2，其二是微軟主推的VC-1，最後一種就是全新的AVC。別看它的名字很簡單，其實它大有來頭，是MPEG和ITU-T兩個組織聯合推出的新一代國際標準，在MPEG那兒被規範為MPEG-4 Part 10 Advanced Video Codec，在ITU-R那兒它又被標準化為H.264。

對於H.264這個名字，我想大家應該都不會耳熟。但就是這個現在我們每天都能夠接觸到的視頻編碼格式，曾在十多年前引發了一場軟解危機，將當時很多主流CPU挑落馬下，也使得ANI三家都在自己的產品中加入了輔助解碼的硬件加速單元，不過這與我們的主題沒什麼關係，暫且按下不表。這裡要講的，還是H.264的厲害之處，究竟它用了什麼手段能夠在編碼質量上面實現飛躍，從而獨佔市場十餘年時間還沒呈現衰退跡象。

總結下來主要有如下的幾點：更靈活的宏塊劃分方法、數量更多的參考幀、更先進的幀內預測和壓縮比更高的數據壓縮算法。

更靈活的宏塊劃分方法

之前的標準中，宏塊的劃分方法是固定的，以16x16個像素為一個宏塊。不過在新時代，這種粗放的劃分方法不夠靈活，於是H.264同時允許16x8、8x16、8x8、8x4、4x8和4x4這些精細度更高的劃分方式。同時H.264將亞像素精度的運動補償描述從1/2像素精度細化到了1/4的程度。這樣一來，在幀間預測中新的編碼擁有更高的精準度，但實際的數據量並不會增加太多，提高了壓縮率。

數量更多的參考幀

在以前的標準中，每個B或P幀可參考的幀數是有限且數量過少的，H.264一舉將限制放鬆到了16幀的程度，在大部分應用場景中，每幀的可參考幀數量至少都有4~5個，而在之前的標準中，P幀僅能參考1幀，B幀則是2。這一特性可以提高大多數場景的畫面質量，或是降低體積。

更先進的幀內壓縮

每個宏塊包含的預測模式信息

對於I幀，H.264也引入了新的壓縮方式。一般來說，對於圖像中的某一像素點，它與附近相鄰的像素的顏色是差距不大的，所以我們就可以利用這個特性進一步縮小單幀圖像的大小，怎麼利用呢？H.264將單個宏塊內的像素顏色變化規律規範成了公式，編碼時只要寫此處應用哪個公式就行了。當然這裡我表述的較為簡單，完整的幀內預測還是非常複雜的，H.264對4x4的宏塊規定了9種預測模式，對16x16的亮度平面宏塊規定了4種可用模式。大大減少了單幀圖像的數據量，同時保持了很高的圖像質量。

差分圖像加上預測信息可以還原出原始圖像

CABAC

在編碼的最後階段，對數據進行無損壓縮時，H.264除了支持在H.261中就存在的VLC編碼外，新增加了兩種無損數據壓縮編碼，一種是VLC的升級版——CAVLC，另一種是複雜程度更高的CABAC（前文參考之適應性二元算術編碼，Context-basedAdaptiveBinaryArithmeticCoding）。

CABAC也是一種熵編碼，主要原理也是用長編碼替換掉出現頻率少的數據，而用短編碼替換出現頻率高的數據，但它引入了更多統計學優化，並且具有動態適應能力。雖然在解碼時需要更多計算，但它能夠比CAVLC節省更多的數據量，通常能有10%。

小結：巨大的改變帶來的是巨大的成功

除了以上介紹的幾點外，H.264還有非常多的新特性，與MPEG-4 Visual不同的是，這些新特性有效地幫助H.264在節省容量方面取得了重大進展。這裡我舉一個有強烈對比的例子，DVD Video標準的視頻，採用的是MPEG-2編碼，碼率約在9Mbps左右，但它的分辨率僅為720x480，而且在某些場景下我們可以很明顯看到有損壓縮產生的破壞；而同樣的碼率，放在H.264上面，已經可以承載起1080p的視頻，並且擁有良好的質量。

除了在編碼效率上有重大提升外，H.264針對網絡傳輸的特性對編碼組織方式進行了優化，讓它更能夠抗丟包，抗干擾。在種種手段之下，它成為了近十年來統治視頻領域的編碼，並且可以說它已經成為了HTML 5中的事實標準，現在你很難看到一件不支持H.264編碼的設備，從手機到攝像機，從流視頻到藍光光盤，它的應用範圍廣，效能強，即使在新編碼已經出現的當下，它仍然有很強的生命力和不可替代性，可以預見的是，H.264將在未來一段時間內繼續統治視頻編碼領域。

VC-1：失敗的挑戰者

進入高清時代後，微軟也順應潮流，為WMV9進行了升級，加入了針對高清視頻的新特性，讓它能夠勝任1080p級別的高清視頻，新的編碼即為VC-1。與H.264相比，VC-1總體的複雜程度要低一些，也因此在軟解上對CPU更加友好。實際上VC-1也通過了國際組織SMPTE的標準化。

VC-1與HD DVD有一定的捆綁關係，在藍光大戰初期也通過這種方式得到了一定的推廣。然而，隨著HD DVD陣營的認輸，VC-1也隨之銷聲匿跡，很難再看到了。

UHD與流媒體時代，新的編碼興起

H.264很強大，但是它在超清時代有點不夠用了。隨著視頻分辨率的跨越式提升，H.264表現出了疲態，它在應對4K視頻時已經沒有辦法提供很好的壓縮比了。很明顯，人們需要新的編碼來繼承它的位置，而它的直接繼承者——HEVC，在經過多年研究之後，終於在2013年被通過了。

HEVC/H.265/MPEG-H Part 2：視頻編碼王位繼任者

HEVC，全稱高效視頻編碼（High

EfficiencyVideoCoding），同樣的，它也是由MPEG和ITU-T聯合制定的國際標準編碼。被包含在MPEG-H規範中，是為第二部分（Part 2），在ITU-T那兒，它是H.26x家族的新成員，為H.265。

HEVC主要是針對高清及超清分辨率視頻而開發的，相比起前代AVC，它在低碼率時擁有更好的畫質表現，同時在面對高分辨率視頻時，也能提供超高的壓縮比，幫助4K視頻塞入藍光光盤。

代替宏塊的編碼樹單元

HEVC引入了新的編碼樹單元（CodingTreeUnits）概念，取代掉了存在於視頻編碼中多年的宏塊概念，它的單塊面積大了許多，達到了64x64，但仍然保留了可變大小和可分割特性，最小單元為16x16。單個編碼樹中包含了小的編碼單元，它們可以由四分樹形式呈現，並很快地可以確定下其中的單元是否可被再分割，內部編碼單元最小可以被分割為8x8大小，精細程度仍然是非常高的。

單個編碼單元也可以繼續被切割、分類，可以成為預測單元（Prediction Units），後者可以指示該單元的預測形式，是畫面內預測還是畫面間預測或者甚至是根本沒有變化、可以被跳過的單元；也可以成為轉換單元（Transform Units），它可以做DCT轉換或是量化。

編碼樹單元的引入讓HEVC既可以用大面積單元來提高編碼效率，也可在需要的時候細化，保留更精細的細節。所謂該粗略的地方就粗略，該精細的地方就精細，HEVC在它的幫助下讓碼流的效率更高。

更高效的DCT

既然分塊的最大面積大了，那麼DCT算法也需要跟上才行，HEVC將DCT算法的最大尺寸擴大到了32x32的地步，對於圖像中變化較為平坦的部分，它有著更高的壓縮率。

33種幀內預測方向

還記得上面寫到H.264為4x4宏塊引入了9種幀內預測方向嗎？HEVC直接把這個數字提升到了33種，在靜態圖像的壓制上不僅實現了更高的效率，也實現了更高的精度，這也是它成功殺入靜態圖像編碼市場的一大利器。雖然編碼難度變高了，但只要用硬件編碼器就沒有那麼多問題。

小結：高效編碼，但受困於高額專利費用

相較於AVC，HEVC在高分辨率下的編碼效率又有非常大的提升，舉個實例，同樣一段4K視頻，使用H.264編碼的大小可能會比使用HEVC大出個一倍。這種巨大的進步幅度也使得Blu-ray直接用它作為標準編碼，推出了UHD BD，而它在單幀圖像壓縮上面的改進也讓它擁有勝過JPEG的能力，於是我們看到在移動端，越來越多的設備選擇將其作為默認的視頻、照片輸出編碼。

但是相比起AVC，HEVC的推廣速度慢了很多，一個是它的編解碼難度比H.264高了太多，但這點通過各路硬件編碼器和軟件優化逐漸化解掉了，目前常見的設備基本上支持HEVC的硬件編解碼；第二個就是HEVC高昂的專利費用問題，它並不是一個免費的編碼格式，雖然個人使用它完全沒有問題，但對於想要兼容它的廠商來說，這筆高昂的專利費用足以讓他們卻步，尤其是崇尚自由開放的互聯網市場。於是，我們看到眾多廠商選擇了免費開放的VPx系列編碼，以及系列的後繼者——AV1。

VPx系列與AV1：以免費為賣點

VPx系列編碼實際上已經有很長的歷史了。它的前身是On2 Technologies公司的TrueMotion系列視頻編碼，在開發TrueMotion VP8編碼時，公司被Google收購了。在Google的介入下，VP8從原本的專有技術變成了開放技術，在BSD許可證下面進行開源。

從技術角度來說，VP8採用的技術是類似於H.264的。雖然在我們看到的宣傳中，VP8擁有比H.264更佳的壓縮效率，但在實際應用中，由於它在設計上有一定的瑕疵，表現並不如H.264，最終它雖然進入了Web標準，但也沒見有人用它，反而是由它的幀內壓縮技術提取而成的WebP受到了歡迎。

VP8的表現並不理想，Google很快就推出了它的繼任者——VP9。這次，他們參考的是HEVC，設計目標同樣是高分辨率下的高效編碼。VP9中的一些設計是受到了HEVC的影響的，比如說同樣最大為64x64的超級塊（Super Block）。最終VP9達成的結果是提供了比VP8高達50%的效率提升。看起來它能夠和HEVC比肩了，但是它也遇到了和VP8相似的問題，推廣不開。VP9的應用範圍實際也侷限在Google自家的Youtube中，只能說是缺少實際應用場景。

但很快，一些廠商認識到HEVC高昂專利費用帶來的弊端，他們決定創立一個開放聯盟，推廣開放、免費的媒體編碼標準。這個聯盟就是開放媒體聯盟（

Alliance forOpenMedia），創始成員有Amazon、Cisco、Google、Intel、Microsoft、Mozilla和Netflix這些我們熟悉的大公司，而後加入的還有蘋果、ARM、三星、NVIDIA、AMD這些同樣耳熟能詳的公司。

Google將他們還在開發中的VP10貢獻了出來作為聯盟新編碼的基礎，很快，名為AV1的編碼誕生了。在Facebook的測試中，它分別比VP9和H.264強上34%、46.2%，這次看上去是真的達到HEVC的級別了。

在這兩年中，AV1也確實開始得到廠商們的重視，比如說最近Netflix已經確定了要使用AV1作為主力編碼，而Intel也推出了開源免費的SVT-AV1編碼器，充分利用自家的AVX-512指令集。但是這種聯盟還是相當鬆散的，比如說聯盟成員之一的蘋果，目前對AV1根本是無動於衷，旗下設備中全部轉向HEVC。

不過從Netflix決定使用AV1作為主力編碼這種態度來看，AV1免費、開放的特性還是具有相當的吸引力的。但目前在硬件方面是缺乏對它的支持的，不僅是PC端沒有針對AV1做硬件解碼，數量更多的移動設備也沒有適配，前不久剛有一款宣傳是首個加入對AV1硬件解碼的SoC才發佈。對比起硬件支持較為齊全的HEVC，這將是AV1推廣之路上的一道檻。

未來編碼：VVC

目前MPEG和VCEG已經開始研究HEVC的繼任者了，目前我們知道的信息是，它暫時被命名為Versatile Video Coding（多才多藝視頻編碼），並將會成為H.266。它是面向於未來視頻的編碼，將會支持從4K到16K分辨率的視頻壓縮，並且支持360°視頻，它的目標是在HEVC的基礎上將編碼效能提升一倍。

未來它可能加入的新特性有：更為複雜的編碼單元結構；更大、更細緻的區塊劃分；全局幀參考；更多的幀內預測模式（目前已經有65種）……在複雜度上面，相比HEVC，VVC將會直接高出一個維度。但是國際標準目前面對著以AV1為代表的開放標準的挑戰，很難說他們會不會取消掉部分特性，從而將它正式發佈的時間給提前。

總結：與時俱進

顯示器、電視的分辨率越來越高，網絡帶寬越來越大，設備對於多媒體內容的處理能力越來越強，視頻編碼也一直隨著時代的變化而不斷進步著，但是它的框架從H.261開始就未曾有過重大的變化，只不過每個新編碼都在這個既定框架下利用半導體性能的成長而加入新的更為高效的算法。比起進步並不明顯的音頻編碼，新視頻編碼在帶寬與容量上面提供的節約效果要明顯得多了，甚至更新的編碼在畫質表現上也更有優勢。在不遠的未來，10-bit色深和HDR將會普及，在根本上取代掉還是上世紀標準的SDR內容，為我們帶來更為精彩的視覺體驗。諸如HEVC這樣的編碼實際早已做好了準備，在未來，它們的應用場景甚至將突破視頻領域，就以新的蘋果設備為例，HEVC實際已經成為它的標準編碼格式，通行於圖像和視頻領域中。

另外，根據最新的報告，當前互聯網流量中佔大頭的就是視頻流量，隨著流媒體繼續深入日常生活，用於視頻傳輸的流量只會更大，而互聯網的總體帶寬並不是可以無限提升的，對於內容提供方來說，流量費用也是相當一部分開銷，壓縮效率更好的編碼自然也會受到他們的青睞。實際上，編碼不斷升級這件事情是雙贏的，用戶和內容提供方都可以從中獲利。

由於時間與作者個人能力限制，本篇文章也存在諸多的不足，但我仍然想通過對這些編碼的概述讓更多人瞭解到正確的編碼知識，如果能夠起到拋磚引玉的作用，讓更多人對編碼產生興趣，開始自己的研究，那是最好不過的事情了。

分享到:

閱讀更多 超能網 的文章

關鍵字: 體育電腦技術

沈巍先生雜談（358）說好的快手不倒，陪伴到老呢？個個都是戲精

轉念一想，這種看似不正常的狀態才是正常的，隨著時間的推移，很多過去迷迷糊糊的人慢慢就看清了，是進是退跟著內心走就好，別管什麼善始善終，不要被這種論調道德綁架，過段時間，你覺得可以，再回來就行，開關在你自己手裡，一秒鐘就能完成進退。

出海奮鬥是有膽識後浪的更優選項

東南亞11國，除去東帝汶，其他10國組成東盟。東南亞有多熱，從很多國際資本的快速湧入都有目共睹。養老產業：泰國、越南、菲律賓、馬來西亞、印尼都是大受歐美日韓退休人士歡迎的亞洲養老目的地。

甲有5套房，不上班，收房租；乙有1套房，上班賺工資；丙租房子.

每逢佳節被相親，單身青年看這裡！

“非常戰疫

為珠峰“量身高”，為啥要人上去？

6日，2020珠峰高程測量行動測量登山隊舉行出發儀式，30多名計劃登頂的測量登山隊員當日從海拔5200米的珠峰登山大本營向更高海拔出發，計劃抓住近日的天氣窗口，擇日登頂測量。如果成功，這將成為我國專業測繪人員首次登頂珠峰測高。

我省獲國家局通報表揚

湖南名字最尷尬的城市，90%的人都會想歪，當地人：思想有問題！

湖南省作為中國中南地區的一個省份，經濟強勁，地位獨特，有著十足的發展後勁。湖南經濟總量在全國排名第九。湖南也是華夏文明的發祥地，境內的炎帝陵，成為華夏兒女尋根祭祖的重要場所。南嶽衡山就在湖南衡陽。湖南張家界景區成為馳名中外的旅遊景點。湖南湘西鳳凰古鎮成為中國馳名十大古鎮之一。

超六成前浪點贊《後浪》，全球白手起家90後富豪人均財富190億

再不來一場精緻野餐，我就要被開除中產籍了

《新週刊》創刊於1996年8月18日，由南方出版傳媒股份有限公司主管、主辦，以“中國最新銳的生活方式週刊”為定位，推出過一系列極具影響力的專題報道，是中國期刊市場最具代表性和影響力的雜誌之一，享有“話題策源地”的美譽。

工程師我只服中國，曾經放生到三峽的1萬條魚，如今怎麼樣了？

每一個大項目其實都會面臨一個問題，那就是生態環境，因為所涉及的範圍實在太廣了，所以需要考慮的問題都是多方面的，三峽就是我國早期的一個超大體量的工程，而三峽所涉及的問題也很多。三峽其實一直都是我國的驕傲，但是關於三峽的質疑聲，其實也一點都不少，特別是關於三峽環境方面的質疑聲。

後疫情時代的五個營銷啟示

現象級白酒——李渡高粱酒，作為沉浸式/場景化營銷的開創者，早在幾年前就使用互聯網工具助力，疫情爆發後一系列的操作自然遊刃有餘了，銷量同比增加170%，線上銷量更是增加400%。

丘北縣雙龍營鎮人民政府普者黑村委會、矣則村委會太陽能路燈採購安裝項目競爭性談判公告

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了金子一直是我們中國人比較喜歡投資的一個東西，黃金飾品也是中國女性非常喜歡購買的東西，大家都知道，金子具有保值的功能，所以很多人既喜歡在銀行購買金條用於投資，又喜歡去一些金店購買黃金飾品。

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了大家都會知道，每到夏天，我們的沿海地區都是一個多風多雨的季節，這時候我們出門也是需要隨時帶上雨具，避免突然有暴風雨這些天氣的出現。

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了每次一到假期，就非常害怕到達火車站，可以說是基本上都是人山人海的感覺。很多人會為了方便去選擇去乘坐動車和高鐵。現在我們無論是出差還是去旅遊也都是會選擇去坐動車，又快又方便，主要還會很舒服。

肖戰視頻專訪：眼裡帶著故事，請不要聽說他，這一次，請他說

這是肖戰春節後，經歷過這麼多事後首次參加採訪。視頻中他依然是面帶微笑，依舊是少年的樣子。但是眼裡到這故事，說話也變得小心謹慎，談吐措辭也是越來越嚴謹了。

秦山核電應急行動水平優化項目招標公告

從中國電力集採招標網（www.dljczb.

巴基斯坦SK水電站消防及火災報警系統設備採購招標招標公告

從中國電力集採招標網（www.dljczb.

中煤能源新疆鴻新煤業葦子溝煤礦瓦斯抽採機械設備採購招標公告

從中國電力集採招標網（www.dljczb.

縣域社區團購，在平臺發展上有哪些優勢？

社區團購的迅速發展，已經不再侷限於各大城市中的小區。漸漸的擴大範圍，發展到一些城市邊緣的縣城鄉鎮。像是興盛優選、十薈團、食享會、考拉精選、美家買菜等月流水上億的社區團購頭部企業，都很重視下沉市場的佈局和開拓。

和王為念離婚，與“假奶奶”常香玉對簿公堂，55歲小香玉生活如詩

戲曲是以古代故事以及現代經典故事為題材的藝術表演，也是歷史悠久的綜合舞臺藝術樣式，表演戲曲難度很高，但戲曲人才依舊人才輩出，說起在戲曲圈中的佼佼者，陳百玲必是其一。

眼力測試：由4字組成的白菜，1秒看出4個字的智商都很高

這是一幅白菜圖，由4字組成的，1秒看出4個字的智商都很高！你看出來了嗎？

看圖猜字：這個不簡單，你能猜對幾個？全猜對眼力非凡

這福圖上的圖你能猜對幾個？全猜對眼力非凡，猜對3個眼力160，猜對3個是近視眼！你能猜對幾個字？

眼力測試：火焰中藏了4個字，看出3個算達標，全看出眼力200

熊熊火焰中藏了4個字，看出3個算達標，全看出眼力200！你能全部看出來嗎？

小米硬剛德國雙立人，400年非洲灌木做家用砧板，不發黴砍不壞

民以食為天。

眼力測試：美女圖中藏了5個漢字，全部看出來的眼力超群

這幅美女圖中藏了5個漢字，你能不能看出來是哪幾個漢字呢？全部看出來的眼力超群！

最萌Hodler，剛出生就收到比特幣大學教育基金的寶寶

作為比特幣愛好者，Izabella的父母在她出生當日於《泰晤士報》刊登了一則附帶比特幣地址的小廣告，希望廣大讀者能夠捐出小部分比特幣給他們女兒作為大學教育基金。

《瞭望大灣區》：全國中高風險區域今日“清零”

《晨會解讀》：中山證券投資顧問楊立華：連續上漲過後注意把握好操作節奏

孫鬆峰：幸福生活唱出來

河南市場安全網訊（www.hnscjgw.com）

衡水：守護一湖碧水打造生態之城

長城網衡水訊（記者張梅勝

英國小夥第一次體驗中國網吧，就被電腦屏幕嚇到直言：這是個啥

網吧其實不管是對於哪個國家的人來說，都是極具吸引力的，而在中國對於八九四年的年輕人和學生來說，網吧簡直就是快樂源泉，但是也是老師家長中的眼中釘，肉中刺。相信很多人小時候可能都有過被家長從網吧裡揪出來的不甚美好的回憶。

微商到底多能吹牛！哈哈哈哈哈千萬別屏蔽，每天都是快樂源泉

雖然有的時候在朋友圈裡有很多微商不停的發朋友圈，讓大家覺得有些困擾和煩悶，有一種私生活被侵擾的感覺。但是不要忙著屏蔽他們，有的時候這些總是吹得天花亂墜的微商也能給人們帶來快樂的源泉。

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度

5月6日，2020珠峰高程測量登山隊伍出發儀式正式舉行，30多名隊員當日從海拔5200米的登山大本營向更高海拔出發，開啟珠峰衝頂測量。隊員們力爭抓住近日的天氣窗口，擇日登頂測量。如果成功，這將是我國專業測繪人員首次登頂珠峰測高。

“十大沂蒙工匠”齊玉祥：鋼花璀璨照亮青春之路

一支焊槍、一面防護罩，鋼花白晝繁星，在刺耳的噪聲中點亮四壁，焊工齊玉祥用13年的青春，打磨出了人生最璀璨的鋼花。2007年，齊玉祥畢業後進入山東華源鍋爐有限公司工作。剛進公司沒多久，由於工作需要，他被分配到了焊接崗位。

日本的丈母孃，賣萌發嗲也是蠻有技術的

國內這點估計是比不過了

消費水平最高的5座城市，北上廣深均在列，另一座你知道是哪嗎？

我們都知道在地大物博的中國，擁有很多城市，而它們之間的等級劃分也都是不同的，等級越高，往往消費就會越高，那麼說起國內消費水平最高的幾座城市，夥伴們都知道是哪裡嗎？接下來就讓小編帶大家去了解一下吧，看看有沒有你心中的那個。

德國愛他美怎麼樣？"斷貨王"愛他美值得買嗎？

哈哈。每次都會用iGepir 姐姐推薦來的，小寶從6個月混養喝起，現在快1歲半了，一直喝愛他美，不上火，購入量大，也算全心全意支持國際媽咪了

廣東有望合併的3座城市：合併成功後，將誕生一座千萬人口的城市

相信大家都知道，目前廣東是中國經濟實力最強的城市，哪怕是國內富有的浙江和江蘇，在經濟上也被廣東牢牢按住。你要知道廣東可是中國唯一有一線城市的省份，而且還是兩座。光靠這一點就能讓全國所有的省份羨慕，但比較遺憾的是，廣東的經濟發展似乎並不平衡。

國外奶粉怎麼樣？去哪買靠譜？線下實體店一定比網店安全嗎？

之前買的一直是國際媽咪的海外倉，但是疫情的緣故怕被吧斷糧所以在海外倉直郵了一箱又在自貿倉補了一箱，反正奶粉是消耗品，不擔心吃不完hhh。自貿倉物流速遞還是很快的，重慶保稅區發貨，4天到達。

四川潛力大的城市：還是重要的恐龍化石產地，被譽為“恐龍之鄉”

對此有的網友說:很多人可能不知道，其實我們自貢還有飛機制造，汽車製造，新能源汽車，及新能源電池研發與製造產業，雖然剛起步，但未來可期!

00後，吾輩當自強

當記者採訪她時，她說了一句讓人永生難忘的話:“其實我們並不是什麼逆行者，只不過是一些普通人在堅守自己的使命。

“我來！”

十天，我應該可以讀完一本《百年孤獨》，應該可以學會用吉他彈一首歌，還應該可以追完一部電視劇《慶餘年》。

東北唯一新一線城市：被譽為“東方魯爾”，經濟卻不如省內地級市

眾所周知這幾年東北的經濟，確實沒有以前增長得那麼快了。原因相信大家也很清楚，簡單點說就是南方更適合發展經濟。因此中國的經濟重心向南移動，所以在未來的幾年甚至幾十年裡面，中國南方的經濟都會比北方強。特別是廣東省跟浙江省的經濟水平，目前已經超越世界上大部分國家了。

人生有尺，做人有度

“救命錢”變“唐僧肉” 扶貧最後一公里處“蠅貪”頻現！

家境殷實的90後海歸女為何“沉迷”偷快遞？

青春洋溢，不加過分修飾，真實的少女感，你喜歡嗎？

4名網友預謀綁架一董事長，匯合後劇情突變……

江蘇的第二個“蘇州”，並非南京和無錫，而是這座低調的城市

說起蘇州的大名，相信是無人不知，無人不曉的，作為我國名副其實的最強地級市，蘇州近些年屬實為人們帶來了很大驚喜，甚至在經濟發展上也已經遠超省會南京，而今天小編要為大家帶來的則是江蘇境內的“第二個蘇州”，發展潛力巨大，並非南京和無錫，而是這座十分低調的城市。

超能課堂(220)：數字視頻編碼的發展歷程

為什麼我們需要對視頻進行壓縮編碼？

前藍光時代的視頻編碼發展之路

H.261：引入各種特性，奠定現代視頻編碼基礎

宏塊與基於運動補償的幀間預測

DCT算法

小結：創立混合編碼框架，有里程碑意義

MPEG-1 Part 2：引入幀類型概念，成為VCD標準

引入雙向預測幀（B幀）

引入幀序列（GroupofPictures）

亞像素精度的運動補償

小結：成功接棒

MPEG-2 Part 2/H.262：DVD與（前）數字電視標準

支持隔行掃描

面向高碼率和標清、高清晰度

小結：曾經最為通用的視頻編碼

H.263：FLV與3GP的好搭檔

MPEG-4 Part 2：特性很多，實現很多

其他編碼

MJPEG

RealMedia

WMV

藍光時代標準之爭

AVC/H.264：集大成者一統江湖

更靈活的宏塊劃分方法

數量更多的參考幀

更先進的幀內壓縮

CABAC

小結：巨大的改變帶來的是巨大的成功

VC-1：失敗的挑戰者

UHD與流媒體時代，新的編碼興起

HEVC/H.265/MPEG-H Part 2：視頻編碼王位繼任者

代替宏塊的編碼樹單元

更高效的DCT

33種幀內預測方向

小結：高效編碼，但受困於高額專利費用

VPx系列與AV1：以免費為賣點

未來編碼：VVC

總結：與時俱進

相關文章:

沈巍先生雜談（358）說好的快手不倒，陪伴到老呢？個個都是戲精

出海奮鬥是有膽識後浪的更優選項

甲有5套房，不上班，收房租；乙有1套房，上班賺工資；丙租房子.

每逢佳節被相親，單身青年看這裡！

為珠峰“量身高”，為啥要人上去？

我省獲國家局通報表揚

湖南名字最尷尬的城市，90%的人都會想歪，當地人：思想有問題！

超六成前浪點贊《後浪》，全球白手起家90後富豪人均財富190億

再不來一場精緻野餐，我就要被開除中產籍了

工程師我只服中國，曾經放生到三峽的1萬條魚，如今怎麼樣了？

後疫情時代的五個營銷啟示

丘北縣雙龍營鎮人民政府普者黑村委會、矣則村委會太陽能路燈採購安裝項目競爭性談判公告

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了

肖戰視頻專訪：眼裡帶著故事，請不要聽說他，這一次，請他說

秦山核電應急行動水平優化項目招標公告

巴基斯坦SK水電站消防及火災報警系統設備採購招標招標公告

中煤能源新疆鴻新煤業葦子溝煤礦瓦斯抽採機械設備採購招標公告

縣域社區團購，在平臺發展上有哪些優勢？

和王為念離婚，與“假奶奶”常香玉對簿公堂，55歲小香玉生活如詩

眼力測試：由4字組成的白菜，1秒看出4個字的智商都很高

看圖猜字：這個不簡單，你能猜對幾個？全猜對眼力非凡

眼力測試：火焰中藏了4個字，看出3個算達標，全看出眼力200

小米硬剛德國雙立人，400年非洲灌木做家用砧板，不發黴砍不壞

眼力測試：美女圖中藏了5個漢字，全部看出來的眼力超群

最萌Hodler，剛出生就收到比特幣大學教育基金的寶寶

《瞭望大灣區》：全國中高風險區域今日“清零”

《晨會解讀》：中山證券投資顧問楊立華：連續上漲過後注意把握好操作節奏

孫鬆峰：幸福生活唱出來

衡水：守護一湖碧水 打造生態之城

英國小夥第一次體驗中國網吧，就被電腦屏幕嚇到直言：這是個啥

微商到底多能吹牛！哈哈哈哈哈千萬別屏蔽，每天都是快樂源泉

2020珠峰高程複測出發儀式今日舉行 小米10全程助力丈量世界新高度

“十大沂蒙工匠”齊玉祥：鋼花璀璨照亮青春之路

日本的丈母孃，賣萌發嗲也是蠻有技術的

消費水平最高的5座城市，北上廣深均在列，另一座你知道是哪嗎？

德國愛他美怎麼樣？"斷貨王"愛他美值得買嗎？

廣東有望合併的3座城市：合併成功後，將誕生一座千萬人口的城市

國外奶粉怎麼樣？去哪買靠譜？線下實體店一定比網店安全嗎？

衡水：守護一湖碧水打造生態之城

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度