視頻編碼與封裝

NO IMAGE

隨著多媒體技術和網絡通信技術的快速發展,視頻多媒體應用已經覆蓋了大眾生活的方方面面。尤其是近年來高清和超高清視頻應用越來越廣泛,相比於標清視頻,高清視頻分辨率更高、畫面更清晰,其數據量也更大。如果未經壓縮,這些視頻將很難應用於實際的存儲和傳輸。這裡我們就要提到視頻應用中的一項關鍵技術——視頻壓縮編碼技術

視頻壓縮編碼技術可以有效地去除視頻數據中冗餘信息,實現視頻數據在互聯網中快速傳輸和離線存儲

視頻技術起源於第二次工業革命,隨著視頻技術的發展,一系列的視頻編碼標準被研發被使用。

壓縮標準的變遷

目前已有的視頻壓縮標準有很多種,包括國際標準化組織(International Organization for Standardization, ISO)/國際電工技術委員會(International Electrotechnical Commission, IEC)制定的MPEG-1、MPEG-2、MPEG-4標準,國際電信聯盟電信標準化部門(International Telecommunication Union-Telecom, ITU-T)制定的H.261、H.263

2003年3月,ITU-T和ISO/IEC 正式公佈了H.264/MPEG-4 AVC視頻壓縮標準。H.264作為目前應用最為廣泛的視頻編碼標準,在提高編碼效率和靈活性方面取得了巨大成功,使得數字視頻有效地應用在各種各樣的網絡類型和工程領域。為了在關鍵技術上不受國外牽制,同時也不用交大量的專利費用,中國也制定了AVS系列標準,可以提供與H.264/AVC相當的編碼效率。

隨著用戶體驗的升級,更高碼率的視頻也在被提供,比如超高清(3840 x 2160)。相對於標清視頻,其分辨率更高,數據量也更多。在存儲空間和網絡帶寬有限的情況下,現有的視頻壓縮技術已經不能滿足現實的應用需求。為了解決高清及超高清視頻急劇增長的數據率給網絡傳輸和數據存儲帶來的衝擊ITU-T和ISO/IEC聯合制定了具有更高的壓縮效率的新一代視頻壓縮標準HEVC(High Efficiency Video Coding)

HEVC簡單介紹


HEVC:新一代視頻壓縮標準,以傳統的混合視頻編碼為框架,並採用了更多的技術創新,包括靈活的塊劃分方式、更精細的幀內預測、新加入的Merge模式、Tile劃分、自適應樣點補償等

這些技術一方面使得HEVC編碼性能比H.264/AVC提高了一倍,另一方面也將編碼複雜度大大增加,不利於HEVC的應用和推廣

在這裡著重說一下塊劃分方式——對編碼性能提升最大。塊劃分包括編碼單元(CU)、預測單元(PU)和變換單元(TU)。但是,遞歸的對每個編碼單元進行率失真優化過程(RDO)來選擇最優的模塊劃分的複雜度很高,其需要巨大的計算複雜度。因此降低HEVC編碼複雜度的是視頻行業人員所希望看到的。

視頻編碼與封裝

圖1 視頻編碼框圖

新一代編碼器對比

視頻編碼與封裝

常見的封裝格式有以下幾種:


· AVI(Audio Video Interleave):只能封裝一條視頻軌和音頻軌,不能封裝文字,沒有任何控制功能,因而也就無法實現流媒體,其文件擴展名是.avi。

· WMV(Windows Media Video):具有數字版權保護功能,其文件擴展名是.wmv/.asf。

· MPEG(Moving Picture Experts Group):可以支持多個視頻、音軌、字幕等,控制功能豐富,其文件擴展名是.mp4。

· Matroxska:提供非常好的交互功能,比MPEG更強大,其文件擴展名是.mkv。

· QuickTime File Farmat:由Apple開發,可存儲內容豐富,支持視頻、音頻、圖片、文字等,其文件擴展名是.mov。

· FLV(Flash Video):由Adobe Flash延伸而來的一種視頻技術,主要用於網站。

· TS流(Transport Stream):傳輸流,將具有共同時間基準或獨立時間基準的一個或多個PES組合(複合)而成的單一數據流(用於數據傳輸)。目前TS流廣泛應用於廣播電視中,如機頂盒等。

總結

本文簡單介紹了視頻的編碼與封裝,其是視頻通信中重要的一步,如果這一步出了問題,很容易導致視頻無法被讀取或無法播放的狀態。下一節,我們將來說一下視頻通信中的音視頻處理技術

相關文章

CVPR2018|圖鴨科技榮獲圖像壓縮挑戰賽冠軍

深度學習圖像視頻壓縮算法——TNG

視頻通信中音視頻處理技術

深度學習之圖像超分辨重建技術