NO IMAGE

餘科亮

本文僅討論靜止影象的壓縮基本演算法,影象壓縮的目的在於以較少的資料來
表示影象以節約儲存費用,或者傳輸時間和費用。
JPEG壓縮演算法可以用失真的壓縮方式來處理影象,但失真的程度卻是肉眼所
無法辯認的。這也就是為什麼JPEG會有如此滿意的壓縮比例的原因。
下面主要討論,JPEG基本壓縮法。
一.JPEG壓縮過程

JPEG壓縮分四個步驟實現:
1.顏色模式轉換及取樣;
2.DCT變換;
3.量化;
4.編碼。

二.1.顏色模式轉換及取樣

RGB色彩系統是我們最常用的表示顏色的方式。JPEG採用的是YCbCr色彩系統。
想要用JPEG基本壓縮法處理全綵色影象,得先把RGB顏色模式影象資料,轉換為
YCbCr顏色模式的資料。Y代表亮度,Cb和Cr則代表色度、飽和度。通過下列計算
公式可完成資料轉換。
Y=0.2990R 0.5870G 0.1140B
Cb=-0.1687R-0.3313G 0.5000B 128
Cr=0.5000R-0.4187G-0.0813B+128
人類的眼晴對低頻的資料比對高頻的資料具有更高的敏感度,事實上,人類
的眼睛對亮度的改變也比對色彩的改變要敏感得多,也就是說Y成份的資料是比較
重要的。既然Cb成份和Cr成份的資料比較相對不重要,就可以只取部分資料來處
理。以增加壓縮的比例。JPEG通常有兩種取樣方式:YUV411和YUV422,它們所代
表的意義是Y、Cb和Cr三個成份的資料取樣比例。

2.DCT變換

DCT變換的全稱是離散餘弦變換(Discrete Cosine Transform),是指將一組
光強資料轉換成頻率資料,以便得知強度變化的情形。若對高頻的資料做些修飾,
再轉回原來形式的資料時,顯然與原始資料有些差異,但是人類的眼睛卻是不容
易辨認出來。
壓縮時,將原始影象資料分成8*8資料單元矩陣,例如亮度值的第一個矩陣內
容如下:

JPEG將整個亮度矩陣與色度Cb矩陣,飽和度Cr矩陣,視為一個基本單元稱作
MCU。每個MCU所包含的矩陣數量不得超過10個。例如,行和列取樣的比例皆為4:
2:2,則每個MCU將包含四個亮度矩陣,一個色度矩陣及一個飽和度矩陣。
當影象資料分成一個8*8矩陣後,還必須將每個數值減去128,然後一一代入
DCT變換公式中,即可達到DCT變換的目的。影象資料值必須減去128,是因為DCT
轉換公式所接受的數字範圍是在-128到 127之間。
DCT變換公式:

x,y代表影象資料矩陣內某個數值的座標位置
f(x,y)代表影象資料矩陣內的數個數值
u,v代表DCT變換後矩陣內某個數值的座標位置
F(u,v)代表DCT變換後矩陣內的某個數值
u=0 且 v=0 c(u)c(v)=1/1.414
u>0 或 v>0 c(u)c(v)=1
經過DCT變換後的矩陣資料自然數為頻率係數,這些係數以F(0,0)的值最
大,稱為DC,其餘的63個頻率係數則多半是一些接近於0的正負浮點數,一概稱
之為AC。
3、量化
影象資料轉換為頻率係數後,還得接受一項量化程式,才能進入編碼階段。
量化階段需要兩個8*8矩陣資料,一個是專門處理亮度的頻率係數,另一個則是
針對色度的頻率係數,將頻率係數除以量化矩陣的值,取得與商數最近的整數,
即完成量化。
當頻率係數經過量化後,將頻率係數由浮點數轉變為整數,這才便於執行最
後的編碼。不過,經過量化階段後,所有資料只保留整數近似值,也就再度損失
了一些資料內容,JPEG提供的量化表如下:

4、編碼
Huffman編碼無專利權問題,成為JPEG最常用的編碼方式,Huffman編碼通常
是以完整的MCU來進行的。
編碼時,每個矩陣資料的DC值與63個AC值,將分別使用不同的Huffman編碼
表,而亮度與色度也需要不同的Huffman編碼表,所以一共需要四個編碼表,才
能順利地完成JPEG編碼工作。
DC編碼
DC是彩採用差值脈衝編碼調製的差值編碼法,也就是在同一個影象分量中取
得每個DC值與前一個DC值的差值來編碼。DC採用差值脈衝編碼的主要原因是由於
在連續色調的影象中,其差值多半比原值小,對差值進行編碼所需的位數,會比
對原值進行編碼所需的位數少許多。例如差值為5,它的二進位制表示值為101,如
果差值為-5,則先改為正整數5,再將其二進位制轉換成1的補數即可。所謂1的補
數,就是將每個Bit若值為0,便改成1;Bit為1,則變成0。差值5應保留的位數
為3,下表即列出差值所應保留的Bit數與差值內容的對照。

在差值前端另外加入一些差值的霍夫曼碼值,例如亮度差值為5(101)的位
數為3,則霍夫曼碼值應該是100,兩者連線在一起即為100101。下列兩份表格分
別是亮度和色度DC差值的編碼表。根據這兩份表格內容,即可為DC差值加上霍夫
曼碼值,完成DC的編碼工作。

AC編碼
AC編碼方式與DC略有不同,在AC編碼之前,首先得將63個AC值按Zig-zag排
序,即按照下圖箭頭所指示的順序串聯起來。

63個AC值排列好的,將AC係數轉換成中間符號,中間符號表示為RRRR/SSSS,
RRRR是指第非零的AC之前,其值為0的AC個數,SSSS是指AC值所需的位數,AC系
數的範圍與SSSS的對應關係與DC差值Bits數與差值內容對照表相似。
如果連續為0的AC個數大於15,則用15/0來表示連續的16個0,15/0稱為ZRL
(Zero Rum Length),而(0/0)稱為EOB(Enel of Block)用來表示其後所
剩餘的AC係數皆等於0,以中間符號值作為索引值,從相應的AC編碼表中找出適
當的霍夫曼碼值,再與AC值相連即可。
例如某一組亮度的中間符為5/3,AC值為4,首先以5/3為索引值,從亮度AC
的Huffman編碼表中找到1111111110011110霍夫曼碼值,於是加上原來100(4)
即是用來取[5,4]的Huffman編碼1111111110011110100,[5,4]表示AC值為4的
前面有5個零。
由於亮度AC,色度AC霍夫曼編碼表比較長,在此省略去,有興趣者可參閱相
關書籍。
實現上述四個步驟,即完成一幅影象的JPEG壓縮。

參考資料
[1] 林福宗 《影象檔案格式(上)——Windows 程式設計》,清華大學出版社,
1996年
[2] 李振輝、李仁各編著,《探索影象檔案的奧祕》,清華大學出版社,1996年
[3] 黎洪鬆、成實譯《JPEG靜止資料壓縮標準》,學苑出版社,1996年