QRCode二維碼總結

 

QR碼生成原理-QR Code(ISO 18004)編碼方式

一、什麼是QR碼

QR碼屬於矩陣式二維碼中的一個種類,由DENSO(日本電裝)公司開發,由JIS和ISO將其標準化。QR碼的樣子其實在很多場合已經能夠被看到了


1. 位置探測圖形、位置探測圖形分隔符:用於對二維碼的定位,對每個QR碼來說,位置都是固定存在的,只是大小規格會有所差異;這些黑白間隔的矩形塊很容易進行影象處理的檢測。 

2. 校正圖形:根據尺寸的不同,矯正圖形的個數也不同。矯正圖形主要用於QR碼形狀的矯正,尤其是當QR碼印刷在不平坦的面上,或者拍照時候發生畸變等。

3. 定點陣圖形:這些小的黑白相間的格子就好像座標軸,在二維碼上定義了網格。

4. 格式資訊:表示該二維碼的糾錯級別,分為L、M、Q、H; 

 5. 資料區域:使用黑白的二進位制網格編碼內容。8個格子可以編碼一個位元組。

6. 版本資訊:即二維碼的規格,QR碼符號共有40種規格的矩陣(一般為黑白色),從21×21(版本1),到177×177(版本40),每一版本符號比前一版本 每邊增加4個模組。 

 7. 糾錯碼字:用於修正二維碼損壞帶來的錯誤。

2.2 QR二維碼的識別原理 

 2.2.1定位  手機拍攝QR 碼影象時,可能會同時採集到條碼周圍其他的影象。這些干擾影象會增加影象處理的複雜度,因此,可以把這些沒必要的干擾影象通過裁切的方式去除。校正後,直接對正方形A’B’C’D’外的區域裁切,就可以去除其餘背景。 QR 碼符號中有3 個位置探測圖形,分別位於符號影象4 個角中的3 個角,每個  4  位置探測影象都是由固定深淺顏色的模組組成。模組深淺顏色順序為深色—淺色—深色—淺色—深色,各元素寬度的比例為1∶ 1∶ 3∶ 1∶ 1(如下圖所示)。

 

即使影象有旋轉,位置探測影象的模組顏色順序和寬度比例也不變。對二值化後的影象按行、列分別逐點掃描,把同一灰度級的相鄰畫素記錄為線段。如果有5 段線段的長度比例符合1∶ 1∶ 3 ∶ 1 ∶ 1,且深淺顏色順序為深—淺—深—淺—深,則記錄該線段。掃描完後,把行相鄰的線段分為1 組,去除與所有線段都不相鄰的行線段( 可能是隨機的干擾線段) 。同樣處理列線段,把行線段組和列線段組中相互交叉的組分類,求出交叉的行、列線段組的中心點,即為位置探測圖形的中心。      2.2.2 預處理  基本原理:QR 碼作為手機二維碼,其應用模式如下圖所示。手機等智慧裝置通過攝像頭採集帶有條碼符號的影象,對影象進行灰度化、二值化、旋轉校正等預處理,進行條碼檢測。如果檢測到非QR
碼,則重新採集; 如果是QR 碼,則進行影象資訊的取樣。用Reed - Solomon 碼的譯碼演算法對取到的資料進行糾錯譯碼,統計出現的錯誤數量。如果錯誤數量超出糾錯容量,則糾錯譯碼失敗,重新採集影象; 如果可以正確進行糾錯譯碼,則把糾錯後的資訊進行各種資料模式下的譯碼,恢復出編碼資訊,繼而根據應用模式進行資訊輸出、傳送簡訊或網址跳轉等後續處理。

二、QR碼的特點

說到QR碼的特點:

一)是高速讀取(QR就是取自“Quick Response”的首字母),對讀取速度的體驗源自於我手機上的一個軟體,象上面貼出的碼圖,通過攝像頭從拍攝到解碼到顯示內容也就三秒左右,對攝像的角度也沒有什麼要求;

二)是高容量、高密度;理論上內容經過壓縮處理後可以存7089個數字,4296 個字母和數字混合字元,2953個8位位元組資料,1817個漢字;

三)是支援糾錯處理;糾錯處理相對複雜,目前我還沒有深入瞭解,按照QR碼的標準文件說明,QR碼的糾錯分為4個級別,分別是:

level L : 最大 7% 的錯誤能夠被糾正;

level M : 最大 15% 的錯誤能夠被糾正;

level Q : 最大 25% 的錯誤能夠被糾正;

level H : 最大 30% 的錯誤能夠被糾正;

四)是結構化;看似無規則的圖形,其實對區域有嚴格的定義,下圖就是一個模式2、版本1的QR圖結構(關於QR碼的”模式”、”版本”將在後面進行介紹):

QR碼生成原理-QR <wbr>Code(ISO <wbr>18004)編碼方式

在上圖21*21的矩陣中,黑白的區域在QR碼規範中被指定為固定的位置,稱為尋像圖形(finder pattern) 和 定點陣圖形(timing pattern)。尋像圖形和定點陣圖形用來幫助解碼程式確定圖形中具體符號的座標。

黃色的區域用來儲存被編碼的資料內容以及糾錯資訊碼。

藍色的區域,用來標識糾錯的級別(也就是Level L到Level H)和所謂的”Mask pattern”,這個區域被稱為“格式化資訊”(format information)。

五)是擴充套件能力。QR碼的Structure Append特點,使一個QR碼可以分解成多個QR碼,反之,也可以將多個QR碼的資料組合到一個QR碼中來:

QR碼生成原理-QR <wbr>Code(ISO <wbr>18004)編碼方式

 

三、QR碼的模式和版本

前面提到過QR碼的模式(Model)和版本(Version)。QR碼分為Model1和Model2兩種模式,Model1是對QR的初始定義,Model2是對Model1的擴充套件,目前使用較為普遍的是Model2,本文的所有說明也僅用於Model2。

QR圖的大小(size)被定義為版本(Version),版本號從1到40。版本1就是一個21*21的矩陣,每增加一個版本號,矩陣的大小就增 加4個模組(Module),因此,版本40就是一個177*177的矩陣。(版本越高,意味著儲存的內容越多,糾錯能力也越強)。

 

三、QR碼支援的編碼內容

QR碼支援編碼的內容包括純數字、數字和字元混合編碼、8位位元組碼和包含漢字在內的多位元組字元。其中:

數字:每三個為一組壓縮成10bit。

字母數字混合:每兩個為一組,壓縮成11bit。

8bit位元組資料:無壓縮直接儲存。

多位元組字元:每一個字元被壓縮成13bit。

 

QR碼編碼原理(編碼)

 

編碼就是把常見的數字、字元等轉換成QR碼的方法。說具體的編碼之前,先說一下QR碼的最大容量問題。

一、最大容量

QR碼的最大容量取決於選擇的版本、糾錯級別和編碼模式(Mode:數字、字元、多位元組字元等)。以版本1、糾錯級別為Level Q的QR碼為例,可以儲存27個純數字,或17個字母數字混合字元或11個8bit位元組資料。如果要儲存同樣多的內容同時提高糾錯級別,則需要採用更高的版本。版本1~9 資料容量、糾錯碼容量對照如下表:

版本

(error correcting level)

(count of data code words)

count of EC code words

(numeric)

(alphanumeric)

8bit

1

L

19

7

41

25

17

M

16

10

34

20

14

Q

13

13

27

16

11

H

9

17

17

10

7

2

L

34

10

77

47

32

M

28

16

63

38

26

Q

22

22

48

29

20

H

16

28

34

20

14

3

L

55

15

127

77

53

M

44

26

101

61

42

Q

34

36

77

47

32

H

26

44

58

35

24

4

L

80

20

187

114

78

M

64

36

149

90

62

Q

48

52

111

67

46

H

36

64

82

50

34

5

L

108

26

255

154

106

M

86

48

202

122

84

Q

62

72

144

87

60

H

46

88

106

64

44

6

L

136

36

322

195

134

M

108

64

255

154

106

Q

76

96

175

108

74

H

60

112

139

84

58

7

L

156

40

370

224

154

M

124

72

293

178

122

Q

88

108

207

125

86

H

66

130

154

93

64

8

L

194

48

461

279

192

M

154

88

365

221

152

Q

110

132

259

157

108

H

86

156

202

122

84

9

L

232

60

552

335

230

M

182

110

432

262

180

Q

132

160

312

189

130

H

100

192

235

143

98

如果要了解更詳細的QR碼容量資訊,可以到電裝的網站去看看:

http://www.denso-wave.com/qrcode/vertable1-e.html

 

下面,就舉例說明將“ABCDE123”轉換成為版本1、Level H的QR碼轉換方法。

二、模式識別符號(Mode Indicator)

QR碼的模式(Mode)就是前文提到的數字、字元、8bit 位元組碼、多位元組碼等。對於不同的模式,都有對應的模式識別符號(Mode Indicator)來幫助解碼程式進行匹配,模式識別符號是4bit的二進位制數:

1、數字模式(numeric mode ): 0001

2、混合字元模式(alphanumeric mode) : 0010

3、8bit byte mode: 0100

4、日本漢字(KANJI mode) : 1000

5、中國漢字(GB2312):1101

由於示例文字串是混合字元,因此將選擇alphanumeric mode,其標識碼為:0010

三、文字串計數識別符號(Character count indicator)

文字串計數識別符號用來儲存源內容字串的長度,在版本1-9的QR碼中,文字串長度識別符號自身的長度被定義為:

數字 : 10bit

混合字元 : 9bit

8bit 位元組碼 : 8bit

多位元組碼 : 8bit

在本例中,源文字串的長度為8個字元,混合字元的長度為9bit,因此將字元個數8編碼為9位二進位制表示:000001000

加上混合字元模式標識碼,總的編碼為0010 000001000

四、資料內容編碼

 1、數字模式下的編碼

在數字模式下,資料被限制為3個數字一段,分成若干段。如:”123456″ 將分成”123″ 和 “456”,分別被編碼成10bit的二進位制數。“123”的10bit二進位制表示法為:0001111011,實際上就是二進位制的123。

當資料的長度不足3個數字時,如果只有1個數字則用4bit,如果有2個數字就用7個bit來表示。
如:”9876″被分成”987″和”6″兩段,因此被表示為”1111011011 0110″。

2、混合字元模式下的編碼

混合字元模式編碼,其字元對照表如下:

0

 0

 

 A

 10

 

 K

 20

 

 U

 30

 

 

 40

1

1

 

B

11

 

L

21

 

V

31

 

41

2

2

 

C

12

 

M

22

 

W

32

 

.

42

3

3

 

D

13

 

N

23

 

X

33

 

/

43

4

4

 

E

14

 

O

24

 

Y

34

 

:

44

5

5

 

F

15

 

P

25

 

Z

35

6

6

 

G

16

 

Q

26

 

[sp]

36

7

7

 

H

17

 

R

27

 

$

37

8

8

 

I

18

 

S

28

 

%

38

9

9

 

J

19

 

T

29

 

*

3

 

編碼方式為:

原始碼被分成兩個字元一段,如下所示,每段的第一個字元乘上45,再用第二個數字相加。因此每段變成了11bit的2進位制碼,如果字元個數只有1個,則用6bit表示。

 

示例:

 

 

 

“AB”

“CD”

“E1”

“23”

 

 

45*10 11

45*12 13

45*14 1

45*2 3

 

 

461

553

631

93

0010

000001000

00111001101

01000101001

01001110111

00001011101

 

3、8bit位元組資料不經編碼轉換直接儲存。

五、編碼終止符(Terminator)

如果編碼後的字元長度不足當前版本和糾錯級別所儲存的容量,則在後續補”0000″,如果容量已滿則無需新增終止符。此時得到的編碼串為:

0010 000001000 00111001101 01000101001 01001110111 00001011101 0000

六、編成8bit碼字(Code words)

將以上的編碼再按8bit一組,形成碼字(code words):

 00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000

如果尾部資料不足8bit,則在尾部充0:

00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000

如果編碼後的資料不足版本及糾錯級別的最大容量,則在尾部補充 “11101100” 和”00010001″,直到全部填滿。最後,版本1、Level H下的”ABCDE123″ 的QR碼是:

00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000 11101100

十進位制表示法為:

32 65 205 69 41 220 46 128 236

 

QR碼編碼原理(日本漢字和中文編碼)

 

一、日本漢字(KANJI)是兩個位元組表示的字元碼,編碼的方式是將其轉換為13位元組的二進位制碼制。

轉換步驟為:

1、對於JIS值為8140(hex) 到9FFC(hex)之間字元:

a)將待轉換的JIS值減去8140(hex);

b)將高位位元組乘以C0(hex);

c)將b)步驟生成的資料加上低位位元組;

d)將結果轉換為13位二進位制串。

2、對於JIS值為E040(hex)到EBBF(hex)之間的字元:

a)將待轉換的JIS值減去C140(hex);

b)將高位位元組乘以C0(hex);

c)將b)步驟生成的資料加上低位位元組;

d)將結果轉換為13位二進位制串。

 

二、中文漢字的與日文漢字轉換步驟相似:

1、對於第一位元組為0xA1~0xAA之間,第二位元組在0xA1~0xFE之間字元:

a)第一位元組減去0xA1;

b)上一步結果乘以0x60;

c)第二位元組減去0xA1;

d)將b)步驟的結果加上c步驟的結果;

e)將結果轉換為13位二進位制串。

1、對於第一位元組為0xB0~0xFA之間,第二位元組在0xA1~0xFE之間字元:

a)第一位元組減去0xA6;

b)上一步結果乘以0x60;

c)第二位元組減去0xA1;

d)將b)步驟的結果加上c步驟的結果;

e)將結果轉換為13位二進位制串。

 

掩模

眾所周知,為了增加QR碼閱讀的可靠性,最好均衡地安排深色與淺色模組。應儘可能避免類似“位置探測圖形”的點陣圖1011101出現在符號的其他區域。

為了滿足上述條件,應按以下步驟進行掩模:

1)掩模不用於功能圖形;
2)用多個矩陣圖形連續地對已知的編碼區域的模組圖形(格式資訊和版本資訊除外)進行XOR操作。XOR操作將模組圖形依次放在每個掩模圖形上,並將對應於掩模圖形的深色模組的模組取反(淺色變成深色,或相反);
3)對每個結果圖形的不合要求的部分記分,以評估這些結果;
4)選擇得分最低的圖形。

下表給出了掩模圖形的參考(放置於格式資訊中的二進位制參考)和掩模圖形生成的條件。掩模圖形是通過將編碼區域(不包括為格式資訊和版本資訊保留的部分)內那些條件為真的模組定義為深色而產生的。所示的條件中,i代表模組的行位置,j代表模組的列位置,(i,j)=(0,0)代表符號中左上角的位置。

碼中

圖1   掩模圖形參考及條件

QRCode

圖2   QRCode的八種掩模方案

掩模

圖3  掩模結果(版本1符號的所有的掩模圖形,用掩模圖形參考000到111的掩模結果)。

下圖為掩模過程:

二維

圖4  符號的掩模過程

罰點記分:

在依次用每一個掩模圖形進行掩模操作之後,要通過對每一次如下情況的出現進行罰點記分,以便對每一個結果進行評估,分數越高,其結果越不可用。在下表中,N1到N4為對不好的特徵所罰分數的權重(N1=3,N2=3,N3=40,N4=10),i為緊鄰的顏色相同模組數大於5的次數,k為符號深色模組所佔比率離50%的差距,步長為5%。雖然掩模操作僅對編碼區域進行,不包括格式資訊,但評價是對整個符號進行的。

最終,應選擇掩模結果中罰分最低的掩模圖形用於符號掩模。

二維

圖5   罰點記分表