Android 解析XML檔案的三種方式 DOM,SAX,PULL

NO IMAGE

我是通過參考:http://www.cnblogs.com/zhangdongzi/archive/2011/04/14/2016434.html

在XML操作過程中,我們經常會想如何去處理它,在Android平臺下,有三種解析XML檔案的方式。

第一種是DOM,它的特點是一次全部載入,如果對於資料量小的情況下,它的效率還可以,如果XML檔案很大的情況下,速度就會慢起來。

在androd手機中處理xml資料時很常見的事情,通常在不同平臺傳輸資料的時候,我們就可能使用xml,xml是與平臺無關的特性,被廣泛運用於資料通訊中,那麼在android中如何解析xml檔案資料呢?

 通常有三種方式:DOM,SAX,PULL

 在這一節中我們使用DOM方式來處理。

 DOM方式解析xml是先把xml文件都讀到記憶體中,然後再用DOM API來訪問樹形結構,並獲取資料的,但是這樣一來,如果xml檔案很大呢?手機CPU處理能力當然不能與PC機器比,因此在處理效率方面就相對差了,當然這是對於其他方式處理xml文件而言。

 解析xml文件,當然必須有xml文件檔案啦,我自己胡亂弄了一個river,放在assets目錄.如下: 

 
第二種方式:
我們使用DOM方式解析xml文件,該方式比較符合我們日常思維方式,容易上手,但是它直接把文件調入記憶體中,比較耗記憶體。在這裡我們可以用另外一種方式解析xml,這個就是SAX方式。

SAX即是:Simple API for XML

SAX是基於事件驅動的。當然android的事件機制是基於回撥函式的,在用SAX解析xml文件時候,在讀取到文件開始和結束標籤時候就會回撥一個事件,在讀取到其他節點與內容時候也會回撥一個事件。

既然涉及到事件,就有事件源,事件處理器。在SAX介面中,事件源是org.xml.sax包中的XMLReader,它通過parser()方法
來解析XML文件,併產生事件。事件處理器是org.xml.sax包中ContentHander、DTDHander、ErrorHandler,以
及EntityResolver這4個介面

XMLReader通過相應事件處理器註冊方法setXXXX()來完成的與ContentHander、DTDHander、ErrorHandler,以及EntityResolver這4個介面的連線,詳細介紹請見下表:

但是我們無需都繼承這4個介面,SDK為我們提供了DefaultHandler類來處理,DefaultHandler類的一些主要事件回撥方法如下:

由以上可知,我們需要XmlReader 以及DefaultHandler來配合解析xml。

處理思路是:

1:建立SAXParserFactory物件

2: 根據SAXParserFactory.newSAXParser()方法返回一個SAXParser解析器
3:根據SAXParser解析器獲取事件源物件XMLReader
4:例項化一個DefaultHandler物件

5:連線事件源物件XMLReader到事件處理類DefaultHandler中

6:呼叫XMLReader的parse方法從輸入源中獲取到的xml資料

7:通過DefaultHandler返回我們需要的資料集合。

 

 重點在於DefaultHandler物件中對每一個元素節點,屬性,文字內容,文件內容進行處理。

 前面說過DefaultHandler是基於事件處理模型的,基本處理方式是:當SAX解析器導航到文件開始標籤時回撥
startDocument方法,導航到文件結束標籤時回撥endDocument方法。當SAX解析器導航到元素開始標籤時回撥
startElement方法,導航到其文字內容時回撥characters方法,導航到標籤結束時回撥endElement方法。

 根據以上的解釋,我們可以得出以下處理xml文件邏輯:

1:當導航到文件開始標籤時,在回撥函式startDocument中,可以不做處理,當然你可以驗證下UTF-8等等。

2:當導航到rivers開始標籤時,在回撥方法startElement中可以例項化一個集合用來存貯list,不過我們這裡不用,因為在建構函式中已經例項化了。

3:導航到river開始標籤時,就說明需要例項化River物件了,當然river標籤中還有name
,length屬性,因此例項化River後還必須取出屬性值,attributes.getValue(NAME),同時賦予river物件中,同時添
加為導航到的river標籤新增一個boolean為真的標識,用來說明導航到了river元素。

4:當然有river標籤內還有子標籤(節點),但是SAX解析器是不知道導航到什麼標籤的,它只懂得開始,結束而已。那麼如何讓它認得我們的各個
標籤呢?當然需要判斷了,於是可以使用回撥方法startElement中的引數String
localName,把我們的標籤字串與這個引數比較下,就可以了。我們還必須讓SAX知道,現在導航到的是某個標籤,因此新增一個true屬性讓
SAX解析器知道。因此

5:它還會導航到文字內標籤,(就是<img></img>裡面的內容),回撥方法characters,我們一般在這個方法中取出就是<img></img>裡面的內容,並儲存。

6:當然它是一定會導航到結束標籤</river>
或者</rivers>的,如果是</river>標籤,記得把river物件新增進list中。如果是river中的子標
籤</introduction>,就把前面設定標記導航到這個標籤的boolean標記設定為false.

第三種方式:Pull方式

我們使用SAX方式解析xml文件,
SAX方式是基於事件驅動的。當然android的事件機制是基於回撥函式的。在這一節中,我們用另外一種方式解析xml文件,這種方式也是基於事件驅動
的,與SAX方式一樣,它就是PULL方式。只不過PULL方式讀xml回撥方法返回的是數字。

   讀取到xml的宣告返回      START_DOCUMENT;

   讀取到xml的結束返回       END_DOCUMENT ;

   讀取到xml的開始標籤返回 START_TAG

   讀取到xml的結束標籤返回 END_TAG

   讀取到xml的文字返回       TEXT

xml資料結果還是採用我們先前使用的river.xml檔案。

採用PULL方式與SAX大同小異,重點在於我們需要知道導航到什麼標籤時候做什麼就行了,依據上一節SAX處理方式的思路,我們也可以在這一節中一樣處理,基本方法是:

基本處理方式是:當PULL解析器導航到文件開始標籤時就開始例項化list集合用來存貯資料物件。導航到元素開始標籤時回判斷元素標籤型別,如果
是river標籤,則需要例項化River物件了,如果是其他型別,則取得該標籤內容並賦予River物件。當然它也會導航到文字標籤,不過在這裡,我們
可以不用。

 根據以上的解釋,我們可以得出以下處理xml文件邏輯:

1:當導航到XmlPullParser.START_DOCUMENT,可以不做處理,當然你可以例項化集合物件等等。

2:當導航到XmlPullParser.START_TAG,則判斷是否是river標籤,如果是,則例項化river物件,並呼叫getAttributeValue方法獲取標籤中屬性值。

3:當導航到其他標籤,比如Introduction時候,則判斷river物件是否為空,如不為空,則取出Introduction中的內容,nextText方法來獲取文字節點內容

4:當然啦,它一定會導航到XmlPullParser.END_TAG的,有開始就要有結束嘛。在這裡我們就需要判讀是否是river結束標籤,如果是,則把river物件存進list集合中了,並設定river物件為null.

由以上的處理邏輯,我們可以得出以下程式碼:

 

獲得解析到的事件類別,這裡有開始文件,結束文件,開始標籤,結束標籤,文字等等事件。

執行效果如下: