在Java中實(shí)現(xiàn)DOM文檔和XML文件互相轉(zhuǎn)換
文簡(jiǎn)要描述了DOM的概念和內(nèi)部邏輯結(jié)構(gòu),實(shí)例講述DOM文檔操作和XML文件互相轉(zhuǎn)換的java實(shí)現(xiàn)過(guò)程。
1. DOM文檔簡(jiǎn)介
目前,W3C已于2000年11月13日推出了規(guī)范DOM level 2。文檔對(duì)象模型(DOM)是HTML和XML文檔的編程接口規(guī)范,它與平臺(tái)和語(yǔ)言是無(wú)關(guān)的,因而可以用各種語(yǔ)言在各種平臺(tái)上實(shí)現(xiàn)。該模型定義了THML和XML文件在內(nèi)存中的邏輯結(jié)構(gòu)(即為文檔),提供了訪問(wèn)、存取THML和XML文件的方法。利用DOM規(guī)范,可以實(shí)現(xiàn)DOM 文檔和XML文件之間的相互轉(zhuǎn)換,遍歷、操作相應(yīng)DOM文檔的內(nèi)容。可以說(shuō),要自由的操縱XML文件,就要用到DOM規(guī)范。
2. DOM內(nèi)部邏輯結(jié)構(gòu)
DOM文檔中的邏輯結(jié)構(gòu)可以用節(jié)點(diǎn)樹(shù)的形式進(jìn)行表述。通過(guò)對(duì)XML文件的解析處理,XML文件中的元素便轉(zhuǎn)化為DOM文檔中的節(jié)點(diǎn)對(duì)象。DOM的文檔節(jié)點(diǎn)有Document、Element、Comment、Type等等節(jié)點(diǎn)類型,其中每一個(gè)DOM文檔必須有一個(gè)Document節(jié)點(diǎn),并且為節(jié)點(diǎn)樹(shù)的根節(jié)點(diǎn)。它可以有子節(jié)點(diǎn),或者葉子節(jié)點(diǎn)如Text節(jié)點(diǎn)、Comment節(jié)點(diǎn)等。任何的格式良好的XML文件中的每一個(gè)元素均有DOM文檔中的一個(gè)節(jié)點(diǎn)類型與之對(duì)應(yīng)。利用DOM接口將XML文件轉(zhuǎn)化成DOM文檔后,我們就可以自由的處理XML文件了。
3. java中的DOM接口
DOM規(guī)范提供的API的規(guī)范,目前Sun公司推出的jdk1.4測(cè)試版中的java API遵循了 DOM level 2 Core推薦接口的語(yǔ)義說(shuō)明,提供了相應(yīng)的java語(yǔ)言的實(shí)現(xiàn)。
在org.xml.dom中,jkd1.4提供了Document、DocumentType、Node、NodeList、Element、Text等接口,這些接口均是訪問(wèn)DOM文檔所必須的。我們可以利用這些接口創(chuàng)建、遍歷、修改DOM文檔。
在javax.xml.parsers中,jkd1.4提供的DoumentBuilder和DocumentBuilderFactory組合可以對(duì)XML文件進(jìn)行解析,轉(zhuǎn)換成DOM文檔。
在javax.xml.transform.dom和javax.xml.transform.stream中,jdk1.4提供了DOMSource類和StreamSource類,可以用來(lái)將更新后的DOM文檔寫(xiě)入生成的XML文件中。
4. 例程
4.1 將XML文件轉(zhuǎn)化成DOM文檔
這個(gè)過(guò)程是獲得一個(gè)XML文件解析器,解析XML文件轉(zhuǎn)化成DOM文檔的過(guò)程。
Jdk1.4中,Document接口描述了對(duì)應(yīng)于整個(gè)XML文件的文檔樹(shù),提供了對(duì)文檔數(shù)據(jù)的訪問(wèn),是該步驟的目標(biāo)。Document接口可以從類DocumentBuilder中獲取,該類包含了從XML文檔獲得DOM文檔實(shí)例的API。XML的解析器可以從類DocumentBuilderFactory中獲取。在jdk1.4中,XML文件轉(zhuǎn)化成DOM文檔可以有如下代碼實(shí)現(xiàn):
//獲得一個(gè)XML文件的解析器
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
//解析XML文件生成DOM文檔的接口類,以便訪問(wèn)DOM。
DocumentBuilder builder = factory.newDocumentBuilder();
document = builder.parse( new File(FileName) );
4.2 遍歷DOM文檔
獲得接口類document實(shí)例后,可以對(duì)DOM的文檔樹(shù)進(jìn)行訪問(wèn)。要遍歷DOM文檔,首先要獲得Root元素。然后獲得Root元素的子節(jié)點(diǎn)列表。這里通過(guò)遞歸的方法實(shí)現(xiàn)遍歷的目的。
//獲得Root元素
Element element = document.getDocumentElement();
//獲得Root元素的子節(jié)點(diǎn)列表
nodelist = element.getChildNodes();
//用遞歸方法實(shí)現(xiàn)DOM文檔的遍歷
GetElement(nodelist);
其中GetElement方法實(shí)現(xiàn)如下:
注意:上面的代碼只是顯示Node類型和Text類型的對(duì)象。它們的類型標(biāo)識(shí)分別是1和3。
4.3 修改DOM文檔
修改DOM文檔的API在DOM level 2 Core規(guī)范中做了說(shuō)明,jkd1.4中的org.xml.dom中實(shí)現(xiàn)了這些API。修改DOM文檔操作主要集中在Document、Element、Node、Text等類中,這里給出的例子中是在解析出的DOM文檔中增加一系列對(duì)象,對(duì)應(yīng)與在XML文件中增加一條記錄。
// 獲得Root對(duì)象
Element root = document.getDocumentElement();
// 在DOM文檔中增加一個(gè)Element節(jié)點(diǎn)
Element booktype = document.createElement("COMPUTES");
//將該節(jié)點(diǎn)轉(zhuǎn)化成root對(duì)象的子節(jié)點(diǎn)
root.appendChild(cdrom);
//在DOM文檔中增加一個(gè)Element節(jié)點(diǎn)
Element booktitle = document.createElement("Title");
//將該節(jié)點(diǎn)轉(zhuǎn)化成booktype對(duì)象的子節(jié)點(diǎn)
booktype.appendChild(booktitle);
//在DOM文檔中增加一個(gè)Text節(jié)點(diǎn)
Text bookname = document.createTextNode("understand Corba");
//將該節(jié)點(diǎn)轉(zhuǎn)化成bookname對(duì)象的子節(jié)點(diǎn)
booktitle.appendChild(bookname);
4.4 將DOM文檔轉(zhuǎn)化成XML文件
// 獲得將DOM文檔轉(zhuǎn)化為XML文件的轉(zhuǎn)換器,在jdk1.4中,有類TransformerFactory
// 來(lái)實(shí)現(xiàn),類Transformer實(shí)現(xiàn)轉(zhuǎn)化API。
TransformerFactory tfactory = TransformerFactory.newInstance();
Transformer transformer = tfactory.newTransformer();
// 將DOM對(duì)象轉(zhuǎn)化為DOMSource類對(duì)象,該對(duì)象表現(xiàn)為轉(zhuǎn)化成別的表達(dá)形式的信息容器。
DOMSource source = new DOMSource(document);
/* 獲得一個(gè)StreamResult類對(duì)象,該對(duì)象是DOM文檔轉(zhuǎn)化成的其他形式的文檔的容器,
可以是XML文件,文本文件,HTML文件。這里為一個(gè)XML文件。*/
StreamResult result = new StreamResult(new File(“text.xml”));
// 調(diào)用API,將DOM文檔轉(zhuǎn)化成XML文件。
transformer.transform(source,result);
這里提供了該例程的完整程序,該例程在windows 2000中jdk1.4環(huán)境中運(yùn)行通過(guò)。
以上給出了一個(gè)例子,讀者可以從中了解到對(duì)DOM操作的思路。因?yàn)閷?duì)DOM的操作均遵循了DOM規(guī)范,所以也適用于其它語(yǔ)言對(duì)DOM的處理。 |
【編輯推薦】