dom4j是一個使用簡便的開源類庫,專門用來在Java平臺上處理XML,XPath和XSLT,該類庫使用了Java Collections Framework,完全支持DOM,SAX和JAXP。
 dom4j為一個XML文檔在內(nèi)存中創(chuàng)建了一個樹對象模型。 它提供了一組強大易用的API,通過XPath和XSLT來處理、操縱或者遍歷XML文件,此外其中還集成了SAX、JAXP和DOM。
為了提供高度可配置的實現(xiàn)策略,dom4j基于接口設(shè)計。只需要提供一個DocumentFactory實現(xiàn),您就可以創(chuàng)建您自己的XML樹實現(xiàn)。這種設(shè)計,使得在擴展dom4j以定制您需要的特性時,能非常簡單地重用dom4j的代碼。
本文檔將通過代碼實例的方式為您提供一個dom4j的實踐指南。在實驗室項目中,這個開源工具包給我的工作帶來了很大的便利,在這篇文章中,我將對項目中用到dom4j完成的任務(wù)做個總結(jié),以期和互聯(lián)網(wǎng)上的眾多文檔能夠互相補充。
讀取XML文件
一般性地讀取XML文件,在dom4j中操作起來將非常簡單。
public void readXMLSimple(File file) throws DocumentException{     //使用SAXReader讀取XML文件     SAXReader sr = new SAXReader();     Document doc = sr.read(file);
    //使用XPath遍歷一個XML文件的結(jié)點     Element root = doc.getRootElement();     List entryList1 = root.selectNodes("entry");     //或者     List entryList2 = doc.selectNodes("/feed/entry"); }   | 
創(chuàng)建一個XML文檔并記錄到磁盤上
創(chuàng)建一個XML文件,并將其寫到磁盤上,也可以使用非常簡介的代碼來完成,假設(shè)我們將上一個代碼范例中得到的entry節(jié)點的列表,插入到一個新建的XML文檔中,然后使用優(yōu)美的縮進格式保存在磁盤上,我們可以像下面這樣編碼:
public void createXMLSimple(List entries, File f)         throws FileNotFoundException,                UnsupportedEncodingException,                IOException{     Document doc = DocumentHelper.createDocument();     doc.addElement("feed");     Element root = doc.getRootElement();     Iterator i = entries.iterator();     while(i.hasNext()){        //從別的Dom中得到的Element都有其本身         //的root,所以必須創(chuàng)建副本才能插入另一個doc內(nèi)         root.add(((Element)i.next()).createCopy());     }     FileOutputStream os = new FileOutputStream(f);     OutputFormat of = OutputFormat.createPrettyPrint();     XMLWriter xmlw = new XMLWriter(os,of);     xmlw.write(doc); }   | 
讀取一個根節(jié)點帶有默認Namespace的XML
如果我們剛才的代碼范例讀取的是符合Atom1.0標準的Feed,那么,根節(jié)點帶有default namespace的http://www.w3.org/2005/Atom。讀取這樣的XML文檔稍微有點麻煩,網(wǎng)上的代碼很多,但是很多都不好用,我總結(jié)下來,基本上沒有辦法像你想的那么干凈。
public void treatDefaultNamespace(File f)         throws DocumentException{     SAXReader sr = new SAXReader();     Map ns = new HashMap();     ns.put("atom", "http://www.w3.org/2005/Atom");     sr.getDocumentFactory().setXPathNamespaceURIs(ns);     //Element接口支持迭代器,在這里順便展示一下     Element root = sr.read(f).getRootElement();     Iterator i = root.elementIterator();     while(i.hasNext()){         Element e = (Element) i.next();         //一旦指定了Namespace,則使用XPath的時候必須帶上          //即便是默認的Namespace也一樣,不過前面那個名字          //可以盡可能寫得短,編碼的時候方便,比如改成a         String title = e.selectSingleNode("atom:title").getText();         System.out.println(title);     } }  | 
創(chuàng)建一個根節(jié)點帶有默認Namespace的XML
創(chuàng)建一個帶有default namespace的XML的方法,相當?shù)膖ricky,因為你創(chuàng)建一個Element的方法有很多種,可以通過add方法,默認的建,也可以使用DocumentHelper對象來創(chuàng)建,不過,每種方法給你的結(jié)果都不同,往往讓你大吃一驚。其他的那些方法,和得到的多種結(jié)果,大家可以在網(wǎng)上看,很多。我就提供一個能創(chuàng)建“干凈”的XML的代碼范例。
public void createXMLWithDefaultNamespace(List entries){     Document d = DocumentHelper.createDocument();     d.addElement("feed","http://www.w3.org/2005/Atom");     Element root = d.getRootElement();     //省略迭代entries代碼     root.addElement("title").add(DocumentHelper.createCDATA(title));     root.addElement("id").add(DocumentHelper.createText(guid));     root.addElement("category").add(DocumentHelper.createText(category));     root.addElement("link").add(DocumentHelper.createText(permalink));     root.addElement("updated").add(DocumentHelper.createText(updated)); }  | 
最后,羅列一下上文中用到的所有對象所在的包,沒有列出的在J2SE內(nèi)。
import org.dom4j.Document; import org.dom4j.DocumentException; import org.dom4j.DocumentHelper; import org.dom4j.Element; import org.dom4j.io.OutputFormat; import org.dom4j.io.SAXReader; import org.dom4j.io.XMLWriter;  | 
【編輯推薦】
- JavaFX HTTP網(wǎng)絡(luò)和XML分析
 
- 詳解Java解析XML的四種方法
 
- XML新手入門 創(chuàng)建構(gòu)造良好的XML