利用Perl解析文件用法指導(dǎo)
本文和大家重點(diǎn)討論一下利用Perl解析XML文件, 當(dāng)在Perl中使用XML時(shí),你會(huì)有將近五百個(gè)CPAN模塊可以選擇,每一個(gè)都支持整合Web服務(wù)的不同方面。此外,Perl的核心庫包括多個(gè)支持XML的模塊。
利用Perl解析XML文件
當(dāng)在Perl中使用XML時(shí),你會(huì)有將近五百個(gè)CPAN模塊可以選擇,每一個(gè)都支持整合Web服務(wù)的不同方面。此外,Perl的核心庫包括多個(gè)支持XML的模塊。這篇文章就關(guān)注于一個(gè)最早期且涉及最頻繁的核心模塊:XML::Parser.
XML::解析器系列
最初的Perl解析器XML::Parser::Expat由LarryWall在幾年前編寫并由ClarkCooper保持延續(xù)。模塊作為ExpatXMLparser的界面由JamesClark用C語言編寫且已經(jīng)被一些腳本語言所采用。
Perl解析XML文件中Expat是一個(gè)以事件為基礎(chǔ)的解析器,意味著特定條件觸發(fā)處理功能。例如,一個(gè)開始或結(jié)尾標(biāo)記將觸發(fā)適當(dāng)?shù)挠脩舳x子程序。XML::Parser模塊在Expat功能的基礎(chǔ)上為普通應(yīng)用所建構(gòu)。
注意Expat在解析之前不會(huì)使XML生效且在遇到錯(cuò)誤出現(xiàn)時(shí)會(huì)失效。這些限制會(huì)使XML::Parser模塊速度非常之快。
XML::Parser簡(jiǎn)介
任何人都可以在Perl中編寫一個(gè)XML解析器。畢竟你只是處理具有已知格式的文本。但由于XML::Parser模塊是用C編寫的,他比任何你可以實(shí)現(xiàn)的純Perl應(yīng)用要更有效的多。而且既然他已經(jīng)被編寫出來,你就可以把時(shí)間花在其他更有用的事情上。
XML::Parser的Expat的功能允許你定義所使用的解析器的樣式。最普遍使用的樣式是Tree和Stream,Tree處理XML的輸入,創(chuàng)建含有文件中的元素和數(shù)據(jù)的成套數(shù)組,這樣你就可以按照你的意愿控制這個(gè)結(jié)構(gòu)。Stream將分析行為劃分層級(jí),在一個(gè)事件的開始做處理,要使用Stream,你必須在你對(duì)模塊做例示并將其與描述事件出現(xiàn)時(shí)如何處理的子程序相關(guān)聯(lián)時(shí)定義處理器。
其它樣式還包括:Sub,允許你特定地對(duì)一種XML標(biāo)記定義其功能。Debug,將文件顯示未標(biāo)準(zhǔn)輸出。Object,與Tree相似但是返回對(duì)象。你也可以通過在XML::Parser類中定義一個(gè)子類來設(shè)定一個(gè)客制樣式。
小結(jié)
你對(duì)XML::Parser的Expat功能熟悉之后,你可以將其作為接觸幾百個(gè)可用的CPANXML模塊的跳板。Perl解析XML文件時(shí)我們這里的Stream樣式是***一個(gè)可用的XML::Parser模塊中的解析類型。你可能會(huì)發(fā)現(xiàn)其他的會(huì)更適合你的工作任務(wù)。Perl幾乎從***個(gè)工程方案推出時(shí)就具有XML功能,不論你的需要如何,他都是一個(gè)很好的選擇。
【編輯推薦】


















