Perl正則表達(dá)式語法解析
本文和大家重點(diǎn)討論一下Perl正則表達(dá)式的概念,Perl正則表達(dá)式,就是一串特別設(shè)計(jì)過的字符串,相信通過本文的學(xué)習(xí)你對(duì)Perl正則表達(dá)式的概念有初步的認(rèn)識(shí)。
1.Perl正則表達(dá)式語法
所謂Perl正則表達(dá)式,就是一串特別設(shè)計(jì)過的字符串,可以按照你的意圖用匹配操作尋找你要求的目標(biāo)。我這里不是Perl手冊(cè),也不是教科書,所以我從例子開始,具體的完整說明還請(qǐng)查手冊(cè)。
1.1轉(zhuǎn)義符號(hào)\
前面說過缺省情況下Perl正則表達(dá)式要用/包起來,那么現(xiàn)在要尋找一個(gè)字符串里面有沒有/怎么辦?不是有歧義了么那個(gè)表達(dá)式。換你設(shè)計(jì)Perl語言該咋辦?玩過C語言的人看到這里一定在嘿嘿笑,因?yàn)樵贑里面簡(jiǎn)單,要寫/必須寫成\/,要寫\必須寫成\\。說Perl在語法上是C的表弟是很不錯(cuò)的,Perl規(guī)定的轉(zhuǎn)義符號(hào)也是\.常用的特殊符號(hào)有回車\n,跳格\t,斜杠\\和\/,引號(hào)\'和\",方括號(hào)\[和\],圓括號(hào)\(和\),美元號(hào)\$,上尖號(hào)\^,星號(hào)\*,點(diǎn)號(hào)\.,問號(hào)\?,加號(hào)\+。我都是隨手寫的,建議拿不定主意的話,非51個(gè)字母的符號(hào)都去查查手冊(cè)吧。舉例:查一個(gè)字符串里有沒有美元號(hào)
my$szValue='$6580.90';
$szValue=~/\$/;
1.2或操作
Perl的Perl正則表達(dá)式缺省是區(qū)別大小寫的。什么,前面早該告訴你?真可憐,又一個(gè)從Windows世界來的小孩,就和我想當(dāng)然以為在美國(guó)商店應(yīng)該在復(fù)活節(jié)大做生意創(chuàng)造GDP一樣,可是人家不開門。為了串即匹配"Apple"又匹配"apple",你可以這樣:
$szProductType=~/[Aa]pple/;
在方括號(hào)里的字母是"或"的關(guān)系,擊中其中一個(gè)就可以了。在一個(gè)Perl正則表達(dá)式中可以用任意多個(gè)方括號(hào),但是不要嵌套。常常能見到的一種表達(dá)式
[0-9]
表示0到9這十個(gè)字母,也可以用\d來代替。\D則表示非數(shù)字字符。
[a-zA-Z]
表示51個(gè)字母。
順便在這里把反義也講了吧,[^0-9]代表非數(shù)字的其它字符,[^a]代表非a的其它字符。^在這里是反義的意思,但是請(qǐng)注意^還能做頭錨用,后面會(huì)講到。
1.3尾綴
有人搖頭不喜歡上面的解決方案――我要求真正匹配一個(gè)不區(qū)分大小寫的"Apple"應(yīng)該怎么辦?請(qǐng)這樣
$szProductType=~/apple/i;
放在第二個(gè)/符號(hào)后面的尾綴i取消了一切大小寫檢查。
另外再說兩個(gè)有用的尾綴吧,第一個(gè)是g(全局匹配),如果有字符串
my$string="Applejuice,appleCider,applejeans,applepie,appleplate,apPLebag,…";
而用表達(dá)式$string=~/apple/i;只會(huì)遇到第一個(gè)apple就結(jié)束?,F(xiàn)在我們可以用尾綴g配合while循環(huán)
while($string=~/(apple.*?),/ig){
print"$1\n";
}
就可以找出所有帶apple的詞匯。注意尾綴是可以疊加使用的。上面Perl正則表達(dá)式中的圓括號(hào)、點(diǎn)號(hào)和問號(hào)和$1,下面馬上會(huì)講到。
另一個(gè)有用的的尾綴是s。s會(huì)強(qiáng)迫點(diǎn)號(hào)(.)匹配換行符號(hào)(\n),這對(duì)于多行匹配是必須的。不要小看這個(gè)技巧,我花了幾個(gè)小時(shí)才找到的哦。
1.4捕獲匹配的字符串
my$szValue='$1999.99';
if($szValue=~/\$([0-9]+)\.([0-9]+)/){
print"$1dollors$1cents\n";
}
上面表達(dá)式里的加號(hào)表示匹配一到多個(gè)前面的符號(hào),在這里符號(hào)是數(shù)字。用圓括號(hào)括住的內(nèi)容,將會(huì)依次(從左到右)出現(xiàn)在$1,$1,$3……里面。另外,順便說,整個(gè)Perl正則表達(dá)式匹配的結(jié)果是放在$&里面,上面這個(gè)表達(dá)式演算下來$&的值還是"$1999.99"。
另外,還有\(zhòng)1,\1形式的反向引用,使得表達(dá)式里面可以用捕獲的字符串。舉例:表達(dá)式"(\w)\1{4,}"在匹配"aabbbbabcdefgccccc111111111999999999"時(shí),匹配結(jié)果是:成功;匹配到的內(nèi)容是"ccccc"。再次匹配下一個(gè)時(shí),將得到999999999(要用while和/g來配合)。
1.5任意符號(hào).,和次數(shù)符號(hào)*以及+
PerlPerl正則表達(dá)式里點(diǎn)號(hào)是通配任意字母的,例如
$string=~/w.*/i;
就匹配$string里從第一個(gè)w字母開始一直到字符串結(jié)束。*表示匹配任意字母0到任意多次。*號(hào)也常被換成+號(hào),表示匹配1到任意多次。如果即沒有*也沒有+,那么就是匹配1次。如果要自己定義匹配的次數(shù)或者次數(shù)上下限怎么辦?用{}符號(hào):
$string=~/\d{5,15}/;
上面的式子匹配5到15位數(shù)字
$string=~/\d{10}/;
上面式子匹配10位數(shù)字。
附帶說兩個(gè)常用的符號(hào),\S和\s。前者是"非空白",后者是"空白",具體來說包括回車、空格、跳格、響鈴。
1.6貪婪的+和*,止貪劑?
Perl的Perl正則表達(dá)式是貪婪的(確切地說,次數(shù)符號(hào)+和*是貪婪的),可以幫助你做一些事情。
my$string='$190098';
$string=~/\$(\d+)/;
由于+號(hào)的貪婪性,$1會(huì)得到值"190098",而不是遇到第一個(gè)數(shù)字1就完成匹配。
但有的時(shí)候你會(huì)不希望他貪婪,希望見好就收。還是我前面用過的一個(gè)例子
my$string="Applejuice,appleCider,applejeans,applepie,appleplate,apPLebag,…";
如果用$string=~/(apple.*),/i;
由于*的貪婪性,它會(huì)一直匹配到最后一個(gè)逗號(hào)才停下來,這不是我們想要的結(jié)果。解決辦法是用止貪符號(hào)?緊跟在*或者+后面。
$string=~/(apple.*?),/i;
問號(hào)會(huì)約束*遇到第一個(gè)逗號(hào)就停下來。
1.7頭錨^和尾錨$
有時(shí)候你希望從一個(gè)字符串的開始或者結(jié)尾匹配
my$string='Aquickbrownfoxjumpsoveralazysnake';
$string=~/^A/;#匹配第一個(gè)字母是否為A
$string=~/snake$/;#匹配最后幾個(gè)字母是否為snake
還有一個(gè)\b,匹配的是單詞邊界,意思是空白或者開頭或者結(jié)尾。
【編輯推薦】















 
 
 
 
 
 
 