PHP類Snoopy的特點分析
大家都知道在PHP語言中,具有很多功能強大的函數(shù),來幫助程序員們完成各種功能需求。我們今天要為大家介紹的則是PHP類Snoopy的一些相關知識。
#t#PHP類Snoopy是什么?
Snoopy是一個php類,用來模仿web瀏覽器的功能,它能完成獲取網(wǎng)頁內(nèi)容和發(fā)送表單的任務。
PHP類Snoopy的一些特點:
* 方便抓取網(wǎng)頁的內(nèi)容
* 方便抓取網(wǎng)頁的文本內(nèi)容 (去除HTML標簽)
* 方便抓取網(wǎng)頁的鏈接
* 支持代理主機
* 支持基本的用戶名/密碼驗證
* 支持設置 user_agent, referer(來路), cookies 和 header content(頭文件)
* 支持瀏覽器轉向,并能控制轉向深度
* 能把網(wǎng)頁中的鏈接擴展成高質(zhì)量的url(默認)
* 方便提交數(shù)據(jù)并且獲取返回值
* 支持跟蹤HTML框架(v0.92增加)
* 支持再轉向的時候傳遞cookies (v0.92增加)
PHP類Snoopy正確運行需要你的服務器的 PHP 版本在 4 以上,并且支持 PCRE(Perl Compatible Regular Expressions),基本的 LAMP 服務都支持。
它提供以下的接口或者方法:
fetch($URI)
這個方法是抓取網(wǎng)頁的內(nèi)容,$URI 是要抓取網(wǎng)頁的網(wǎng)址,抓取過來結果存儲到 $this->results。如果你抓取的是框架,這每個 frame 都會被抓取,結果會保存到一個數(shù)組中。
fetchtext($URI)
這個方法和 fetch() 是大致相同,只是它的結果是文本,除去 HTML 標簽和其他無關信息。
fetchform($URI)
這個方法只返回抓取的網(wǎng)頁上 form 元素。
fetchlinks($URI)
這個方法只返回抓取的網(wǎng)頁上的鏈接,默認返回的鏈接都是含有域名的鏈接。
submit($URI,$formvars)
這個方法提交一個表單到指定的 $URI。$formvars 是要傳遞的 form 變量數(shù)組。
submittext($URI,$formvars)
這個方法和 submit() 基本一致,但是它返回的是文本,除去了 html 標簽和其他無關數(shù)據(jù)。
submitlinks($URI)
這個方法返回的是鏈接。
以上這些就是PHP類Snoopy的全部內(nèi)容介紹,希望對大家有所幫助。