偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

講述面向對象的語言——Python語言

開發(fā) 后端
在“面向對象”的語言中,程序是由數據和功能組合而成的對象構建起來的,Python語言以一種非常強大又簡單的方式實現(xiàn)面向對象編程。

Python語言確實是一種十分精彩又強大的語言,它合理地結合了高性能與使得編寫程序簡單有趣的特色,看完本文你肯定有不少收獲,希望本文能教會你更多東西。

對搜索引擎、文件索引、文檔轉換、數據檢索、站點備份或遷移等應用程序來說,經常用到對網頁(即HTML文件)的解析處理。事實上,通過Python語言提供的各種模塊,我們無需借助Web服務器或者Web瀏覽器就能夠解析和處理HTML文檔。

本文上篇中,我們介紹了一個可以幫助簡化打開位于本地和Web上的HTML文檔的Python模塊。在本文中,我們將論述如何使用Python模塊來迅速解析在HTML文件中的數據。從而處理特定的內容,如鏈接、圖像和Cookie等。同時還會介紹如何規(guī)范HTML文件的格式標簽,Python語言還有一個非常有用的模塊HTMLParser。

該模塊使我們能夠根據HTML文檔中的標簽來簡潔、高效地解析HTML文檔。所以,在處理HTML文檔的時候,HTMLParser是最常用的模塊之一。處理HTML文檔的時候,我們常常需要從其中提取出所有的鏈接。使用HTMLParser模塊后,這項任務將變得易如反掌。

首先,我們需要定義一個新的HTMLParser類,以覆蓋handle_starttag()方法,我們將使用這個方法來顯示所有標簽的HRef屬性值。定義好新的HTMLParser類之后,需要創(chuàng)建一個實例來返回Python語言。然后,就可以使用urllib.urlopen(url)打開HTML文檔并讀取該HTML文件的內容了。

為了解析HTML文件的內容并顯示包含其中的鏈接,可以使用read()函數將數據傳遞給HTMLParser對象。HTMLParser對象的feed函數將接收數據,并通過定義的HTMLParser對象對數據進行相應的解析。

需要注意,如果傳給HTMLParser的feed()函數的數據不完整的話,那么不完整的標簽會保存下來,并在下一次調用feed()函數時進行解析。當HTML文件很大,需要分段發(fā)送給解析器的時候,這個功能就會有用武之地了。下面是一個具體的例子。

  1.  import HTMLParser  
  2.  
  3.   import urllib  
  4.  
  5.   import sys  
  6.  
  7.   #定義HTML解析器  
  8.  
  9.   class parseLinks(HTMLParser.HTMLParser):  
  10.  
  11.   def handle_starttag(self, tag, attrs):  
  12.  
  13.   if tag == 'a':  
  14.  
  15.   for name,value in attrs:  
  16.  
  17.   if name == 'href':  
  18.  
  19.   print value  
  20.  
  21.   print self.get_starttag_text()  
  22.  
  23.   #創(chuàng)建HTML解析器的實例  
  24.  
  25.   lParser = parseLinks()  
  26.  
  27.   #打開HTML文件  
  28.  
  29.   lParser.feed(urllib.urlopen( \  
  30.  
  31.   "http://www.python.org/index.html").read())  
  32.  
  33.   lParser.close() 

上述代碼的運行結果太長,在此省略,您可以自己運行代碼試試。

【編輯推薦】

  1. 漫談Python 源代碼編制技巧
  2. 簡單易于操作的Python 工具詳解
  3. 有關Python應用領域進行說明介紹
  4. PythonAndroid面向對象的編程——Python應用程序
  5. 如何使用Python模塊解析配置文件 ?
責任編輯:chenqingxiang 來源: 中國IT實驗室
相關推薦

2010-02-02 13:22:06

Python面向對象

2024-04-02 07:32:58

Go語言接口

2010-03-01 17:40:29

Python面向對象語

2010-01-22 10:26:40

C++語言

2009-07-14 16:51:50

Jython中的對象

2010-08-24 16:00:43

C語言

2011-06-02 09:47:11

C語言重構

2022-10-21 09:01:41

StudentC++類型

2021-05-28 05:34:06

Golang語言編程

2010-03-01 18:36:59

Python標準語言

2009-10-13 17:03:55

VB.NET面向對象

2024-01-08 07:02:48

數據設計模式

2010-01-13 14:05:55

C++語言

2010-03-11 20:33:14

Python編程語言

2020-04-15 11:07:31

C語言對象思想

2010-01-12 10:11:36

學習C++語言

2009-05-21 09:08:52

接口C++面向對象

2011-05-17 14:53:35

C

2020-10-10 11:03:24

面向對象編程語言開發(fā)

2022-10-12 08:38:51

C語言classC++
點贊
收藏

51CTO技術棧公眾號