偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Python與Excel 不得不說(shuō)的事情

開(kāi)發(fā) 后端 大數(shù)據(jù)
數(shù)據(jù)處理是 Python 的一大應(yīng)用場(chǎng)景,而 Excel 則是最流行的數(shù)據(jù)處理軟件。因此用 Python 進(jìn)行數(shù)據(jù)相關(guān)的工作時(shí),難免要和 Excel 打交道。

數(shù)據(jù)處理是 Python 的一大應(yīng)用場(chǎng)景,而 Excel 則是最流行的數(shù)據(jù)處理軟件。因此用 Python 進(jìn)行數(shù)據(jù)相關(guān)的工作時(shí),難免要和 Excel 打交道。

[[286649]]

如果僅僅是要以表單形式保存數(shù)據(jù),可以借助 CSV 格式(一種以逗號(hào)分隔的表格數(shù)據(jù)格式)進(jìn)行處理,Excel 也支持此格式。但標(biāo)準(zhǔn)的 Excel 文件(xls/xlsx)具有較復(fù)雜的格式,并不方便像普通文本文件一樣直接進(jìn)行讀寫(xiě),需要借助第三方庫(kù)來(lái)實(shí)現(xiàn)。 

Python與Excel 不得不說(shuō)的事情

常用的庫(kù)是 python-excel 系列:

  • xlrd、xlwt、xlutils
  • xlrd - 讀取 Excel 文件
  • xlwt - 寫(xiě)入 Excel 文件
  • xlutils - 操作 Excel 文件的實(shí)用工具,如復(fù)制、分割、篩選等

盡管這是目前被用得最多的 Excel 庫(kù),我還是很想吐槽為什么這三個(gè)包不能放在一個(gè)模塊里……另外它們有個(gè)缺陷,就是只能處理 xls 文件。如果你想用新版本的 xlsx,可以考慮 openpyxl 和 xlsxwriter。

Python與Excel 不得不說(shuō)的事情

不過(guò)今天只說(shuō)說(shuō)這三個(gè)。

安裝

安裝的方法沒(méi)啥特別的,只是得裝三遍??梢韵螺d安裝包、下載代碼壓縮包、或者通過(guò) pip 等。

如果安裝過(guò)之前推薦的 anaconda,那么就已經(jīng)有了 xlrd 和 xlwt,但 xlutils 沒(méi)有附帶在安裝包中,使用時(shí)仍需另行安裝。

讀取

結(jié)合一段簡(jiǎn)單的代碼來(lái)看:

  1. import xlrd 
  2. # 打開(kāi) xls 文件 
  3. book = xlrd.open_workbook("test.xls"
  4. print "表單數(shù)量:", book.nsheets 
  5. print "表單名稱(chēng):", book.sheet_names() 
  6. # 獲取第1個(gè)表單 
  7. sh = book.sheet_by_index(0) 
  8. print u"表單 %s 共 %d 行 %d 列" % (sh.name, sh.nrows, sh.ncols) 
  9. print "第二行第三列:", sh.cell_value(1, 2) 
  10. # 遍歷所有表單 
  11. for s in book.sheets(): 
  12.     for r in range(s.nrows): 
  13.         # 輸出指定行 
  14.         print s.row(r) 

測(cè)試文件: 

Python與Excel 不得不說(shuō)的事情

輸出結(jié)果: 

  1. 表單數(shù)量: 2  
  2. 表單名稱(chēng): [u'Group.A', u'Group.B' 
  3. 表單 Group.A 共 7 行 3 列  
  4. 第二行第三列: 15.0  
  5. [text:u'Rank', text:u'Team', text:u'Points' 
  6. [number:1.0, text:u'Brazil', number:15.0]  
  7. [number:2.0, text:u'Russia', number:12.0]  
  8. ... 

常用的方法:

  • open_workbook 打開(kāi)文件
  • sheet_by_index 獲取某一個(gè)表單
  • sheets 獲取所有表單
  • cell_value 獲取指定單元格的數(shù)據(jù)

寫(xiě)入

還是看代碼:

  1. import xlwt 
  2. # 創(chuàng)建 xls 文件對(duì)象 
  3. wb = xlwt.Workbook() 
  4. # 新增一個(gè)表單 
  5. sh = wb.add_sheet('A Test Sheet'
  6. # 按位置添加數(shù)據(jù) 
  7. sh.write(0, 0, 1234.56) 
  8. sh.write(1, 0, 8888) 
  9. sh.write(2, 0, 'hello'
  10. sh.write(2, 1, 'world'
  11. # 保存文件 
  12. wb.save('example.xls'

生成文件: 

Python與Excel 不得不說(shuō)的事情

常用的方法:

  • Workbook 創(chuàng)建文件對(duì)象
  • add_sheet 新增一個(gè)表單
  • write 在指定單元格寫(xiě)入數(shù)據(jù)

修改

很遺憾,并沒(méi)有直接修改 xls 文件的方法。通常的做法是,讀取出文件,復(fù)制一份數(shù)據(jù),對(duì)其進(jìn)行修改,再保存。

在復(fù)制時(shí),需要用到 xlutils 中的方法。

  1. from xlrd import open_workbook 
  2. from xlutils.copy import copy 
  3. # 打開(kāi)文件 
  4. rb = open_workbook("example.xls"
  5. # 復(fù)制 
  6. wb = copy(rb) 
  7. # 選取表單 
  8. s = wb.get_sheet(0) 
  9. # 寫(xiě)入數(shù)據(jù) 
  10. s.write(0, 1, 'new data'
  11. # 保存 
  12. wb.save('example.xls'

修改后文件: 

Python與Excel 不得不說(shuō)的事情

特別要注意的是,選取讀取表單時(shí),要使用 sheet_by_index,而在選取寫(xiě)入表單時(shí),則要用 get_sheet。不要問(wèn)我為什么,我也很想知道這么設(shè)定的用意何在……

時(shí)間轉(zhuǎn)換

如果表單中有時(shí)間格式的數(shù)據(jù),通過(guò)處理之后,你會(huì)發(fā)現(xiàn)時(shí)間數(shù)據(jù)出了差錯(cuò)。 

Python與Excel 不得不說(shuō)的事情
Python與Excel 不得不說(shuō)的事情

輸出單元格內(nèi)容:

  1. [number:8888.0, xldate:42613.0] 

因?yàn)檫@里 xldate 有自己的格式定義。如果要使用正確的格式,必須轉(zhuǎn)換:

  1. new_date = xlrd.xldate.xldate_as_datetime(date, book.datemode) 

date 是對(duì)應(yīng)單元格的數(shù)據(jù),book 是打開(kāi)的文件對(duì)象。

另外,在打開(kāi)文件時(shí),加上參數(shù) formatting_info=True,可以保證在時(shí)間數(shù)據(jù)在 copy 時(shí)保持原樣。

寫(xiě)入時(shí)間數(shù)據(jù),則可通過(guò)此方法創(chuàng)建 excel 的時(shí)間對(duì)象:

  1. xlrd.xldate.xldate_from_datetime_tuple 

或者通過(guò) xlwt.easyxf 指定時(shí)間格式:

  1. style = xlwt.easyxf(num_format_str='D-MMM-YY')ws.write(1, 0, datetime.now(), style) 

具體細(xì)節(jié)及更多功能這里不展開(kāi)說(shuō)明。

以上便是 Python 操作 Excel 文件的一些基本方法。實(shí)際使用過(guò)程中遇到問(wèn)題或者需要了解更多功能,永遠(yuǎn)記住兩個(gè)詞:

  • RTFM、STFW
  • :)

 

 

責(zé)任編輯:未麗燕 來(lái)源: 知乎專(zhuān)欄
相關(guān)推薦

2020-06-15 08:19:00

ZooKeeperEureka

2015-08-31 14:12:12

DockerKubernetesPaaS

2019-11-14 15:38:46

AndroidRelease項(xiàng)目

2024-02-04 00:00:03

運(yùn)維Linux磁盤(pán)

2019-10-18 17:55:03

安全運(yùn)營(yíng)

2019-10-21 10:18:29

區(qū)塊鏈大數(shù)據(jù)

2010-08-27 10:37:43

無(wú)線(xiàn)標(biāo)準(zhǔn)WAPI

2011-04-26 09:44:05

Power Cloud

2018-08-06 11:59:00

混合云數(shù)據(jù)中心上云

2010-05-26 15:17:06

Windows Emb

2018-07-20 22:22:21

紅帽混合云API

2009-11-03 17:43:19

Oracle用戶(hù)授權(quán)

2010-01-07 09:17:57

HTML 5

2014-10-21 11:05:52

英特爾Linux

2015-01-16 16:44:50

2014-04-15 10:18:24

中文女工科男

2018-08-20 13:39:15

小程序設(shè)計(jì)UI設(shè)計(jì)師

2012-10-31 10:07:00

JS前端Web

2012-10-31 10:36:17

js前端JavaScript頁(yè)面構(gòu)建

2011-04-27 10:31:29

兼容墨盒用戶(hù)體驗(yàn)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)