簡潔編程之道,十個Python Itertools方法助你事半功倍
簡介
Python的編程優(yōu)勢在于它的簡潔性。這不僅是因為Python語法優(yōu)雅,還因為它有許多精心設(shè)計的內(nèi)置模塊,可以幫助開發(fā)者高效地實現(xiàn)常用功能。
itertools模塊就是一個很好的例子,它為開發(fā)者提供了許多強大的工具,可以用更短的代碼來操作Python的可迭代對象,幫助開發(fā)者事半功倍地完成任務(wù)。
1. itertools.product():避免嵌套循環(huán)的巧妙方式
當程序變得越來越復(fù)雜時,可能需要編寫嵌套循環(huán)。與此同時,Python代碼將變得丑陋和難以閱讀:
list_a = [1, 2020, 70]
list_b = [2, 4, 7, 2000]
list_c = [3, 70, 7]
for a in list_a:
for b in list_b:
for c in list_c:
if a + b + c == 2077:
print(a, b, c)
# 70 2000 7
如何改進上述代碼,使其具有Python風格?
可以使用itertools.product()函數(shù):
from itertools import product
list_a = [1, 2020, 70]
list_b = [2, 4, 7, 2000]
list_c = [3, 70, 7]
for a, b, c in product(list_a, list_b, list_c):
if a + b + c == 2077:
print(a, b, c)
# 70 2000 7
如上所示,它返回輸入可迭代對象的笛卡爾積,幫助將3個嵌套的for循環(huán)合并為一個。
2. itertools.compress():過濾數(shù)據(jù)的便捷方式
可以通過一個或多個循環(huán)來過濾列表中的項目。
但有時候,可能不需要編寫任何循環(huán),而是使用函數(shù)itertools.compress()。
itertools.compress()函數(shù)返回一個迭代器,該迭代器根據(jù)對應(yīng)的布爾掩碼值對可迭代對象進行過濾。
例如,以下代碼使用itertools.compress()函數(shù)選擇真正的數(shù)據(jù):
import itertools
leaders = ['Yang', 'Elon', 'Tim', 'Tom', 'Mark']
selector = [1, 1, 0, 0, 0]
print(list(itertools.compress(leaders, selector)))
# ['Yang', 'Elon']
第二個參數(shù)selector作為一個掩碼,也可以定義為以下形式:
selector = [True, True, False, False, False]
3. itertools.groupby():對可迭代對象進行分組
itertools.groupby()函數(shù)是將可迭代對象中相鄰的重復(fù)元素進行分組的一種便捷方式。
例如,可以對一個長字符串進行如下分組:
from itertools import groupby
for key, group in groupby('YAaANNGGG'):
print(key, list(group))
# Y ['Y']
# A ['A']
# a ['a']
# A ['A']
# N ['N', 'N']
# G ['G', 'G', 'G']
此外,還可以利用它的第二個參數(shù)來告訴groupby()函數(shù)如何判斷兩個元素是否相同:
from itertools import groupby
for key, group in groupby('YAaANNGGG', lambda x: x.upper()):
print(key, list(group))
# Y ['Y']
# A ['A', 'a', 'A']
# N ['N', 'N']
# G ['G', 'G', 'G']
4. itertools.combinations():獲取可迭代對象中給定長度的所有組合
對于初學者來說,編寫一個正確的函數(shù)來獲取列表的所有可能組合可能需要一些時間。
實際上,如果使用itertools.combinations()函數(shù),可以很容易地實現(xiàn):
import itertools
author = ['Y', 'a', 'n', 'g']
result = itertools.combinations(author, 2)
for x in result:
print(x)
# ('Y', 'a')
# ('Y', 'n')
# ('Y', 'g')
# ('a', 'n')
# ('a', 'g')
# ('n', 'g')
如上述程序所示,itertools.combinations()函數(shù)有兩個參數(shù),一個是原始可迭代對象,另一個是函數(shù)生成的子序列的長度。
5. itertools.permutations(): 獲取可迭代對象中給定長度的所有排列
既然有一個函數(shù)可以獲取所有組合,當然還有另一個名為itertools.permutations的函數(shù)可以獲取所有可能的排列:
import itertools
author = ['Y', 'a', 'n', 'g']
result = itertools.permutations(author, 2)
for x in result:
print(x)
# ('Y', 'a')
# ('Y', 'n')
# ('Y', 'g')
# ('a', 'Y')
# ('a', 'n')
# ('a', 'g')
# ('n', 'Y')
# ('n', 'a')
# ('n', 'g')
# ('g', 'Y')
# ('g', 'a')
# ('g', 'n')
如上所示,itertools.permutations()函數(shù)的使用方式與itertools.combinations()函數(shù)類似。唯一的區(qū)別在于它們的結(jié)果。
6. itertools.accumulate():從可迭代對象生成累積項
基于可迭代對象獲取一系列累積值是一種常見的需求。借助itertools.accumulate()函數(shù)的幫助,不需要編寫任何循環(huán)就能實現(xiàn)。
import itertools
import operator
nums = [1, 2, 3, 4, 5]
print(list(itertools.accumulate(nums, operator.mul)))
# [1, 2, 6, 24, 120]
如果不想使用operator.mul,上述程序與以下程序相同:
import itertools
nums = [1, 2, 3, 4, 5]
print(list(itertools.accumulate(nums, lambda a, b: a * b)))
# [1, 2, 6, 24, 120]
7. itertools.repeat(), itertools.cycle(), itertools.count():創(chuàng)建無限迭代器
在某些情況下,開發(fā)者需要獲得一個無限迭代器。有3個函數(shù)可以幫助實現(xiàn):
7.1 itertools.repeat():重復(fù)生成相同的項目
例如,可以按以下方式獲取三個相同的“Yang”:
import itertools
print(list(itertools.repeat('Yang', 3)))
# ['Yang', 'Yang', 'Yang']
7.2 itertools.cycle():通過循環(huán)獲取無限迭代器
itertools.cycle函數(shù)在中斷循環(huán)之前不會停止:
import itertools
count = 0
for c in itertools.cycle('Yang'):
if count >= 12:
break
else:
print(c, end=',')
count += 1
# Y,a,n,g,Y,a,n,g,Y,a,n,g,
7.3 itertools.count():生成一個無限的數(shù)字序列
如果需要的只是數(shù)字,可以使用itertools.count函數(shù):
import itertools
for i in itertools.count(0, 2):
if i == 20:
break
else:
print(i, end=" ")
# 0 2 4 6 8 10 12 14 16 18
如上所示,它的第一個參數(shù)是起始數(shù)字,第二個參數(shù)是步長。
8. itertools.pairwise():輕松獲取成對的元組
自Python 3.10以來,itertools模塊新增了一個名為pairwise的新函數(shù)。它是一個簡潔的工具,可以從可迭代對象生成連續(xù)重疊的成對元素。
import itertools
letters = ['a', 'b', 'c', 'd', 'e']
result = itertools.pairwise(letters)
print(list(result))
# [('a', 'b'), ('b', 'c'), ('c', 'd'), ('d', 'e')]
9. itertools.takewhile():以不同的方式過濾元素
itertools.takewhile()返回一個迭代器,只要給定的謂詞函數(shù)評估為True,該迭代器就會生成可迭代對象中的元素。
import itertools
nums = [1, 61, 7, 9, 2077]
print(list(itertools.takewhile(lambda x: x < 100, nums)))
# [1, 61, 7, 9]
此函數(shù)與內(nèi)置的filter()函數(shù)不同。
filter函數(shù)將遍歷整個列表:
nums = [1, 61, 7, 9, 2077]
print(list(filter(lambda x: x < 10, nums)))
# [1, 7, 9]
然而,itertools.takewhile函數(shù)會在評估函數(shù)為False時停止:
import itertools
nums = [1, 61, 7, 9, 2077]
print(list(itertools.takewhile(lambda x: x < 10, nums)))
# [1]
10. itertools.dropwhile():itertools.takewhile的反向操作
這個函數(shù)是上一個函數(shù)的逆操作。
itertools.takewhile()函數(shù)在True時返回可迭代對象中的元素,而itertools.dropwhile()函數(shù)會在True時刪除可迭代對象的元素,并返回剩余的元素。
import itertools
nums = [1, 61, 7, 9, 2077]
print(list(itertools.dropwhile(lambda x: x < 100, nums)))
# [2077]