譯者 | 晶顏
審校 | 重樓
一些奇特的Python函數(shù)初看似乎毫無意義,但當(dāng)真正了解其用途后,便會發(fā)現(xiàn)它們極具價值。
若你長期使用Python,想必對其極為龐大的標(biāo)準(zhǔn)庫并不陌生,該標(biāo)準(zhǔn)庫極大地提升了開發(fā)的效率與便捷性。諸如json、datetime和re等熱門模塊備受開發(fā)者關(guān)注,但其中還有一些鮮為人知的函數(shù)卻常常被忽視。
本文將探討其中部分函數(shù),這些函數(shù)在一些人眼中是“無用的”,實則不然。它們具備一些獨(dú)特而奇異的功能,初遇時可能會讓人疑惑“誰會需要這些功能”,但在實際開發(fā)中,某一天你或許就會發(fā)現(xiàn),它們恰好能夠解決你所面臨的特定問題。
接下來,讓我們一同深入了解這些實用性極強(qiáng)的函數(shù)。
1.textwrap.dedent()-整理繁雜的多行字符串
在使用Python編寫多行字符串時,你是否曾因縮進(jìn)問題而感到困擾?若有,textwrap.dedent函數(shù)將是你的得力助手。
以下是使用textwrap模塊的代碼示例,該函數(shù)能夠去除源代碼中縮進(jìn)的多行字符串的額外縮進(jìn),從而得到無前導(dǎo)空格的整潔文本:
import textwrap
def my_function():
# Without dedent, this would preserve all the leading spaces
description = textwrap.dedent("""
This is a multi-line string
that will have consistent indentation
regardless of how it's indented in the code.
Pretty neat, right?
""").strip()
return description
print(my_function())
輸出結(jié)果:
這是一個多行字符串,無論它在代碼中如何縮進(jìn),都將具有一致的縮進(jìn)。很簡潔,對吧?
2.difflib.get_close_matches()-輕松實現(xiàn)模糊字符串匹配
在實際開發(fā)中,有時需要找出字符串之間的相似之處,或者實現(xiàn)“你的意思是什么?”之類的功能,此時就可以用到difflib模塊中的get_close_matches函數(shù)。
以下是幾個使用該函數(shù)的示例:
import difflib
words = ["python", "javascript", "typescript", "ruby", "golang"]
search = "pythn"
matches = difflib.get_close_matches(search, words, n=3, cutoff=0.6)
print(f"Did you mean: {matches}")
輸出結(jié)果:
你的意思是:
['python']
search = "typescript"
matches = difflib.get_close_matches(search, words)
print(f"Matches: {matches}")
輸出結(jié)果:
['typescript', 'javascript']
上述第一個示例在編程語言列表中查找與“python”最接近的匹配項;第二個示例則展示了與“typescript”接近的匹配結(jié)果,包括“typescript”和“javascript”。
該函數(shù)在開發(fā)命令行工具、搜索功能,或任何需要處理拼寫錯誤及近似匹配的場景中,都具有重要的應(yīng)用價值。
3.uuid.uuid4()-生成確保唯一的ID
當(dāng)需要唯一標(biāo)識符,且無需借助數(shù)據(jù)庫,同時也不必?fù)?dān)心標(biāo)識符沖突時,可使用uuid模塊中的函數(shù)。
通過調(diào)用uuid.uuid4()函數(shù)能夠創(chuàng)建一個隨機(jī)的UUID對象,該對象可用作唯一標(biāo)識符,示例如下:
import uuid
# Generate a random UUID
random_id = uuid.uuid4()
print(f"Unique ID: {random_id}")
輸出結(jié)果:
唯一ID: fc4c6638-9707-437b-83a1-76206b5f7191
下面的示例展示了如何將UUID應(yīng)用于文件名,以確保文件名的唯一性:
# Use as string for filenames, database keys, etc.
filename = f"document-{uuid.uuid4()}.pdf"
print(filename)
輸出結(jié)果:
文檔- b5ccbe7a fad9 - 4611 - 8163 - be1015c634b9.pdf
UUID(通用唯一標(biāo)識符)具備極高的唯一性保障,即便在不同機(jī)器、不同時間生成,也不會出現(xiàn)重復(fù)情況。這一特性使其非常適用于為文件、數(shù)據(jù)庫條目,以及其他任何對唯一性有要求的場景生成ID。
4.shutil.get_terminal_size()-響應(yīng)式CLI應(yīng)用程序
如果期望命令行應(yīng)用程序能夠適配用戶終端的尺寸,shutil.get_terminal_size函數(shù)能夠輕松達(dá)成這一目標(biāo)。使用方式如下:
import shutil
columns, rows = shutil.get_terminal_size()
print(f"Your terminal is {columns} columns wide and {rows} rows tall")
# Create a horizontal divider that fits perfectly
print("-" * columns)
上述代碼可獲取當(dāng)前終端的列數(shù)與行數(shù),并據(jù)此創(chuàng)建一個寬度恰好與終端寬度一致的水平分隔符。例如,若終端為80列寬、24行高,則會輸出相應(yīng)尺寸信息,并生成80個“-”組成的水平分隔符。
5.itertools.groupby()-無需字典即可高效分組數(shù)據(jù)
當(dāng)需要依據(jù)特定鍵對數(shù)據(jù)進(jìn)行分組時,itertools.groupby()函數(shù)提供了高效的解決方案。
以員工數(shù)據(jù)分組為例,需先按部門對員工列表進(jìn)行排序(這是groupby函數(shù)正常工作的必要前提),隨后便可按部門進(jìn)行分組并輸出結(jié)果:
from itertools import groupby
from operator import itemgetter
# Sample data: (name, department)
employees = [
("Alice", "Engineering"),
("Bob", "Marketing"),
("Charlie", "Engineering"),
("Diana", "HR"),
("Evan", "Marketing"),
]
# Sort by department first (groupby works on consecutive items)
employees.sort(key=itemgetter(1))
# Group by department
for department, group in groupby(employees, key=itemgetter(1)):
print(f"\n{department} Department:")
for name, _ in group:
print(f" - {name}")
輸出結(jié)果:
工程部:
——愛麗絲
——查理
人力資源部:
——戴安娜
市場部:
——鮑勃
——埃文
6.collections.ChainMap-無開銷地合并字典
在需要對多個字典進(jìn)行搜索操作時,collections模塊中的ChainMap類能夠讓用戶按順序查看字典內(nèi)容,而無需實際進(jìn)行字典合并。
注意:盡管它并非函數(shù),但依然是Python標(biāo)準(zhǔn)庫中極具實用價值的類。
以下為實際應(yīng)用示例:
from collections import ChainMap
defaults = {"theme": "dark", "language": "en", "timeout": 30}
user_settings = {"theme": "light"}
session_settings = {"timeout": 60}
# Create a combined view of all settings
settings = ChainMap(session_settings, user_settings, defaults)
print(settings["theme"])
print(settings["language"])
print(settings["timeout"])
上述代碼將創(chuàng)建一個包含多個字典的視圖,該視圖會按順序查找所需的值,無需合并字典,從而實現(xiàn)對不同來源設(shè)置的優(yōu)先級排序展示。
輸出結(jié)果:
light
en
60
7.os.path.commonpath()-查找共享目錄路徑
當(dāng)需要找出多個文件路徑之間的公共目錄時,os模塊中的path.commonpath函數(shù)可滿足這一需求。通過該函數(shù),能夠從文件路徑列表中識別出最長的公共目錄路徑,用于確定一組文件的基礎(chǔ)目錄。具體操作如下:
import os.path
paths = [
"/home/user/documents/work/report.pdf",
"/home/user/documents/personal/taxes.xlsx",
"/home/user/documents/work/presentation.pptx"
]
common = os.path.commonpath(paths)
print(f"Common directory: {common}")
輸出結(jié)果:
公共目錄:/home/user/documents
綜上所述,os.path.commonpath()函數(shù)在諸如查找一組文件的公共根目錄、構(gòu)建相對路徑等實際任務(wù)中,展現(xiàn)出極高的便捷性與實用性。
結(jié)語
通過上述示例不難發(fā)現(xiàn),Python標(biāo)準(zhǔn)庫中存在諸多功能獨(dú)特的函數(shù)。盡管這些函數(shù)在日常編程中使用頻率相對較低,但針對特定場景與問題,它們能夠提供簡潔、高效且優(yōu)雅的解決方案,充分彰顯了Python標(biāo)準(zhǔn)庫的豐富性與強(qiáng)大功能。
在編程實踐過程中,當(dāng)開發(fā)者著手編寫復(fù)雜函數(shù)以解決看似常見的問題前,不妨先深入查閱Python標(biāo)準(zhǔn)庫。或許其中已存在現(xiàn)成的解決方案,如此不僅能夠節(jié)省開發(fā)時間,還能提升代碼的質(zhì)量與規(guī)范性。
此外,Python標(biāo)準(zhǔn)庫中還有許多鮮為人知卻極具價值的函數(shù),值得大家去挖掘。
原文標(biāo)題:7 “Useless” Python Standard Library Functions You Should Know,作者:Bala Priya C