關于 Python 數(shù)據(jù)分析的 15 個 NumPy 應用

作者：手把手PythonAI編程 2024-06-06 09:08:14

本文專為那些希望深入了解并掌握NumPy核心功能的數(shù)據(jù)分析新手設計。我們將通過10個實用的應用示例，帶你從基礎操作到一些高級技巧，讓你的數(shù)據(jù)分析之旅更加順暢。

歡迎來到Python數(shù)據(jù)分析的世界！對于初學者來說，NumPy是你的第一站，它是Python科學計算的基石，特別是當你想要處理數(shù)組和進行大規(guī)模數(shù)據(jù)操作時。本文專為那些希望深入了解并掌握NumPy核心功能的數(shù)據(jù)分析新手設計。我們將通過10個實用的應用示例，帶你從基礎操作到一些高級技巧，讓你的數(shù)據(jù)分析之旅更加順暢。

1. 數(shù)組創(chuàng)建與基本操作

應用示例：

創(chuàng)建數(shù)組:

import numpy as np
arr = np.array([1, 2, 3, 4])
print("簡單數(shù)組:", arr)

這段代碼創(chuàng)建了一個一維數(shù)組，并打印出來。

解釋：np.array()是創(chuàng)建NumPy數(shù)組的基本函數(shù)，它接受列表、元組等作為輸入。

2. 維度變換

改變形狀:

arr_2d = arr.reshape(2, 2)
print("二維數(shù)組:", arr_2d)

通過reshape，我們可以不改變數(shù)據(jù)的情況下，調整數(shù)組的形狀。

3. 數(shù)學運算

加法與乘法:

arr_add = arr + 10
arr_mult = arr * 2
print("加10:", arr_add, "\n乘2:", arr_mult)

數(shù)學運算在NumPy中可以直接對數(shù)組操作，非常高效。

4. 統(tǒng)計分析

求平均值與最大值:

mean_val = np.mean(arr)
max_val = np.max(arr)
print("平均值:", mean_val, "最大值:", max_val)

np.mean()和np.max()用于快速統(tǒng)計分析。

5. 布爾索引

篩選特定值:

bool_arr = arr > 2
print("大于2的索引:", bool_arr)
filtered_arr = arr[bool_arr]
print("篩選結果:", filtered_arr)

布爾索引允許根據(jù)條件選擇數(shù)組元素。

6. 隨機數(shù)生成

生成隨機數(shù)組:

random_arr = np.random.rand(3, 3)
print("3x3隨機數(shù)組:", random_arr)

np.random.rand()用于生成指定形狀的隨機數(shù)矩陣。

7. 線性代數(shù)操作

矩陣乘法:

mat1 = np.array([[1, 2], [3, 4]])
mat2 = np.array([[5, 6], [7, 8]])
product = np.dot(mat1, mat2)
print("矩陣乘法結果:", product)

np.dot()進行矩陣乘法，是機器學習中的基礎操作。

8. 廣播機制

不同形狀數(shù)組運算:

broad_arr = arr + np.array([10, 10])
print("廣播機制結果:", broad_arr)

NumPy的廣播機制允許不同形狀的數(shù)組進行運算。

9. 數(shù)據(jù)排序

排序數(shù)組:

sorted_arr = np.sort(arr)
print("排序后的數(shù)組:", sorted_arr)

np.sort()按升序排序數(shù)組。

10. 文件讀寫

保存與加載數(shù)組:

np.save('my_array.npy', arr)
loaded_arr = np.load('my_array.npy')
print("從文件加載的數(shù)組:", loaded_arr)

使用np.save()和np.load()進行數(shù)組的持久化存儲和讀取。

11.高級統(tǒng)計功能

分位數(shù)與標準差 :

# 分位數(shù)
quartiles = np.percentile(arr, [25, 50, 75])
print("四分位數(shù):", quartiles)

# 標準差與方差
std_dev = np.std(arr)
variance = np.var(arr)
print("標準差:", std_dev, "方差:", variance)

分位數(shù)和統(tǒng)計度量是評估數(shù)據(jù)分布的關鍵指標。

12.高級索引與切片

花式索引 :

# 索引數(shù)組
indices = np.array([[0, 1], [2, 2]])
print("根據(jù)索引選取元素:", arr[indices])

# 切片與步長
sliced_arr = arr[1:4:2]  # 從第二個元素開始，每隔一個取一個
print("切片結果:", sliced_arr)

花式索引讓你能以非常靈活的方式訪問數(shù)組元素。

13.內(nèi)存效率與視圖

使用視圖減少內(nèi)存消耗 :

view_arr = arr.view()
view_arr[:] = 100  # 注意：這會改變原數(shù)組，因為是視圖
print("原數(shù)組變化后:", arr)

了解視圖和副本的區(qū)別對于處理大型數(shù)據(jù)集至關重要。

14.向量化操作的威力

向量化操作是NumPy的核心優(yōu)勢，相較于Python循環(huán)，它們提供了極大的性能提升。

比較與邏輯操作 :

# 等于特定值的索引
equals_three = arr == 3
print("等于3的索引:", equals_three)

# 邏輯與
both_greater = (arr > 2) & (arr < 4)
print("大于2且小于4的索引:", both_greater)

利用邏輯操作符進行條件篩選，無需顯式循環(huán)。

15.性能優(yōu)化提示

避免循環(huán)：盡量使用向量化操作替代Python循環(huán)。
使用einsum進行復雜數(shù)組計算，它在某些情況下比直接的矩陣操作更快。
數(shù)組預分配：預先確定數(shù)組大小并分配內(nèi)存，可以避免運行時的內(nèi)存分配開銷。

責任編輯：趙寧寧來源：手把手PythonAI編程

偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p