偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

借助Python庫CuPy,發(fā)掘GPU的威力

譯文
開發(fā) 前端
無論您在從事機器學(xué)習(xí)、科學(xué)計算,還是處理龐大的數(shù)據(jù)集,CuPy都是一個絕對改變游戲規(guī)則的Python庫。

譯者 | 布加迪

審校 | 重樓

CuPy簡介

CuPy是一個Python庫,與NumPy和SciPy數(shù)組兼容,為GPU加速計算而設(shè)計。通過將NumPy換CuPy語法,您可以在英偉達CUDA或AMD ROCm平臺上運行代碼。這可以使用GPU加速執(zhí)行與數(shù)組相關(guān)的任務(wù),從而更快地處理更龐大的數(shù)組。

只需換掉幾行代碼,就可以利用GPU的大規(guī)模并行處理能力來顯著加快索引、規(guī)范化和矩陣乘法等數(shù)組操作。

CuPy還支持訪問低級CUDA功能。它允許使用RawKernels將ndarray傳遞給現(xiàn)有的CUDA C/ C++程序,借助Streams簡化性能,并允許直接調(diào)用CUDA Runtime API。

安裝CuPy

您可以使用pip安裝CuPy,但在此之前,您必須使用以下命令找到正確的CUDA版本。

!nvcc --version

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Wed_Sep_21_10:33:58_PDT_2022
Cuda compilation tools, release 11.8, V11.8.89
Build cuda_11.8.r11.8/compiler.31833905_0

谷歌Colab的當(dāng)前版本似乎使用CUDA版本11.8。因此,我們將繼續(xù)安裝cupy-cuda11x版本。

如果您使用較舊的CUDA版本,我提供了下面的表格來幫助您確定要安裝的合適的CuPy軟件包。

選擇正確的版本后,我們將使用pip安裝Python軟件包。

pip install cupy-cuda11x

如果您已安裝了Anaconda,還可以使用conda命令自動檢測并安裝CuPy軟件的正確版本

conda install -c conda-forge cupy

CuPy基礎(chǔ)知識

在本節(jié)中,我們將比較CuPy和Numpy的語法,它們相似度為95%。不是使用np,而是用cp代替它。

我們將先使用Python列表創(chuàng)建NumPy和CuPy數(shù)組。之后,我們將計算向量的范數(shù)。

import cupy as cp
import numpy as np

x = [3, 4, 5]

x_np = np.array(x)
x_cp = cp.array(x)

l2_np = np.linalg.norm(x_np)
l2_cp = cp.linalg.norm(x_cp)

print("Numpy: ", l2_np)
print("Cupy: ", l2_cp)

正如我們所,我們得到了類似的結(jié)果。

Numpy: 7.0710678118654755

Cupy: 7.0710678118654755

為了將NumPy轉(zhuǎn)換CuPy數(shù)組,只需使用cp.asarray(X)。

x_array = np.array([10, 22, 30])
x_cp_array = cp.asarray(x_array)
type(x_cp_array)

cupy.ndarray

或者,使用.get(),將CuPy轉(zhuǎn)換Numpy數(shù)組。

x_np_array = x_cp_array.get()
type(x_np_array)

numpy.ndarray

性能比較

在本節(jié)中,我們將比較NumPy和CuPy的性能。

我們將使用time.time()對代碼執(zhí)行時間進行計時。然后,我們將創(chuàng)建一個3D NumPy數(shù)組,并執(zhí)行一些數(shù)學(xué)函數(shù)。

import time

# NumPy and CPU Runtime
s = time.time()
x_cpu = np.ones((1000, 100, 1000))
np_result = np.sqrt(np.sum(x_cpu**2, axis=-1))
e = time.time()
np_time = e - s
print("Time consumed by NumPy: ", np_time)

Time consumed by NumPy: 0.5474584102630615

類似地,我們將創(chuàng)建一個3D CuPy數(shù)組,執(zhí)行數(shù)學(xué)運算,并進行計時以評測性能。

# CuPy and GPU Runtime
s = time.time()
x_gpu = cp.ones((1000, 100, 1000))
cp_result = cp.sqrt(cp.sum(x_gpu**2, axis=-1))
e = time.time()
cp_time = e - s
print("\nTime consumed by CuPy: ", cp_time)

Time consumed by CuPy: 0.001028299331665039

為了計算差異,我們將NumPy時間除以CuPy時間,我們使用CuPy獲得了500倍以上的性能提升。

diff = np_time/cp_time
print(f'\nCuPy is {diff: .2f} X time faster than NumPy')

CuPy is 532.39 X time faster than NumPy

注意為了達到更好的效果,建議進行一番預(yù)熱運行,以盡量減少時間波動。

除了速度優(yōu)勢外,CuPy還提供了出色的多GPU支持,可以充分利用多個GPU的集體計算能力。

此外,如果您想比較結(jié)果,可以看看我的Colab筆記本

結(jié)論

總之,CuPy提供了一種在英偉達GPU上加速NumPy代碼的簡單方法。只需做幾個修改,將NumPy替換CuPy,就可以體驗到數(shù)組計算在速度上有數(shù)量級的提升。這種性能提升使您可以處理龐大得多的數(shù)據(jù)集和模型,從而實現(xiàn)更先進的機器學(xué)習(xí)和科學(xué)計算。

相關(guān)資源:

原文標(biāo)題:Leveraging the Power of GPUs with CuPy in Python,作者:Abid Ali Awan

責(zé)任編輯:華軒 來源: 51CTO
相關(guān)推薦

2025-09-09 05:00:00

2023-07-31 08:45:10

Shell腳本

2009-02-20 11:05:04

Vista隱藏系統(tǒng)信息

2022-07-05 07:47:13

Python海象運算符

2025-08-26 07:50:22

2017-12-18 13:07:16

ThingWorxPTC

2023-12-21 07:09:32

Go語言任務(wù)

2010-04-13 15:45:49

2021-07-27 10:10:21

CuPyNumpyPython

2012-03-16 16:43:51

大數(shù)據(jù)業(yè)務(wù)分析IBM論壇2012

2023-11-15 11:34:03

SassBootstrap

2018-08-30 09:25:49

NVIDIA

2009-11-10 17:23:00

BMCCIOBSM

2013-06-14 09:34:24

2022-10-08 23:50:04

機器學(xué)習(xí)樹模型神經(jīng)網(wǎng)絡(luò)

2013-07-09 10:06:05

2025-07-15 08:07:47

2016-03-11 10:09:29

2014-09-11 10:57:02

命令行
點贊
收藏

51CTO技術(shù)棧公眾號