偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<sub id="pvna0"><p id="pvna0"></p></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

三分鐘掌握零拷貝的那些事

作者：龍蝦編程 2025-02-13 08:04:49

開發(fā) 前端

splice是在內(nèi)核空間的緩存區(qū)和socket緩存區(qū)之間建立管道，從而避免了兩者之間的CPU拷貝操作。?splice的整個(gè)拷貝過程發(fā)生了2次用戶態(tài)和內(nèi)核態(tài)的切換，2次數(shù)據(jù)的拷貝（2次DMA拷貝、0次CPU拷貝）。

零拷貝可以直觀的理解為不需要將數(shù)據(jù)從一個(gè)存儲區(qū)域拷貝到另外一個(gè)存儲區(qū)域，從而提高數(shù)據(jù)的效率。這里的零是指CPU參與整個(gè)拷貝過程的次數(shù)。下面我們來聊聊傳統(tǒng)的數(shù)據(jù)傳輸（write+read）和零拷貝的幾種實(shí)現(xiàn)方式的數(shù)據(jù)傳輸原理。

1、write+read數(shù)據(jù)傳輸?shù)脑?/span>

在我們的Java代碼中傳輸?shù)臄?shù)據(jù)時(shí)候會用到write方法，write方法寫數(shù)據(jù)發(fā)送到網(wǎng)卡的過程如下圖所示：

圖片

然后接收方使用read方法從網(wǎng)卡接收數(shù)據(jù)的流程如下圖所示：

圖片

通過write+read的方式我們就可以實(shí)現(xiàn)數(shù)據(jù)的傳輸，但是在這兩個(gè)方法背后是需要做很多的工作，如下所示的原理圖：

圖片

當(dāng)我們調(diào)用read方法的時(shí)候，首先需要從用戶態(tài)切換到內(nèi)核態(tài)，然后通過DMA拷貝（Direct Memory Access，即直接內(nèi)存訪問。DMA本質(zhì)上是一塊主板上獨(dú)立的芯片，允許外設(shè)設(shè)備和內(nèi)存存儲器之間直接進(jìn)行IO數(shù)據(jù)傳輸，其過程不需要CPU的參與）將磁盤里面的文件拷貝到內(nèi)核緩沖區(qū)上，數(shù)據(jù)拷貝到內(nèi)存緩沖區(qū)之后又需要進(jìn)行內(nèi)核態(tài)轉(zhuǎn)化為用戶態(tài)，將內(nèi)核緩沖區(qū)中的數(shù)據(jù)拷貝到用戶緩沖區(qū)。這里涉及到2次的狀態(tài)切換、1次DMA拷貝、1次CPU拷貝。

文件數(shù)據(jù)拷貝到用戶緩存區(qū)之后，首先需要從用戶態(tài)切換到內(nèi)核態(tài)，然后通過調(diào)用write方法，此時(shí)CPU就會將用戶緩存區(qū)的文件數(shù)據(jù)拷貝到內(nèi)核的socket緩存區(qū)上，最后通過DMA拷貝將數(shù)據(jù)拷貝到網(wǎng)卡上，當(dāng)數(shù)據(jù)拷貝到網(wǎng)卡成功后再從內(nèi)核態(tài)切換到用戶態(tài)。

傳統(tǒng)的文件傳輸?shù)恼麄€(gè)過程中，涉及到了4次用戶態(tài)與內(nèi)核態(tài)的上下文切換，執(zhí)行了4次數(shù)據(jù)的拷貝（2次DMA拷貝、2次CPU拷貝）。

在文件數(shù)據(jù)傳輸?shù)倪^程中，我們的目的就是將磁盤的文件發(fā)送到網(wǎng)卡上

圖片

但是文件數(shù)據(jù)需要經(jīng)過多個(gè)過程才能到達(dá)網(wǎng)卡，于是就研究人員提出了通過減少用戶態(tài)和內(nèi)核態(tài)的轉(zhuǎn)換或者減少內(nèi)存拷貝的次數(shù)的方式來提高文件拷貝的效率，這就是零拷貝技術(shù)產(chǎn)生的背景。

2、mmap + write

使用mmap+write方式替換原來的傳統(tǒng)IO方式，實(shí)質(zhì)就是利用了虛擬內(nèi)存。虛擬內(nèi)存在現(xiàn)代操作系統(tǒng)使用很廣泛，其特性如下所示:

（a）多個(gè)虛擬內(nèi)存可以指向同一個(gè)物理地址。

（b）虛擬內(nèi)存空間可以遠(yuǎn)遠(yuǎn)大于物理內(nèi)存空間。

mmap正是利用第一條特性，將內(nèi)核空間和用戶空間的虛擬地址映射到同一個(gè)物理地址，這樣在IO操作時(shí)就不需要來回復(fù)制了，如下所示的虛擬內(nèi)存示意圖：

圖片

mmap + write實(shí)現(xiàn)的零拷貝的流程圖如下所示：

圖片

當(dāng)調(diào)用mmap方法的時(shí)候，首先從用戶態(tài)切換到內(nèi)核態(tài)，然后將磁盤文件使用DMA拷貝到內(nèi)核緩存區(qū)，由于內(nèi)核緩沖區(qū)與用戶緩沖區(qū)已經(jīng)完成了映射（虛擬內(nèi)存），所以這個(gè)時(shí)候就不需要將數(shù)據(jù)從內(nèi)核緩沖區(qū)拷貝到用戶緩存區(qū)，當(dāng)數(shù)據(jù)拷貝到內(nèi)核緩沖區(qū)之后，又要從內(nèi)核態(tài)切換到用戶態(tài)。

當(dāng)調(diào)用write方法的時(shí)候，進(jìn)程要從用戶態(tài)切換到內(nèi)核態(tài)，然后進(jìn)程直接操作內(nèi)核緩沖區(qū)里面的數(shù)據(jù)拷貝到socket緩沖區(qū)中，拷貝到socket緩沖區(qū)完成后，再通過DMA拷貝到網(wǎng)卡，網(wǎng)上數(shù)據(jù)拷貝完成之后又要從內(nèi)核態(tài)切換到用戶態(tài)。

整個(gè)過程還是存在了4次用戶態(tài)和內(nèi)核態(tài)的切換，發(fā)生了3次數(shù)據(jù)的拷貝（2次DMA拷貝、1次CPU拷貝），雖然相比于傳統(tǒng)的文件傳輸過程少了一次CPU拷貝，數(shù)據(jù)的傳輸?shù)男视幸欢ǖ奶嵘?/span>

3、sendfile

sendfile是Linux2.1版本提供的一個(gè)系統(tǒng)調(diào)用函數(shù)，主要是負(fù)責(zé)發(fā)送文件的。只需要調(diào)用sendfile函數(shù)就可以完成整個(gè)文件拷貝的過程，如下圖所示的流程圖：

圖片

當(dāng)調(diào)用sendfile的時(shí)候，首先需要從用戶態(tài)切換到內(nèi)核態(tài)，使用DMA拷貝將文件拷貝到內(nèi)核緩存區(qū)，然后將內(nèi)核緩存區(qū)的數(shù)據(jù)通過CPU拷貝到socket的緩存區(qū)，最后再通過DMA拷貝數(shù)據(jù)到網(wǎng)卡上，完成網(wǎng)卡數(shù)據(jù)拷貝后再從內(nèi)核態(tài)切換到用戶態(tài)。

sendfile實(shí)現(xiàn)數(shù)據(jù)傳輸?shù)?/span>過程存在了2次用戶態(tài)和內(nèi)核態(tài)的切換，發(fā)生了3次數(shù)據(jù)的拷貝（2次DMA拷貝、1次CPU拷貝），相比于mmap + write的方式又提升了一些效率。

4、sendfile + SG-DMA

在Linux2.4版本中網(wǎng)卡支持SG-DMA技術(shù)，那么使用SG-DMA可以進(jìn)一步的優(yōu)化零拷貝的過程，如下所示的流程圖：

圖片

當(dāng)調(diào)用sendfile的時(shí)候，首先用戶態(tài)切換到內(nèi)核態(tài)，然后使用DMA拷貝將文件從磁盤拷貝到內(nèi)核緩存區(qū)，接下來它就會將描述符和數(shù)據(jù)長度發(fā)送到socket緩存區(qū)，這樣就可以直接將數(shù)據(jù)從內(nèi)核緩存區(qū)通過SG-DMA拷貝到網(wǎng)卡，數(shù)據(jù)拷貝到網(wǎng)卡上結(jié)束后再從內(nèi)核態(tài)切換到用戶態(tài)。

通過SG-DMA拷貝就不需要將數(shù)據(jù)拷貝到socket緩存區(qū)再通過DMA的方式拷貝到網(wǎng)卡了，而是直接從內(nèi)核緩存區(qū)拷貝到網(wǎng)卡。整個(gè)過程存在了2次用戶態(tài)和內(nèi)核態(tài)的切換，發(fā)生了2次數(shù)據(jù)的拷貝（2次DMA拷貝、0次CPU拷貝）。

send file + SG-DMA算是真正意義上實(shí)現(xiàn)了零拷貝技術(shù)，它在整個(gè)過程都是通過DMA在系統(tǒng)內(nèi)核完成的，數(shù)據(jù)拷貝不需要CPU參與。

5、splice

在Linux2.6.17內(nèi)核版本中引入了splice系統(tǒng)調(diào)用方法，splice和sendfle方法不同點(diǎn)在于它是不需要硬件支持。如下所示的splice原理圖：

圖片

splice是在內(nèi)核空間的緩存區(qū)和socket緩存區(qū)之間建立管道，從而避免了兩者之間的CPU拷貝操作。splice的整個(gè)拷貝過程發(fā)生了2次用戶態(tài)和內(nèi)核態(tài)的切換，2次數(shù)據(jù)的拷貝（2次DMA拷貝、0次CPU拷貝）。

總結(jié)：

（1）無論是傳統(tǒng)的IO方式還是零拷貝技術(shù)，2次DMA拷貝是必備的（DMA都是依賴硬件完成的），零拷貝只是減少CPU拷貝與上下文的切換（用戶態(tài)和內(nèi)核態(tài)的切換）。

（2）零拷貝的實(shí)現(xiàn)有mmap+write、sendfile、sendfile + SG-DMA、splice等方式。

（3）不是所有的操作系統(tǒng)都支持零拷貝技術(shù)，目前只有在使用NIO和 Epoll數(shù)據(jù)傳輸時(shí)才可使用。

（4）RocketMQ和Kafka都使用到了零拷貝的技術(shù)。其中，RocketMQ中生產(chǎn)者發(fā)送數(shù)據(jù)、消費(fèi)者讀取數(shù)據(jù)都是使用mmap+write方式；而Kafka的生產(chǎn)者持久化數(shù)據(jù)使用mmap+write方法，消費(fèi)者讀取數(shù)據(jù)使用sendfile方式。

（5）Java的NIO中MappedByteBuffer底層使用的是mmap；FileChannel的transferTo()/transferFrom()，底層使用sendfile。

責(zé)任編輯：武曉燕來源：龍蝦編程

splice CPU 數(shù)據(jù)

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<noframes id="izbwd"><font id="izbwd"><optgroup id="izbwd"></optgroup></font></noframes>

<font id="izbwd"><optgroup id="izbwd"></optgroup></font>