偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

看完秒懂：Linux DMA mapping機制全面解析

作者：深度Linux 2025-05-19 00:00:55

系統(tǒng) Linux

在 DMA 操作中，緩存一致性問題是一個需要特別關(guān)注的重要方面。它的產(chǎn)生會導(dǎo)致數(shù)據(jù)不一致，從而影響系統(tǒng)的正常運行。

在當今數(shù)字化時代，計算機已經(jīng)成為人們生活和工作中不可或缺的工具。從日常辦公到復(fù)雜的科學(xué)計算，從娛樂影音到工業(yè)控制，計算機無處不在。而在計算機系統(tǒng)中，數(shù)據(jù)傳輸?shù)男手苯佑绊懼麄€系統(tǒng)的性能。想象一下，如果你的電腦在讀取大型文件或者播放高清視頻時，數(shù)據(jù)傳輸緩慢，那將會是多么糟糕的體驗。

直接內(nèi)存訪問（Direct Memory Access，簡稱 DMA）技術(shù)的出現(xiàn)，就像是為計算機系統(tǒng)注入了一劑 “強心針”，極大地提升了數(shù)據(jù)傳輸?shù)男?。它允許外部設(shè)備（如硬盤、網(wǎng)絡(luò)適配器、聲卡等）直接與系統(tǒng)內(nèi)存進行數(shù)據(jù)傳輸，而無需 CPU 的頻繁干預(yù)。這就好比原本需要快遞員（CPU）親自送貨上門的包裹，現(xiàn)在可以由專門的配送車（DMA 控制器）直接送達，大大節(jié)省了快遞員的時間和精力，讓他可以去處理更重要的任務(wù)。

在 Linux 系統(tǒng)中，DMA 映射機制更是發(fā)揮著關(guān)鍵作用。它為設(shè)備驅(qū)動開發(fā)者提供了一套強大的工具，使得他們能夠充分利用 DMA 技術(shù)的優(yōu)勢，優(yōu)化設(shè)備與內(nèi)存之間的數(shù)據(jù)傳輸。無論是高性能的服務(wù)器，還是資源受限的嵌入式系統(tǒng)，Linux DMA 映射機制都有著廣泛的應(yīng)用。接下來，就讓我們一起深入探索 Linux DMA 映射機制的奧秘，從原理到實戰(zhàn)，揭開它神秘的面紗。

一、DMA映射機制是什么

1.1定義與概念

DMA 映射機制，簡單來說，就是建立設(shè)備與內(nèi)存之間直接數(shù)據(jù)傳輸通道的關(guān)鍵橋梁。在計算機系統(tǒng)中，設(shè)備要與內(nèi)存進行數(shù)據(jù)交互，以往傳統(tǒng)方式是需要 CPU 全程參與搬運數(shù)據(jù)。而有了 DMA 映射機制，設(shè)備就能夠直接訪問內(nèi)存，大大減少了 CPU 在數(shù)據(jù)傳輸過程中的介入。

比如，當我們從硬盤讀取數(shù)據(jù)到內(nèi)存時，如果沒有 DMA 映射機制，CPU 需要一個字節(jié)一個字節(jié)地從硬盤讀取數(shù)據(jù)，然后再寫入到內(nèi)存中，這就像一個人要一次次地從倉庫搬運貨物到另一個地方，非常耗費精力和時間。而有了 DMA 映射機制，就相當于有了一輛自動搬運車，它可以直接從倉庫（硬盤）將貨物（數(shù)據(jù)）搬運到指定地點（內(nèi)存），CPU 只需要在開始時告訴搬運車（DMA 控制器）要搬運多少貨物、從哪里搬到哪里等信息，之后就可以去處理其他任務(wù)，無需一直守著數(shù)據(jù)傳輸過程。

在 Linux 系統(tǒng)中，DMA 映射機制為設(shè)備驅(qū)動開發(fā)者提供了一套函數(shù)和接口，用于管理設(shè)備與內(nèi)存之間的 DMA 傳輸。通過這些接口，開發(fā)者可以分配 DMA 緩沖區(qū)、將緩沖區(qū)映射到設(shè)備可訪問的地址空間，并確保數(shù)據(jù)在設(shè)備和內(nèi)存之間的正確傳輸。

1.2作用與優(yōu)勢

提升數(shù)據(jù)傳輸效率：DMA 映射機制讓設(shè)備與內(nèi)存直接傳輸數(shù)據(jù)，擺脫了 CPU 的 “緩慢搬運”，就像從步行升級為開車，速度大幅提升。在網(wǎng)絡(luò)通信中，網(wǎng)卡通過 DMA 映射機制能快速將接收到的網(wǎng)絡(luò)數(shù)據(jù)包直接存入內(nèi)存，極大地提高了數(shù)據(jù)傳輸?shù)乃俣?，使得我們能夠流暢地瀏覽網(wǎng)頁、觀看高清視頻，享受高速網(wǎng)絡(luò)帶來的便利。

減輕 CPU 負擔：之前提到，沒有 DMA 映射機制時，CPU 在數(shù)據(jù)傳輸中扮演 “搬運工” 的角色，這會占用大量的 CPU 時間和資源。而 DMA 映射機制讓 CPU 從繁瑣的數(shù)據(jù)傳輸任務(wù)中解放出來，能夠?qū)Ｗ⒂趫?zhí)行更重要的任務(wù)，如復(fù)雜的算法計算、系統(tǒng)資源的調(diào)度等。這就好比一個公司的核心員工，不再需要去做簡單的體力勞動，而是把精力放在核心業(yè)務(wù)上，從而提高整個公司的運營效率。在服務(wù)器系統(tǒng)中，大量的數(shù)據(jù)傳輸任務(wù)如果都由 CPU 來處理，會導(dǎo)致 CPU 負載過高，系統(tǒng)響應(yīng)變慢。而有了 DMA 映射機制，CPU 可以更好地應(yīng)對多用戶的請求，保證系統(tǒng)的高效穩(wěn)定運行。

優(yōu)化系統(tǒng)整體性能：數(shù)據(jù)傳輸效率的提升和 CPU 負擔的減輕，共同作用于系統(tǒng)，使得系統(tǒng)的整體性能得到優(yōu)化。設(shè)備能夠更快地獲取和處理數(shù)據(jù)，用戶也能感受到系統(tǒng)響應(yīng)更加迅速。無論是在高性能計算領(lǐng)域，還是在日常使用的桌面電腦、移動設(shè)備中，DMA 映射機制都發(fā)揮著重要作用，為我們帶來更流暢、高效的使用體驗。

二、Linux DMA 映射機制原理

2.1基本原理

DMA 映射機制的基本原理，是把硬件設(shè)備的物理內(nèi)存地址巧妙地映射到 CPU 能夠訪問的虛擬地址空間里。這就如同給設(shè)備與 CPU 之間搭建了一條高效的 “溝通橋梁”，讓設(shè)備能直接對系統(tǒng)內(nèi)存進行數(shù)據(jù)讀寫，無需 CPU 在中間 “傳話”，從而極大地提升了數(shù)據(jù)傳輸?shù)男省?/span>

在 DMA 映射的具體過程中，內(nèi)核會精心分配一段連續(xù)的物理內(nèi)存，這段內(nèi)存就被稱為 DMA 緩沖區(qū)，它是數(shù)據(jù)傳輸?shù)?“中轉(zhuǎn)站”。比如，當我們從硬盤讀取數(shù)據(jù)到內(nèi)存時，內(nèi)核會先分配一個 DMA 緩沖區(qū)，然后硬盤的數(shù)據(jù)就可以直接傳輸?shù)竭@個緩沖區(qū)中。DMA 緩沖區(qū)的物理地址必須是硬件設(shè)備能夠輕松訪問的，就像快遞的收件地址必須是快遞員能夠找到的地方一樣。

同時，內(nèi)核會借助頁表機制，把分配好的物理地址映射到虛擬地址。頁表就像是一本地址轉(zhuǎn)換的 “字典”，通過它，CPU 能夠方便地通過虛擬地址訪問 DMA 緩沖區(qū)，就像我們通過字典查找單詞的釋義一樣。設(shè)備則可以按照物理地址，直接對這個緩沖區(qū)進行數(shù)據(jù)的讀寫操作。整個映射過程，通常包含以下幾個關(guān)鍵步驟：

分配 DMA 緩沖區(qū)：內(nèi)核會調(diào)用特定的函數(shù)，比如 dma_alloc_coherent，來為 DMA 操作精準地分配一塊合適的內(nèi)存。這個函數(shù)就像是一個 “內(nèi)存分配器”，它會根據(jù) DMA 操作的需求，找到一塊合適的內(nèi)存區(qū)域，為數(shù)據(jù)傳輸做好準備。
映射物理地址到虛擬地址：通過頁表機制，內(nèi)核會將分配得到的物理地址巧妙地映射到虛擬地址。這樣一來，CPU 就可以通過虛擬地址來訪問 DMA 緩沖區(qū)，就像我們通過不同的路徑到達同一個目的地一樣。
設(shè)置設(shè)備以使用 DMA 緩沖區(qū)：設(shè)備驅(qū)動程序會把映射后的虛擬地址準確無誤地傳遞給設(shè)備，設(shè)備依據(jù)這個地址進行數(shù)據(jù)傳輸。這就好比我們把詳細的地址告訴快遞員，讓他能夠準確地送貨上門。

2.2內(nèi)核實現(xiàn)機制

在 Linux 內(nèi)核中，DMA 操作主要由設(shè)備驅(qū)動程序來精心管理。設(shè)備驅(qū)動程序就像是一個 “管家”，它會根據(jù)設(shè)備的需求，合理地使用內(nèi)核提供的 API 來請求和運用 DMA 資源。

內(nèi)核為了支持 DMA 操作，提供了多種強大的機制，包括 DMA 緩沖區(qū)分配、地址映射和緩存一致性管理等。這些機制相互協(xié)作，共同保障了 DMA 操作的高效、穩(wěn)定運行。

DMA 緩沖區(qū)分配：內(nèi)核提供了像 dma_alloc_coherent 和 dma_alloc_noncoherent 這樣的函數(shù)，用于分配適合 DMA 操作的內(nèi)存。dma_alloc_coherent 函數(shù)分配的內(nèi)存，對 DMA 操作非常友好，能夠確保數(shù)據(jù)的一致性，就像一個專門為 DMA 操作打造的 “豪華倉庫”；而 dma_alloc_noncoherent 函數(shù)則適用于一些對數(shù)據(jù)一致性要求不那么嚴格的場景，它分配的內(nèi)存相對靈活一些，就像一個 “普通倉庫”，可以根據(jù)不同的需求來選擇使用。這些函數(shù)會充分考慮硬件對 DMA 地址對齊和連續(xù)性的要求，就像在擺放貨物時，會按照一定的規(guī)則進行排列，以方便取用。
地址映射：通過 dma_map_single 和 dma_map_sg 等函數(shù)，內(nèi)核可以將內(nèi)存區(qū)域準確地映射到設(shè)備可訪問的總線地址。dma_map_single 函數(shù)就像是一個 “地址翻譯官”，它能夠?qū)蝹€內(nèi)存頁的地址映射為設(shè)備能夠理解的總線地址；dma_map_sg 函數(shù)則更強大，它可以處理多個內(nèi)存頁組成的分散 / 聚集列表，將這些內(nèi)存頁的地址都映射為設(shè)備可訪問的總線地址，就像一個 “團隊翻譯官”，能夠同時處理多個任務(wù)。這些映射函數(shù)會根據(jù)設(shè)備的特點和需求，進行合理的地址轉(zhuǎn)換，確保設(shè)備能夠順利地訪問內(nèi)存。
緩存一致性管理：為了有效解決緩存一致性問題，內(nèi)核提供了 dma_sync_single_for_device 和 dma_sync_single_for_cpu 等函數(shù) 。當數(shù)據(jù)在 CPU 和設(shè)備之間傳輸時，這些函數(shù)就像是 “協(xié)調(diào)員”，它們會確保數(shù)據(jù)在緩存和內(nèi)存中的一致性。比如，在數(shù)據(jù)從 CPU 傳輸?shù)皆O(shè)備之前，dma_sync_single_for_device 函數(shù)會將 CPU 緩存中的數(shù)據(jù)及時刷新到內(nèi)存中，保證設(shè)備讀取到的是最新的數(shù)據(jù)；而在數(shù)據(jù)從設(shè)備傳輸?shù)?CPU 之后，dma_sync_single_for_cpu 函數(shù)會使相應(yīng)的硬件緩存行無效，防止 CPU 讀取到舊數(shù)據(jù)。通過這些函數(shù)的協(xié)同工作，有效地避免了緩存一致性問題對數(shù)據(jù)傳輸?shù)挠绊憽?/span>

三、Linux DMA 映射機制相關(guān) API

3.1常用 API 介紹

在 Linux 內(nèi)核中，為了方便開發(fā)者管理和使用 DMA 映射機制，提供了一系列功能強大的 API 。這些 API 就像是一把把 “瑞士軍刀”，涵蓋了 DMA 緩沖區(qū)的分配與釋放、地址映射與取消映射以及數(shù)據(jù)同步等多個關(guān)鍵操作，為實現(xiàn)高效的數(shù)據(jù)傳輸提供了有力支持。

⑴dma_alloc_coherent：這個函數(shù)用于分配一段適合 DMA 操作的連續(xù)內(nèi)存。它就像一個 “內(nèi)存分配專家”，能夠根據(jù)你的需求，精準地為 DMA 操作分配一塊物理地址連續(xù)的內(nèi)存區(qū)域。該函數(shù)的定義如下：

void *dma_alloc_coherent(struct device *dev, size_t size, dma_addr_t *dma_handle, gfp_t gfp);

參數(shù)說明：

dev：指向設(shè)備結(jié)構(gòu)的指針，表示與 DMA 操作相關(guān)的設(shè)備，就像告訴 “分配專家” 這塊內(nèi)存是給哪個設(shè)備用的。
size：要分配的緩沖區(qū)大小，以字節(jié)為單位，明確了需要分配多大的 “內(nèi)存空間”。
dma_handle：用于存儲分配的緩沖區(qū)的物理地址，就像一個 “地址記錄本”，記錄下分配到的物理地址，方便后續(xù)使用。
gfp：內(nèi)存分配標志，用于指定分配策略，例如GFP_KERNEL表示從內(nèi)核內(nèi)存中分配，它決定了從哪里獲取內(nèi)存資源。

⑵dma_free_coherent：與dma_alloc_coherent相對應(yīng)，用于釋放之前分配的 DMA 連續(xù)內(nèi)存。當你使用完 DMA 緩沖區(qū)后，就可以調(diào)用這個函數(shù)來釋放內(nèi)存，就像把借的東西還回去一樣。函數(shù)定義如下：

void dma_free_coherent(struct device *dev, size_t size, void *vaddr, dma_addr_t dma_handle);

參數(shù)說明：

dev、size、dma_handle：必須與dma_alloc_coherent函數(shù)調(diào)用時的參數(shù)相同，保證釋放的是正確的內(nèi)存。
vaddr：指向被分配內(nèi)存的虛擬地址，即dma_alloc_coherent函數(shù)的返回值，明確要釋放的內(nèi)存的虛擬地址。

⑶dma_map_single：該函數(shù)用于將一塊內(nèi)存區(qū)域映射到設(shè)備可訪問的總線地址。它就像是一個 “地址翻譯器”，把內(nèi)存的虛擬地址轉(zhuǎn)換成設(shè)備能夠理解的總線地址。函數(shù)定義如下：

dma_addr_t dma_map_single(struct device *dev, const void *ptr, size_t size, enum dma_transfer_direction dir);

參數(shù)說明：

ptr：指向要映射的內(nèi)存區(qū)域的指針，告訴 “翻譯器” 要翻譯哪個內(nèi)存區(qū)域的地址。
size：要映射的內(nèi)存區(qū)域的大小。
dir：數(shù)據(jù)傳輸方向，它可以是DMA_MEM_TO_DEV（數(shù)據(jù)從內(nèi)存?zhèn)鬏數(shù)皆O(shè)備）、DMA_DEV_TO_MEM（數(shù)據(jù)從設(shè)備傳輸?shù)絻?nèi)存）或DMA_BIDIRECTIONAL（雙向傳輸），明確數(shù)據(jù)傳輸?shù)姆较?，以便正確映射地址。

⑷dma_unmap_single：用于取消dma_map_single所做的映射。當你不再需要設(shè)備訪問這塊內(nèi)存時，就可以調(diào)用這個函數(shù)取消映射，就像解除 “翻譯” 關(guān)系一樣。函數(shù)定義如下：

void dma_unmap_single(struct device *dev, dma_addr_t dma_addr, size_t size, enum dma_transfer_direction dir);

參數(shù)說明與dma_map_single類似，dma_addr為要取消映射的總線地址，其他參數(shù)含義相同。

⑸dma_sync_single_for_device：在數(shù)據(jù)從 CPU 傳輸?shù)皆O(shè)備之前，使用這個函數(shù)可以確保 CPU 緩存中的數(shù)據(jù)被刷新到內(nèi)存中。它就像一個 “數(shù)據(jù)同步衛(wèi)士”，保證設(shè)備讀取到的是最新的數(shù)據(jù)。函數(shù)定義如下：

void dma_sync_single_for_device(struct device *dev, dma_addr_t dma_handle, size_t size, enum dma_transfer_direction dir);

⑹dma_sync_single_for_cpu：在數(shù)據(jù)從設(shè)備傳輸?shù)?CPU 之后，該函數(shù)用于使相應(yīng)的硬件緩存行無效。這樣可以防止 CPU 讀取到舊數(shù)據(jù)，確保數(shù)據(jù)的一致性。函數(shù)定義如下：

void dma_sync_single_for_cpu(struct device *dev, dma_addr_t dma_handle, size_t size, enum dma_transfer_direction dir);

3.2API 使用示例

下面通過一個簡單的示例代碼，展示如何在內(nèi)核模塊中使用這些 API 。假設(shè)我們要實現(xiàn)一個簡單的設(shè)備驅(qū)動，該設(shè)備通過 DMA 將數(shù)據(jù)從內(nèi)存?zhèn)鬏數(shù)皆O(shè)備。

#include <linux/module.h>
#include <linux/dma-mapping.h>
#include <linux/kernel.h>
#include <linux/device.h>

#define DMA_BUFFER_SIZE 4096 // DMA緩沖區(qū)大小

static struct device *test_device;
static void *dma_buffer;
static dma_addr_t dma_handle;

static int __init dma_example_init(void) {
    int ret;

    // 創(chuàng)建一個虛擬設(shè)備
    test_device = device_create(NULL, NULL, 0, NULL, "test_device");
    if (IS_ERR(test_device)) {
        ret = PTR_ERR(test_device);
        printk(KERN_ERR "Failed to create device: %d\n", ret);
        return ret;
    }

    // 分配DMA緩沖區(qū)
    dma_buffer = dma_alloc_coherent(test_device, DMA_BUFFER_SIZE, &dma_handle, GFP_KERNEL);
    if (!dma_buffer) {
        printk(KERN_ERR "Failed to allocate DMA buffer\n");
        device_destroy(NULL, test_device->devt);
        return -ENOMEM;
    }

    // 模擬填充DMA緩沖區(qū)數(shù)據(jù)
    memset(dma_buffer, 0x55, DMA_BUFFER_SIZE);

    // 映射DMA緩沖區(qū)到設(shè)備可訪問的地址
    dma_addr_t mapped_addr = dma_map_single(test_device, dma_buffer, DMA_BUFFER_SIZE, DMA_TO_DEVICE);
    if (dma_mapping_error(test_device, mapped_addr)) {
        printk(KERN_ERR "Failed to map DMA buffer\n");
        dma_free_coherent(test_device, DMA_BUFFER_SIZE, dma_buffer, dma_handle);
        device_destroy(NULL, test_device->devt);
        return -EINVAL;
    }

    // 同步數(shù)據(jù)到設(shè)備
    dma_sync_single_for_device(test_device, mapped_addr, DMA_BUFFER_SIZE, DMA_TO_DEVICE);

    // 這里假設(shè)已經(jīng)將mapped_addr傳遞給設(shè)備進行數(shù)據(jù)傳輸

    // 取消映射
    dma_unmap_single(test_device, mapped_addr, DMA_BUFFER_SIZE, DMA_TO_DEVICE);

    // 同步數(shù)據(jù)到CPU
    dma_sync_single_for_cpu(test_device, dma_handle, DMA_BUFFER_SIZE, DMA_TO_DEVICE);

    // 釋放DMA緩沖區(qū)
    dma_free_coherent(test_device, DMA_BUFFER_SIZE, dma_buffer, dma_handle);

    // 銷毀設(shè)備
    device_destroy(NULL, test_device->devt);

    return 0;
}

static void __exit dma_example_exit(void) {
    printk(KERN_INFO "Exiting DMA example module\n");
}

module_init(dma_example_init);
module_exit(dma_example_exit);

MODULE_LICENSE("GPL");
MODULE_AUTHOR("Your Name");
MODULE_DESCRIPTION("DMA Example Module");

在這個示例中：

首先創(chuàng)建了一個虛擬設(shè)備test_device。
使用dma_alloc_coherent分配了一個大小為DMA_BUFFER_SIZE的 DMA 緩沖區(qū)，并得到了緩沖區(qū)的虛擬地址dma_buffer和物理地址dma_handle。
使用memset函數(shù)模擬填充了緩沖區(qū)數(shù)據(jù)。
通過dma_map_single將緩沖區(qū)映射到設(shè)備可訪問的總線地址mapped_addr。
調(diào)用dma_sync_single_for_device確保數(shù)據(jù)被正確同步到設(shè)備。
假設(shè)設(shè)備已經(jīng)完成數(shù)據(jù)傳輸后，使用dma_unmap_single取消映射。
調(diào)用dma_sync_single_for_cpu使 CPU 緩存無效，確保 CPU 能讀取到最新數(shù)據(jù)。
最后使用dma_free_coherent釋放 DMA 緩沖區(qū)，并銷毀設(shè)備。

四、實戰(zhàn)應(yīng)用案例分析

4.1案例背景與需求

在一個高清視頻監(jiān)控系統(tǒng)中，攝像頭需要實時采集大量的視頻數(shù)據(jù)，并將這些數(shù)據(jù)傳輸?shù)较到y(tǒng)內(nèi)存中進行后續(xù)的處理和存儲。由于視頻數(shù)據(jù)量巨大，如果采用傳統(tǒng)的 CPU 直接傳輸方式，會導(dǎo)致 CPU 負載過高，影響系統(tǒng)的整體性能，甚至可能出現(xiàn)視頻卡頓、丟幀等問題。因此，為了提高數(shù)據(jù)傳輸效率，減輕 CPU 負擔，我們決定在該系統(tǒng)中使用 DMA 映射機制。

具體需求如下：

實現(xiàn)攝像頭設(shè)備與內(nèi)存之間的高效數(shù)據(jù)傳輸，確保視頻數(shù)據(jù)能夠?qū)崟r、穩(wěn)定地傳輸?shù)絻?nèi)存中。
合理分配和管理DMA緩沖區(qū)，避免內(nèi)存浪費和數(shù)據(jù)沖突。
確保數(shù)據(jù)傳輸?shù)恼_性和一致性，防止出現(xiàn)數(shù)據(jù)丟失或錯誤的情況。

4.2實現(xiàn)步驟與代碼展示

①設(shè)備初始化：在設(shè)備驅(qū)動中，首先需要對攝像頭設(shè)備進行初始化，包括設(shè)置設(shè)備的工作模式、分辨率、幀率等參數(shù) 。同時，創(chuàng)建一個設(shè)備結(jié)構(gòu)體，用于存儲設(shè)備相關(guān)的信息。

#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/device.h>
#include <linux/fs.h>
#include <linux/dma-mapping.h>

#define VIDEO_BUFFER_SIZE 4096 * 1024 // 視頻緩沖區(qū)大小，假設(shè)為1024KB

struct video_device {
    struct device *dev;
    void *dma_buffer;
    dma_addr_t dma_handle;
};

static struct video_device video_dev;

static int video_device_probe(struct platform_device *pdev) {
    int ret;

    // 創(chuàng)建設(shè)備
    video_dev.dev = device_create(NULL, NULL, 0, NULL, "video_device");
    if (IS_ERR(video_dev.dev)) {
        ret = PTR_ERR(video_dev.dev);
        dev_err(&pdev->dev, "Failed to create device: %d\n", ret);
        return ret;
    }

    // 初始化設(shè)備其他參數(shù)，如設(shè)置攝像頭分辨率、幀率等
    //...

    return 0;
}

static int video_device_remove(struct platform_device *pdev) {
    // 銷毀設(shè)備
    device_destroy(NULL, video_dev.dev->devt);
    return 0;
}

static struct platform_driver video_driver = {
   .probe = video_device_probe,
   .remove = video_device_remove,
   .driver = {
       .name = "video_device_driver",
    },
};

module_platform_driver(video_driver);
MODULE_LICENSE("GPL");

②DMA 緩沖區(qū)分配與映射：使用dma_alloc_coherent函數(shù)分配 DMA 緩沖區(qū)，并通過dma_map_single函數(shù)將緩沖區(qū)映射到設(shè)備可訪問的地址。

// 分配DMA緩沖區(qū)
video_dev.dma_buffer = dma_alloc_coherent(video_dev.dev, VIDEO_BUFFER_SIZE, &video_dev.dma_handle, GFP_KERNEL);
if (!video_dev.dma_buffer) {
    dev_err(video_dev.dev, "Failed to allocate DMA buffer\n");
    // 釋放設(shè)備等資源
    device_destroy(NULL, video_dev.dev->devt);
    return -ENOMEM;
}

// 映射DMA緩沖區(qū)到設(shè)備可訪問的地址
dma_addr_t mapped_addr = dma_map_single(video_dev.dev, video_dev.dma_buffer, VIDEO_BUFFER_SIZE, DMA_DEV_TO_MEM);
if (dma_mapping_error(video_dev.dev, mapped_addr)) {
    dev_err(video_dev.dev, "Failed to map DMA buffer\n");
    dma_free_coherent(video_dev.dev, VIDEO_BUFFER_SIZE, video_dev.dma_buffer, video_dev.dma_handle);
    device_destroy(NULL, video_dev.dev->devt);
    return -EINVAL;
}

③數(shù)據(jù)傳輸：在攝像頭采集到視頻數(shù)據(jù)后，通過 DMA 將數(shù)據(jù)傳輸?shù)接成浜蟮木彌_區(qū)中。這里假設(shè)設(shè)備驅(qū)動中有一個函數(shù)video_capture用于觸發(fā)數(shù)據(jù)傳輸。

static void video_capture(struct video_device *vd) {
    // 假設(shè)這里已經(jīng)配置好攝像頭開始采集數(shù)據(jù)
    //...

    // 同步數(shù)據(jù)到設(shè)備
    dma_sync_single_for_device(vd->dev, vd->dma_handle, VIDEO_BUFFER_SIZE, DMA_DEV_TO_MEM);

    // 通知設(shè)備開始DMA傳輸數(shù)據(jù)到緩沖區(qū)，這里是假設(shè)的設(shè)備操作函數(shù)
    start_dma_transfer(vd->dev, vd->dma_handle, VIDEO_BUFFER_SIZE);

    // 等待DMA傳輸完成，這里可以使用中斷或輪詢的方式，假設(shè)使用中斷
    wait_for_dma_complete(vd->dev);

    // 同步數(shù)據(jù)到CPU
    dma_sync_single_for_cpu(vd->dev, vd->dma_handle, VIDEO_BUFFER_SIZE, DMA_DEV_TO_MEM);

    // 處理傳輸?shù)骄彌_區(qū)的視頻數(shù)據(jù)，例如存儲到文件或進行圖像處理
    process_video_data(vd->dma_buffer, VIDEO_BUFFER_SIZE);
}

④資源釋放：在設(shè)備卸載時，需要釋放分配的 DMA 緩沖區(qū)和取消映射。

static int video_device_remove(struct platform_device *pdev) {
    // 取消映射
    dma_unmap_single(video_dev.dev, video_dev.dma_handle, VIDEO_BUFFER_SIZE, DMA_DEV_TO_MEM);

    // 釋放DMA緩沖區(qū)
    dma_free_coherent(video_dev.dev, VIDEO_BUFFER_SIZE, video_dev.dma_buffer, video_dev.dma_handle);

    // 銷毀設(shè)備
    device_destroy(NULL, video_dev.dev->devt);

    return 0;
}

4.3效果評估與總結(jié)

(1)效果評估：

數(shù)據(jù)傳輸效率提升：通過使用 DMA 映射機制，視頻數(shù)據(jù)能夠直接從攝像頭設(shè)備傳輸?shù)絻?nèi)存中，大大提高了數(shù)據(jù)傳輸?shù)乃俣?。在實際測試中，視頻采集的幀率從原來的 20 幀 / 秒提升到了 30 幀 / 秒，視頻播放更加流暢，幾乎沒有出現(xiàn)卡頓和丟幀的現(xiàn)象。

CPU 負載降低：原本在數(shù)據(jù)傳輸過程中占用大量 CPU 時間的任務(wù)，現(xiàn)在由 DMA 控制器來完成，CPU 可以專注于其他更重要的任務(wù) 。通過系統(tǒng)監(jiān)控工具可以看到，CPU 的使用率從原來的 80% 降低到了 30% 左右，系統(tǒng)的整體響應(yīng)速度明顯加快，能夠更好地處理其他并發(fā)任務(wù)。

(2)總結(jié)經(jīng)驗和注意事項：

內(nèi)存管理：在分配 DMA 緩沖區(qū)時，要根據(jù)實際需求合理設(shè)置緩沖區(qū)的大小。過大的緩沖區(qū)會浪費內(nèi)存資源，過小的緩沖區(qū)則可能導(dǎo)致數(shù)據(jù)傳輸不完整。同時，要注意緩沖區(qū)的釋放和映射的取消，避免內(nèi)存泄漏和資源未正確釋放的問題。
緩存一致性：由于 DMA 操作直接訪問內(nèi)存，可能會導(dǎo)致緩存一致性問題。在數(shù)據(jù)傳輸前后，一定要正確使用dma_sync_single_for_device和dma_sync_single_for_cpu等函數(shù)，確保數(shù)據(jù)在緩存和內(nèi)存中的一致性，防止出現(xiàn)數(shù)據(jù)錯誤。
設(shè)備兼容性：不同的設(shè)備可能對 DMA 映射機制的支持有所不同。在開發(fā)過程中，要充分了解設(shè)備的特性和限制，確保 DMA 操作能夠正確進行。例如，某些設(shè)備可能對 DMA 地址的對齊有特殊要求，需要在代碼中進行相應(yīng)的處理。
錯誤處理：在使用 DMA 相關(guān) API 時，要對可能出現(xiàn)的錯誤進行充分的處理。例如，分配內(nèi)存失敗、映射失敗等情況，都要及時進行錯誤提示和資源釋放，以保證系統(tǒng)的穩(wěn)定性和可靠性。

通過這個實戰(zhàn)案例，我們可以看到 Linux DMA 映射機制在提高數(shù)據(jù)傳輸效率和減輕 CPU 負擔方面具有顯著的優(yōu)勢。在實際應(yīng)用中，只要合理運用 DMA 映射機制，并注意相關(guān)的細節(jié)和問題，就能夠為各種對數(shù)據(jù)傳輸要求較高的系統(tǒng)帶來更好的性能表現(xiàn)。

五、常見問題與解決方法

5.1映射失敗問題

在使用 Linux DMA 映射機制時，可能會遇到 DMA 映射失敗的情況，這通常會給數(shù)據(jù)傳輸帶來嚴重影響。映射失敗的原因是多方面的，下面我們來詳細分析并探討相應(yīng)的解決方法

(1)內(nèi)存不足：當系統(tǒng)內(nèi)存資源緊張，無法滿足DMA緩沖區(qū)的分配需求時，就會導(dǎo)致映射失敗。這就好比倉庫里沒有足夠的空間存放貨物，貨物就無法順利入庫。在內(nèi)存不足的情況下，dma_alloc_coherent 等分配內(nèi)存的函數(shù)會返回 NULL，表示分配失敗。

解決方法：

優(yōu)化內(nèi)存使用：檢查系統(tǒng)中其他部分的內(nèi)存使用情況，盡量減少不必要的內(nèi)存占用 ?？梢酝ㄟ^優(yōu)化代碼，及時釋放不再使用的內(nèi)存資源，就像定期清理倉庫，騰出空間來存放新的貨物。
增加物理內(nèi)存：如果條件允許，為系統(tǒng)添加更多的物理內(nèi)存，以滿足 DMA 操作和其他系統(tǒng)任務(wù)的需求。這就如同擴大倉庫的面積，從而能夠容納更多的貨物。

(2)地址對齊問題：硬件設(shè)備通常對DMA地址的對齊有特定要求。如果分配的內(nèi)存地址不滿足設(shè)備要求的對齊方式，就可能導(dǎo)致映射失敗。比如，某些設(shè)備要求DMA地址必須是 4 字節(jié)對齊、8 字節(jié)對齊或者更高的倍數(shù)對齊。

解決方法：

使用合適的內(nèi)存分配函數(shù)：Linux 內(nèi)核提供的 dma_alloc_coherent 等函數(shù)會自動考慮地址對齊問題。在分配內(nèi)存時，優(yōu)先使用這些專門為 DMA 操作設(shè)計的函數(shù)，確保分配的內(nèi)存地址滿足設(shè)備的對齊要求，就像按照特定的規(guī)格來擺放貨物，使其符合設(shè)備的 “接收標準”。
手動調(diào)整地址：如果使用其他內(nèi)存分配方式，需要手動檢查和調(diào)整地址對齊。可以通過位運算等方式，將分配得到的地址調(diào)整為符合設(shè)備要求的對齊地址，不過這種方法需要對硬件和內(nèi)存管理有深入的了解，操作時要格外小心。

(3)設(shè)備不支持：部分老舊設(shè)備可能對某些類型的 DMA 映射不支持，或者設(shè)備本身存在硬件故障。這就好比一輛老舊的汽車，可能無法使用最新的導(dǎo)航系統(tǒng)，或者因為某些部件損壞而無法正常行駛。

解決方法：

查閱設(shè)備文檔：仔細查閱設(shè)備的技術(shù)文檔，了解設(shè)備對 DMA 映射的支持情況。如果設(shè)備不支持特定的映射方式，可以嘗試尋找其他兼容的方法，或者更換支持的設(shè)備，就像如果汽車不支持某種導(dǎo)航系統(tǒng)，就考慮使用其他適合的導(dǎo)航設(shè)備。
檢查設(shè)備硬件：對設(shè)備進行硬件檢測，排查是否存在硬件故障。如果發(fā)現(xiàn)設(shè)備硬件有問題，及時進行維修或更換，確保設(shè)備能夠正常工作，為 DMA 映射提供可靠的硬件基礎(chǔ)。

5.2緩存一致性問題

在 DMA 操作中，緩存一致性問題是一個需要特別關(guān)注的重要方面。它的產(chǎn)生會導(dǎo)致數(shù)據(jù)不一致，從而影響系統(tǒng)的正常運行。

產(chǎn)生原因：CPU 在訪問內(nèi)存時，為了提高訪問速度，通常會使用高速緩存（Cache）。當數(shù)據(jù)在 CPU 和設(shè)備之間傳輸時，由于 DMA 操作直接訪問內(nèi)存，而不經(jīng)過 CPU 的緩存，這就可能導(dǎo)致緩存中的數(shù)據(jù)與內(nèi)存中的數(shù)據(jù)不一致。

例如，當設(shè)備通過 DMA 向內(nèi)存寫入數(shù)據(jù)后，CPU 緩存中的數(shù)據(jù)可能還是舊的，此時 CPU 讀取數(shù)據(jù)時，就會讀取到錯誤的數(shù)據(jù)。這就好比一個倉庫有兩個入口，一個入口（CPU）有自己的小倉庫（緩存），另一個入口（DMA）直接進入大倉庫（內(nèi)存）。如果從 DMA 入口放入了新貨物到倉庫，但小倉庫里的貨物沒有更新，那么從 CPU 入口取貨時，就可能取到舊的貨物。

解決機制和方法：為了解決緩存一致性問題，Linux內(nèi)核提供了一系列機制和方法。

第一種：使用 dma_sync 系列函數(shù)，如前面提到的 dma_sync_single_for_device 和 dma_sync_single_for_cpu 等函數(shù) 。在數(shù)據(jù)從 CPU 傳輸?shù)皆O(shè)備之前，調(diào)用 dma_sync_single_for_device 函數(shù)，它會將 CPU 緩存中的數(shù)據(jù)刷新到內(nèi)存中，保證設(shè)備讀取到的是最新的數(shù)據(jù)，就像把小倉庫里的貨物更新到大倉庫里。在數(shù)據(jù)從設(shè)備傳輸?shù)?CPU 之后，調(diào)用 dma_sync_single_for_cpu 函數(shù)，使相應(yīng)的硬件緩存行無效，防止 CPU 讀取到舊數(shù)據(jù)，就像清空小倉庫里的舊貨物，以便重新從大倉庫獲取新貨物。

第二種：緩存一致性協(xié)議，硬件層面通常會采用一些緩存一致性協(xié)議，如 MESI 協(xié)議（Modified Exclusive Shared Invalid）。這些協(xié)議通過協(xié)調(diào)多個 CPU 核心和設(shè)備之間的緩存狀態(tài)，確保數(shù)據(jù)的一致性。MESI 協(xié)議定義了緩存行的四種狀態(tài)：已修改（Modified）、獨占（Exclusive）、共享（Shared）和無效（Invalid）。通過狀態(tài)的轉(zhuǎn)換和消息的傳遞，保證各個緩存之間的數(shù)據(jù)同步，就像制定了一套規(guī)則，讓各個入口在操作貨物時能夠保持一致。

責(zé)任編輯：武曉燕來源：深度Linux

Linux 機制 DMA

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<legend id="ronh6"><li id="ronh6"><menuitem id="ronh6"></menuitem></li></legend>

<sub id="ronh6"></sub>