偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<p id="nxqkv"><strike id="nxqkv"></strike></p><code id="nxqkv"><optgroup id="nxqkv"></optgroup></code>

<xmp id="nxqkv"><p id="nxqkv"></p></xmp>

<u id="nxqkv"></u>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

一文講清楚：數(shù)據(jù)并行、流水并行、模型并行

發(fā)布于 2025-6-6 06:54

瀏覽

0收藏

1. 數(shù)據(jù)并行

1.1 數(shù)據(jù)并行的定義與原理

數(shù)據(jù)并行是一種常見的并行計算策略，它通過將數(shù)據(jù)集分割成多個子集，然后在多個處理器或計算節(jié)點上并行處理這些子集來加速計算過程。每個處理器或節(jié)點處理的數(shù)據(jù)子集是整個數(shù)據(jù)集的一部分，它們獨立地執(zhí)行相同的計算任務(wù)，最終將結(jié)果匯總以得到全局結(jié)果。

在深度學(xué)習(xí)中，數(shù)據(jù)并行通常用于訓(xùn)練大規(guī)模神經(jīng)網(wǎng)絡(luò)。例如，在訓(xùn)練一個圖像分類模型時，可以將訓(xùn)練數(shù)據(jù)集分割成多個小批量（mini-batch），然后將這些小批量分配給不同的 GPU 進(jìn)行并行訓(xùn)練。每個 GPU 計算其對應(yīng)小批量的梯度，然后通過某種方式（如參數(shù)服務(wù)器或 All-Reduce 算法）將這些梯度匯總并更新模型參數(shù)。通過這種方式，可以顯著提高模型訓(xùn)練的速度，尤其是在數(shù)據(jù)量非常大的情況下。

1.2 數(shù)據(jù)并行的優(yōu)勢與局限

數(shù)據(jù)并行的優(yōu)勢主要體現(xiàn)在以下幾個方面：

加速訓(xùn)練過程：通過在多個處理器或節(jié)點上并行處理數(shù)據(jù)，可以顯著減少單次迭代的時間，從而加快模型的訓(xùn)練速度。例如，使用 8 個 GPU 進(jìn)行數(shù)據(jù)并行訓(xùn)練，理論上可以將訓(xùn)練時間縮短到單 GPU 的 1/8。
易于實現(xiàn)：數(shù)據(jù)并行的實現(xiàn)相對簡單，因為它不需要對模型結(jié)構(gòu)進(jìn)行修改，只需將數(shù)據(jù)分割并分配給不同的計算資源即可。許多深度學(xué)習(xí)框架（如 TensorFlow 和 PyTorch）都提供了內(nèi)置的數(shù)據(jù)并行支持，使得開發(fā)者可以輕松地實現(xiàn)數(shù)據(jù)并行。
可擴(kuò)展性強(qiáng)：數(shù)據(jù)并行可以通過增加計算資源（如更多的 GPU 或計算節(jié)點）來進(jìn)一步提高訓(xùn)練速度，具有良好的可擴(kuò)展性。在大規(guī)模分布式訓(xùn)練中，數(shù)據(jù)并行是一種常用的加速手段。

然而，數(shù)據(jù)并行也存在一些局限性：

通信開銷：在數(shù)據(jù)并行中，不同處理器或節(jié)點之間需要頻繁地通信以同步模型參數(shù)或梯度。這種通信開銷可能會抵消部分并行計算帶來的加速效果，尤其是在網(wǎng)絡(luò)帶寬有限或節(jié)點數(shù)量較多的情況下。例如，當(dāng)使用大量的 GPU 進(jìn)行數(shù)據(jù)并行訓(xùn)練時，如果網(wǎng)絡(luò)帶寬不足，可能會導(dǎo)致訓(xùn)練速度下降。
內(nèi)存需求：每個處理器或節(jié)點都需要存儲完整的模型參數(shù)，這可能會導(dǎo)致內(nèi)存需求增加。對于大型模型，這可能會成為限制數(shù)據(jù)并行規(guī)模的一個因素。例如，如果一個模型的參數(shù)量非常大，每個 GPU 都需要有足夠的內(nèi)存來存儲這些參數(shù)，否則可能會導(dǎo)致內(nèi)存不足的問題。
數(shù)據(jù)分割問題：數(shù)據(jù)并行需要將數(shù)據(jù)集分割成多個子集，但數(shù)據(jù)分割的方式可能會影響訓(xùn)練效果。如果數(shù)據(jù)分割不均勻或存在數(shù)據(jù)分布偏差，可能會導(dǎo)致不同處理器或節(jié)點的訓(xùn)練結(jié)果不一致，從而影響模型的最終性能。

2. 流水并行

2.1 流水并行的定義與原理

一文講清楚：數(shù)據(jù)并行、流水并行、模型并行-AI.x社區(qū) 圖片

流水并行是一種將計算任務(wù)分解為多個階段，并讓這些階段依次執(zhí)行的并行計算策略。每個階段完成一部分計算任務(wù)，數(shù)據(jù)在各個階段之間依次流動，類似于工廠中的流水線生產(chǎn)過程。在深度學(xué)習(xí)中，流水并行通常用于處理大規(guī)模模型的訓(xùn)練和推理任務(wù)。

以訓(xùn)練一個超大規(guī)模的神經(jīng)網(wǎng)絡(luò)為例，可以將網(wǎng)絡(luò)的不同層分配到不同的計算節(jié)點上。假設(shè)一個模型有 10 層，可以將前 3 層分配到節(jié)點 A，中間 4 層分配到節(jié)點 B，最后 3 層分配到節(jié)點 C。數(shù)據(jù)首先在節(jié)點 A 上完成前 3 層的計算，然后將結(jié)果傳遞到節(jié)點 B，繼續(xù)完成中間 4 層的計算，最后傳遞到節(jié)點 C 完成最后 3 層的計算并輸出結(jié)果。通過這種方式，各個節(jié)點可以同時處理不同的數(shù)據(jù)批次，從而提高整體的計算效率。

流水并行的核心在于合理劃分計算階段，并確保數(shù)據(jù)在各個階段之間的高效傳輸和同步。為了實現(xiàn)高效的流水并行，需要解決以下幾個關(guān)鍵問題：

階段劃分：需要根據(jù)模型的結(jié)構(gòu)和計算特性，合理地將模型劃分為多個階段。劃分的粒度需要適中，如果劃分過細(xì)，會導(dǎo)致過多的通信開銷；如果劃分過粗，則無法充分利用計算資源。
數(shù)據(jù)傳輸：在各個階段之間需要高效地傳輸數(shù)據(jù)，以減少數(shù)據(jù)等待的時間。這通常需要優(yōu)化數(shù)據(jù)傳輸?shù)姆绞胶蛥f(xié)議，例如采用高速網(wǎng)絡(luò)通信技術(shù)或優(yōu)化數(shù)據(jù)傳輸?shù)母袷健?/li>
同步機(jī)制：在流水線的各個階段之間需要有合適的同步機(jī)制，以確保數(shù)據(jù)的正確性和一致性。例如，在訓(xùn)練過程中，需要確保各個階段的梯度更新是同步的，以避免出現(xiàn)梯度不一致的問題。

2.2 流水并行的應(yīng)用場景

流水并行在處理大規(guī)模模型的訓(xùn)練和推理任務(wù)中具有廣泛的應(yīng)用場景，尤其是在以下幾種情況中表現(xiàn)出顯著的優(yōu)勢：

超大規(guī)模模型訓(xùn)練：隨著模型規(guī)模的不斷增大，單個計算節(jié)點的資源往往無法滿足模型的訓(xùn)練需求。例如，像 GPT-3 這樣的超大規(guī)模語言模型，其參數(shù)量達(dá)到了 1750 億個。在這種情況下，流水并行可以將模型的不同部分分配到多個計算節(jié)點上，通過流水線的方式進(jìn)行訓(xùn)練，從而有效地利用多個節(jié)點的計算資源，加速模型的訓(xùn)練過程。
分布式推理：在模型推理階段，尤其是面對高并發(fā)的推理請求時，流水并行可以將推理任務(wù)分解為多個階段，并在多個計算節(jié)點上并行執(zhí)行。例如，在一個大規(guī)模的圖像識別系統(tǒng)中，面對大量的圖像推理請求，可以將圖像預(yù)處理、特征提取、分類等階段分別分配到不同的節(jié)點上，通過流水線的方式進(jìn)行推理，從而提高系統(tǒng)的吞吐量和響應(yīng)速度。
多任務(wù)學(xué)習(xí)：在多任務(wù)學(xué)習(xí)場景中，一個模型需要同時處理多個不同的任務(wù)。流水并行可以將不同任務(wù)的計算過程分解為多個階段，并在多個計算節(jié)點上并行執(zhí)行。例如，在一個同時進(jìn)行語音識別和語音合成的多任務(wù)模型中，可以將語音識別的各個階段和語音合成的各個階段分別分配到不同的節(jié)點上，通過流水線的方式進(jìn)行計算，從而提高多任務(wù)模型的計算效率。

3. 模型并行

3.1 模型并行的定義與原理

模型并行是一種將模型的不同部分分配到多個計算設(shè)備上進(jìn)行并行計算的策略。與數(shù)據(jù)并行不同，模型并行側(cè)重于對模型結(jié)構(gòu)的拆分，而不是對數(shù)據(jù)的分割。在深度學(xué)習(xí)中，隨著模型規(guī)模的不斷增大，單個計算設(shè)備的內(nèi)存和計算能力往往無法滿足模型的需求，因此模型并行成為了處理大規(guī)模模型的有效手段。

模型并行的原理是將模型的不同層或不同模塊分配到不同的計算設(shè)備上，每個設(shè)備只負(fù)責(zé)計算模型的一部分。例如，一個深度神經(jīng)網(wǎng)絡(luò)可以將前幾層分配到設(shè)備 A，中間幾層分配到設(shè)備 B，最后幾層分配到設(shè)備 C。在訓(xùn)練過程中，數(shù)據(jù)依次通過這些設(shè)備，每個設(shè)備只處理其負(fù)責(zé)的模型部分，并將中間結(jié)果傳遞給下一個設(shè)備。通過這種方式，可以充分利用多個設(shè)備的計算資源，從而加速模型的訓(xùn)練和推理過程。

模型并行的關(guān)鍵在于合理地劃分模型結(jié)構(gòu)，并確保不同設(shè)備之間的高效通信和同步。例如，對于一個具有復(fù)雜結(jié)構(gòu)的模型，如Transformer架構(gòu)，可以將不同的注意力模塊和前饋網(wǎng)絡(luò)模塊分配到不同的設(shè)備上。這種劃分方式不僅可以減少單個設(shè)備的內(nèi)存壓力，還可以提高計算效率。同時，為了確保模型的正確性，需要在設(shè)備之間進(jìn)行高效的參數(shù)同步和梯度更新。

3.2 模型并行的挑戰(zhàn)與應(yīng)對

模型并行雖然在處理大規(guī)模模型方面具有顯著優(yōu)勢，但也面臨著一些挑戰(zhàn)：

內(nèi)存限制：盡管模型并行可以將模型的不同部分分配到多個設(shè)備上，但每個設(shè)備仍然需要存儲部分模型參數(shù)。對于超大規(guī)模模型，即使進(jìn)行了模型并行劃分，單個設(shè)備的內(nèi)存也可能無法滿足需求。例如，像GPT-3這樣的模型，即使將其劃分為多個部分，每個部分的參數(shù)量仍然非常大，可能會超出單個GPU的內(nèi)存容量。
通信開銷：模型并行需要在不同設(shè)備之間頻繁地傳輸中間結(jié)果和參數(shù)，這會產(chǎn)生較大的通信開銷。尤其是在設(shè)備數(shù)量較多或網(wǎng)絡(luò)帶寬有限的情況下，通信開銷可能會成為性能瓶頸。例如，在分布式訓(xùn)練中，如果設(shè)備之間的通信延遲較高，可能會導(dǎo)致訓(xùn)練速度顯著下降。
同步復(fù)雜性：在模型并行中，不同設(shè)備之間的計算任務(wù)需要保持同步，以確保模型的正確性和一致性。這需要復(fù)雜的同步機(jī)制來協(xié)調(diào)各個設(shè)備的計算進(jìn)度。例如，在訓(xùn)練過程中，需要確保每個設(shè)備在更新參數(shù)之前都已完成其負(fù)責(zé)的計算任務(wù)，并且各個設(shè)備之間的梯度更新需要同步進(jìn)行。

為了應(yīng)對這些挑戰(zhàn)，研究人員和工程師們提出了多種解決方案：

混合精度訓(xùn)練：通過使用混合精度技術(shù)，可以在模型并行中減少內(nèi)存需求?；旌暇扔?xùn)練允許模型在訓(xùn)練過程中同時使用單精度和半精度浮點數(shù)，從而在不顯著影響模型性能的情況下，降低內(nèi)存使用量。例如，NVIDIA的Tensor Core技術(shù)支持混合精度訓(xùn)練，可以在模型并行中有效減少內(nèi)存占用，同時提高計算效率。
優(yōu)化通信協(xié)議：為了減少通信開銷，可以采用高效的通信協(xié)議和算法。例如，使用NVIDIA的NCCL（NVIDIA Collective Communications Library）庫可以顯著提高設(shè)備之間的通信效率。此外，通過優(yōu)化數(shù)據(jù)傳輸?shù)母袷胶头绞剑部梢詼p少通信開銷。例如，在傳輸中間結(jié)果時，可以采用壓縮技術(shù)來減少數(shù)據(jù)量。
異步更新機(jī)制：為了降低同步復(fù)雜性，可以采用異步更新機(jī)制。在這種機(jī)制下，各個設(shè)備不需要嚴(yán)格同步更新參數(shù)，而是可以在一定范圍內(nèi)獨立進(jìn)行計算和更新。雖然異步更新可能會引入一定的誤差，但通過合理的控制和調(diào)整，可以在保證模型性能的同時，提高訓(xùn)練效率。例如，在一些大規(guī)模分布式訓(xùn)練中，采用異步更新機(jī)制可以顯著減少同步開銷，提高訓(xùn)練速度。

4. 三種并行方式的比較

4.1 效率對比

在效率方面，三種并行方式各有特點：

數(shù)據(jù)并行：其加速比接近線性，理論上使用個計算節(jié)點可以將訓(xùn)練時間縮短到單節(jié)點的。例如，在使用8個GPU進(jìn)行數(shù)據(jù)并行訓(xùn)練時，訓(xùn)練速度可以顯著提升。然而，當(dāng)節(jié)點數(shù)量過多時，通信開銷會逐漸增加，導(dǎo)致加速比下降。根據(jù)實驗數(shù)據(jù)，當(dāng)節(jié)點數(shù)量從8增加到16時，數(shù)據(jù)并行的加速比可能會從接近8倍下降到6倍左右。
流水并行：流水并行的效率取決于流水線的利用率和數(shù)據(jù)傳輸?shù)男省Ｔ诶硐肭闆r下，流水并行可以實現(xiàn)較高的吞吐量，尤其是在處理大規(guī)模模型時。例如，在訓(xùn)練一個超大規(guī)模語言模型時，流水并行可以將模型的不同部分分配到多個節(jié)點上，每個節(jié)點同時處理不同的數(shù)據(jù)批次，從而顯著提高整體計算效率。然而，流水并行的效率也受到階段劃分和同步機(jī)制的影響。如果階段劃分不合理或數(shù)據(jù)傳輸延遲較高，可能會導(dǎo)致流水線的利用率下降。
模型并行：模型并行的效率主要取決于模型結(jié)構(gòu)的劃分和通信開銷。對于復(fù)雜的模型結(jié)構(gòu)，如Transformer架構(gòu)，模型并行可以顯著提高訓(xùn)練效率。例如，通過將不同的注意力模塊和前饋網(wǎng)絡(luò)模塊分配到不同的設(shè)備上，可以充分利用多個設(shè)備的計算資源。然而，模型并行的通信開銷較大，尤其是在設(shè)備數(shù)量較多或網(wǎng)絡(luò)帶寬有限的情況下。根據(jù)實驗數(shù)據(jù)，模型并行的通信開銷可能會占到總計算時間的30%以上，這在一定程度上限制了其加速效果。

4.2 適用場景對比

三種并行方式在不同的應(yīng)用場景中各有優(yōu)勢：

數(shù)據(jù)并行：適用于數(shù)據(jù)量較大且模型規(guī)模相對較小的場景。例如，在訓(xùn)練圖像分類模型時，數(shù)據(jù)并行可以快速處理大量的訓(xùn)練數(shù)據(jù)，加速模型的訓(xùn)練過程。此外，數(shù)據(jù)并行也適用于需要快速迭代和調(diào)優(yōu)的場景，因為它可以快速得到全局結(jié)果，便于調(diào)整模型參數(shù)。
流水并行：適用于超大規(guī)模模型的訓(xùn)練和推理任務(wù)，尤其是在模型規(guī)模超過單個計算節(jié)點資源限制的情況下。例如，像GPT-3這樣的超大規(guī)模語言模型，其參數(shù)量達(dá)到了1750億個，流水并行可以將模型的不同部分分配到多個計算節(jié)點上，通過流水線的方式進(jìn)行訓(xùn)練，從而有效地利用多個節(jié)點的計算資源。此外，流水并行也適用于高并發(fā)的推理任務(wù)，如大規(guī)模圖像識別系統(tǒng)，通過將推理任務(wù)分解為多個階段并并行執(zhí)行，可以顯著提高系統(tǒng)的吞吐量和響應(yīng)速度。
模型并行：適用于模型結(jié)構(gòu)復(fù)雜且單個設(shè)備無法容納整個模型的情況。例如，Transformer架構(gòu)的模型通常具有大量的參數(shù)和復(fù)雜的結(jié)構(gòu)，模型并行可以將不同的模塊分配到不同的設(shè)備上，從而減少單個設(shè)備的內(nèi)存壓力并提高計算效率。此外，模型并行也適用于需要對模型進(jìn)行精細(xì)調(diào)整的場景，因為它可以靈活地劃分模型結(jié)構(gòu)，便于對不同部分進(jìn)行獨立優(yōu)化。

4.3 優(yōu)缺點對比

三種并行方式的優(yōu)缺點如下：

數(shù)據(jù)并行：

優(yōu)點：加速比高，易于實現(xiàn)，可擴(kuò)展性強(qiáng)。通過增加計算資源可以顯著提高訓(xùn)練速度，且不需要對模型結(jié)構(gòu)進(jìn)行修改。

缺點：通信開銷較大，內(nèi)存需求增加，數(shù)據(jù)分割方式可能影響訓(xùn)練效果。當(dāng)節(jié)點數(shù)量過多或網(wǎng)絡(luò)帶寬有限時，通信開銷可能會抵消部分加速效果。

流水并行：

優(yōu)點：適用于超大規(guī)模模型，可以有效利用多個計算節(jié)點的資源，提高訓(xùn)練和推理效率。在處理高并發(fā)任務(wù)時表現(xiàn)出色，能夠顯著提高系統(tǒng)的吞吐量和響應(yīng)速度。

缺點：階段劃分和同步機(jī)制復(fù)雜，數(shù)據(jù)傳輸效率要求高。如果階段劃分不合理或數(shù)據(jù)傳輸延遲較高，可能會導(dǎo)致流水線的利用率下降，影響整體效率。

模型并行：

優(yōu)點：適用于復(fù)雜模型結(jié)構(gòu)，可以減少單個設(shè)備的內(nèi)存壓力，提高計算效率。通過靈活劃分模型結(jié)構(gòu)，可以對不同部分進(jìn)行獨立優(yōu)化。

缺點：通信開銷較大，同步復(fù)雜性高。不同設(shè)備之間的通信和同步機(jī)制需要精心設(shè)計，否則可能會導(dǎo)致性能瓶頸。此外，模型并行的實現(xiàn)相對復(fù)雜，需要對模型結(jié)構(gòu)有深入的了解。

本文轉(zhuǎn)載自??智駐未來??，作者：智駐未來

標(biāo)簽

數(shù)據(jù)并行

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

基于TCN-SENet +BiGRU-GlobalAttention并行預(yù)測模型

Tang_Lan ? 4673瀏覽 ? 0回復(fù)
基于TCN-SENet +BiGRU-GlobalAttention并行預(yù)測模型

Tang_Lan ? 5021瀏覽 ? 0回復(fù)
基于多級注意力機(jī)制的并行預(yù)測模型

Tang_Lan ? 6401瀏覽 ? 0回復(fù)
多步預(yù)測系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合

Tang_Lan ? 4998瀏覽 ? 0回復(fù)
1DCNN-2DResNet并行故障診斷模型

Tang_Lan ? 3875瀏覽 ? 0回復(fù)
基于多級注意力機(jī)制的并行預(yù)測模型

Tang_Lan ? 4569瀏覽 ? 0回復(fù)
LLMCompiler：大模型的并行工具調(diào)用

AIGC最前線 ? 6303瀏覽 ? 0回復(fù)
阿里 C4：通信驅(qū)動加速大規(guī)模并行訓(xùn)練效率

amei2000go ? 9846瀏覽 ? 0回復(fù)
【LLM】提升大規(guī)模并行訓(xùn)練效率的方法

sbf_2000 ? 5629瀏覽 ? 0回復(fù)
回歸預(yù)測模型 | LSTM、CNN、Transformer、TCN、串行、并行模型集合

Tang_Lan ? 6256瀏覽 ? 0回復(fù)
一文講清什么是 AI Agent（智能體）？

wsp_ping ? 7919瀏覽 ? 0回復(fù)
大規(guī)模分布式 AI 模型訓(xùn)練—張量并行

amei2000go ? 5005瀏覽 ? 0回復(fù)
大規(guī)模分布式 AI 模型訓(xùn)練系列——流水線并行

amei2000go ? 5892瀏覽 ? 0回復(fù)
大規(guī)模分布式 AI 模型訓(xùn)練系列—專家并行

amei2000go ? 1.5w瀏覽 ? 0回復(fù)
聊聊基于 Informer+BiGRU-GlobalAttention的并行預(yù)測模型

Tang_Lan ? 6023瀏覽 ? 0回復(fù)
我們一起聊聊基于時空特征提取的并行預(yù)測模型

Tang_Lan ? 4154瀏覽 ? 0回復(fù)
一文講清楚視覺大模型！CLIP模型論文解讀

石映飛云 ? 1.4w瀏覽 ? 0回復(fù)
DeepSeek開源優(yōu)化并行策略，提升訓(xùn)練和通信效率

Aceryt ? 4702瀏覽 ? 0回復(fù)
講清楚了！一文看懂什么是世界模型

智駐未來 ? 5405瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

忘記大模型，英偉達(dá)：小模型才是Agentic AI的未來！ 2025-09-26 00:11:05發(fā)布
深度解析OpenAI的 PPO 算法 2025-08-21 09:09:47發(fā)布

熱門推薦

別再怪AI“聽不懂人話”了，90%的返工和錯誤，都錯在你下達(dá)指令的第一句話 0回復(fù)

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實測中展現(xiàn)出驚人效率，僅用15秒便將百頁P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)

DeepSeek 成長史：從量化投資到 AI 革命的一個 “非主流” 量化大佬的 AI 夢 0回復(fù)

上一篇：深度解析 AllReduce：分布式訓(xùn)練的“同步神器”

下一篇：當(dāng)大語言模型遇上強(qiáng)化學(xué)習(xí)：一文讀懂強(qiáng)化預(yù)訓(xùn)練（RPT）如何重塑LLM的推理基因

社區(qū)精華內(nèi)容

目錄