DeepSeek 開源 EPLB，世界上從來沒有什么騰空出世！

作者：架構(gòu)師之路 2025-03-13 10:31:20

DeepSeek 開源 DualPipe 的同一天，還開源了 EPLB。今天來簡單聊聊 EPLB，包懂。

deepseek開源DualPipe的同一天，還開源了EPLB。今天來簡單聊聊EPLB，包懂。

EPLB，Expert Parallelism Load Balancer，是一個動態(tài)負(fù)載均衡算法。

在使用專家并行EP時，不同專家會被分配到不同的GPU，而這些GPU的負(fù)載可能不均衡，此時就需要EPLB啦。

(1) 什么是專家并行EP？

專家并行EP，Expert Parallelism，是一種針對混合專家MOE設(shè)計的分布式并行技術(shù)。

(2) 什么是混合專家MOE？

混合專家MOE，Mixture of Experts，是deepseek大模型的核心創(chuàng)新應(yīng)用，該模型思路不再追求大而全，轉(zhuǎn)而追求多而專精。

關(guān)于混合專家MOE，詳見：《通俗講解deepseek - MOE(3)》

混合專家MOE與專家并行EP，deepseek之前開源了其核心通訊庫，詳見：《通俗講解deepseek開源 - DeepEP(10）》

EPLB像一個智能調(diào)度員，根據(jù)不同的場景調(diào)度專家進行計算，其負(fù)載均衡算法包含兩類核心策略。

第一類：分級負(fù)載均衡。

使用場景：預(yù)填充階段（prefilling stage），規(guī)模較小，服務(wù)器節(jié)點數(shù)（server nodes）能被專家組數(shù)（expert groups）整除的情況。

策略步驟：

第二類：全局負(fù)載均衡。

使用場景：解碼階段（decoding stage），規(guī)模較大的情況。

策略步驟：

總而言之，保證負(fù)載均衡，充分發(fā)揮GPUs的潛力，提升訓(xùn)練效率，縮短訓(xùn)練時間。

DeepSeek-V3訓(xùn)練部署：

接下來進行訓(xùn)練：

預(yù)填充階段，一個專家組，例如Java+ FE+ QA+OP分配4個服務(wù)器節(jié)點，保證節(jié)點資源分配均衡；
專家冗余策略，當(dāng)發(fā)現(xiàn)某個GPU負(fù)載超過閾值時，復(fù)制專家副本，分配到新的GPU。也就是說，Java成為項目瓶頸時，我們就組內(nèi)復(fù)制多個Java；
原則上專家組之間避免全局通訊，而在有限節(jié)點內(nèi)通訊，降低全局通訊壓力；

畫外音：全局通訊復(fù)雜度會指數(shù)級上升，只需要少量跨組協(xié)同。