偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

DeepSeek 開源的 DualPipe,居然是梁文峰寫的,你感性?

人工智能 開源
繼DeepGEMM之后,deepseek開源了第四彈DualPipe。今天來簡(jiǎn)單聊聊DualPipe,包懂。

繼DeepGEMM之后,deepseek開源了第四彈DualPipe。今天來簡(jiǎn)單聊聊DualPipe,包懂。

DualPipe是干嘛的?

Dualpipe,一個(gè)雙向管道并行算法,提高了前向傳播/反向傳播過程中的計(jì)算+通信效率,降低了單向流水線的等待時(shí)間(pipeline bubbles)。

前向傳播和反向傳播是干嘛的?

你輸入:how are you?

AI輸出:I’m fine. Thank you. And you?

為什么?

AI的輸出,是依據(jù)事先訓(xùn)練好的模型(一大堆參數(shù)),以追求“用戶體驗(yàn)最好”的最大概率。說白了,就是一個(gè)預(yù)測(cè)的過程。

模型的一大堆參數(shù),是怎么來的?

  • 前向傳播:根據(jù)輸入,根據(jù)模型參數(shù)(左圖的每一條綠線,一個(gè)權(quán)重),生成預(yù)測(cè)結(jié)果,通過損失函數(shù),衡量模型的好壞。
  • 反向傳播:根據(jù)損失函數(shù),明確每個(gè)參數(shù)對(duì)誤差的“責(zé)任”,指導(dǎo)調(diào)整參數(shù)(右圖的每一條紅線,調(diào)整權(quán)重),對(duì)模型進(jìn)行優(yōu)化。

如此往復(fù),不斷優(yōu)化,最終訓(xùn)練出模型成品(損失函數(shù)最?。?。

舉個(gè)更形象的例子,這好比工廠流水線:

  • 前向傳送帶:加工零件,生產(chǎn)商品;
  • 反向傳送帶:質(zhì)檢返修,優(yōu)化商品;

如此反復(fù),直到生成成品。

可以說,前向傳播和反向傳播是預(yù)測(cè)模型的基礎(chǔ)。

這和DualPipe有什么關(guān)系?

我們要進(jìn)行多輪參數(shù)優(yōu)化,通常需要:

  • 前向傳播
  • 反向傳播
  • 前向傳播
  • 反向傳播

單向流水線交替進(jìn)行。

如此一來,計(jì)算與通信就無法跑滿,GPU會(huì)有pipeline bubbles。

而Dualpipe:

  • 前向傳播與反向傳播同時(shí)進(jìn)行;
  • 計(jì)算與通訊同時(shí)進(jìn)行(例如:前向傳播計(jì)算時(shí),加載反向傳播所需的數(shù)據(jù));

從調(diào)度圖上能夠看出,pipeline bubbles大部分都被填滿了。工廠流水線上的單向傳送帶,升級(jí)成了雙向循環(huán)傳送帶。

另外,DualPipe的作者:

梁文峰赫然在列!

結(jié)尾

對(duì)于DualPipe,我的思考是:

其一,軟件的優(yōu)化和硬件的升級(jí),一樣重要;

其二,為什么很多大公司AI搞不出來?

  • 自己懂,必須自己下場(chǎng);
  • 自己不懂,就讓懂的人上;
  • 如果又不懂,又占著資源,能搞得出來?

補(bǔ)充閱讀材料:

《DualPipe》:https://github.com/deepseek-ai/DualPipe可參考。

責(zé)任編輯:趙寧寧 來源: 架構(gòu)師之路
相關(guān)推薦

2025-02-27 12:06:45

2021-01-22 09:11:34

Python多線程CPU

2021-09-29 00:19:10

容器集群k8s

2024-05-20 08:45:46

2021-08-02 15:06:46

vim服務(wù)Java

2021-06-02 16:19:14

技術(shù)研發(fā)指標(biāo)

2019-08-09 10:15:07

程序員項(xiàng)目研發(fā)

2014-11-11 09:56:54

2020-10-26 16:35:53

內(nèi)存JavaThreadLocal

2013-09-02 09:44:54

2021-10-08 09:07:09

算法程序技術(shù)

2018-01-30 11:52:39

IDC全閃存

2020-10-09 14:46:57

阿里巴巴互聯(lián)網(wǎng)存儲(chǔ)

2025-05-19 09:12:16

2017-06-12 17:47:19

2025-03-13 10:31:20

DeepSeek開源EPLB

2018-08-03 09:26:06

2020-08-10 10:59:00

黑客?推特漏洞

2025-07-21 08:22:30

localhost身份證號(hào)綽號(hào)

2021-01-04 15:02:21

加密貨幣區(qū)塊鏈存儲(chǔ)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)