DeepSeek公布了推理引擎開(kāi)源路徑，OpenAI也將開(kāi)始連續(xù)一周發(fā)布

作者：機(jī)器之心 2025-04-15 08:50:01

DeepSeek宣布將開(kāi)源自己的內(nèi)部推理引擎（internal inference engine）并與開(kāi)源社區(qū)建立更廣泛的合作。

DeepSeek 默默地在自己的 open-infra-index 庫(kù)中發(fā)布了一份題為「開(kāi)源 DeepSeek 推理引擎的路徑」的文檔，宣布將開(kāi)源自己的內(nèi)部推理引擎（internal inference engine）并與開(kāi)源社區(qū)建立更廣泛的合作。有意思的是，該文檔發(fā)布之后不久就經(jīng)歷了兩次修改，對(duì)一些措辭和表述進(jìn)行了更加中立和寬泛的處理。

在其中一次修改中，DeepSeek 提到了與 SGLang 和 vLLM 項(xiàng)目的合作關(guān)系，但這兩個(gè)具體的項(xiàng)目名稱(chēng)在新版本中被替換成了「現(xiàn)有的開(kāi)源項(xiàng)目」。修改原因是為了強(qiáng)調(diào)「未來(lái)的開(kāi)源合作是面向整個(gè)開(kāi)源社區(qū)的，不局限于具體某些項(xiàng)目。」因此，DeepSeek 與 SGLang 和 vLLM 這兩大開(kāi)源項(xiàng)目的合作關(guān)系應(yīng)該是已經(jīng)確定了。

不得不說(shuō)，DeepSeek 非常 GOAT（Greatest of All Time）！

而就在不久前，Sam Altman 才宣布 OpenAI 將開(kāi)始一輪發(fā)布周。猶記得上一次，在 OpenAI 一連 12 個(gè)工作日的連續(xù)發(fā)布中，o1 滿(mǎn)血版、Sora、強(qiáng)化微調(diào)技術(shù)、Canvas 更新、o3-mini 等產(chǎn)品和服務(wù)紛紛問(wèn)世。不知道，這一次，OpenAI 又將發(fā)布什么東西？

事實(shí)上，各路網(wǎng)友已經(jīng)開(kāi)始根據(jù)各種草蛇灰線的線索開(kāi)始猜測(cè)這一周將會(huì)發(fā)布的東西了。說(shuō)實(shí)在的，有一些頗具說(shuō)服力，而且還有證據(jù)。

下面我們首先將介紹「開(kāi)源 DeepSeek 推理引擎的路徑」，然后將簡(jiǎn)單盤(pán)點(diǎn)一番網(wǎng)友對(duì) OpenAI 這周發(fā)布內(nèi)容的預(yù)測(cè)。

開(kāi)源 DeepSeek 推理引擎的路徑

文檔地址：https://github.com/deepseek-ai/open-infra-index/blob/main/OpenSourcing_DeepSeek_Inference_Engine/README.md

以下為 DeepSeek 發(fā)布的文檔的原文譯本：

幾周前，在開(kāi)源周期間，我們開(kāi)源了多個(gè)庫(kù)。社區(qū)的反響非常積極 —— 激發(fā)了鼓舞人心的合作、富有成效的討論以及寶貴的錯(cuò)誤修復(fù)。受此鼓舞，我們決定更進(jìn)一步：將我們的內(nèi)部推理引擎回饋給開(kāi)源社區(qū)。

我們非常感謝開(kāi)源生態(tài)系統(tǒng)，沒(méi)有它，我們不可能在通用人工智能 (AGI) 方面取得進(jìn)展。我們的訓(xùn)練框架依賴(lài)于 PyTorch，我們的推理引擎基于 vLLM，這兩者都對(duì)加速 DeepSeek 模型的訓(xùn)練和部署起到了重要作用。

鑒于部署 DeepSeek-V3 和 DeepSeek-R1 等模型的需求日益增長(zhǎng)，我們希望盡己所能回饋社區(qū)。在我們起初考慮將完整的內(nèi)部推理引擎開(kāi)源時(shí)，我們發(fā)現(xiàn)了一些挑戰(zhàn)：

代碼庫(kù)差異：我們的引擎基于 vLLM 一年多前的一個(gè)早期分支。雖然結(jié)構(gòu)相似，但我們針對(duì) DeepSeek 模型對(duì)其進(jìn)行了大量定制化處理，因此難以擴(kuò)展到更廣泛的用例。
基礎(chǔ)設(shè)施依賴(lài)：該引擎與我們的內(nèi)部基礎(chǔ)設(shè)施（包括集群管理工具）緊密耦合，如果不進(jìn)行重大修改，就無(wú)法進(jìn)行公開(kāi)部署。
維護(hù)帶寬有限：作為一個(gè)專(zhuān)注于開(kāi)發(fā)更優(yōu)質(zhì)模型的小型研究團(tuán)隊(duì)，我們?nèi)狈S護(hù)大型開(kāi)源項(xiàng)目的帶寬。

考慮到這些挑戰(zhàn)，我們決定采用一種更可持續(xù)的替代方案：與現(xiàn)有的開(kāi)源項(xiàng)目合作。

展望未來(lái)，我們將在以下方面與現(xiàn)有的開(kāi)源項(xiàng)目緊密合作：

提取出分立的功能：將可復(fù)用的組件模塊化并作為獨(dú)立的軟件庫(kù)貢獻(xiàn)出來(lái)。
共享優(yōu)化：直接貢獻(xiàn)設(shè)計(jì)改進(jìn)和實(shí)現(xiàn)細(xì)節(jié)。

我們衷心感謝開(kāi)源運(yùn)動(dòng) —— 從操作系統(tǒng)和編程語(yǔ)言到機(jī)器學(xué)習(xí)框架和推理引擎。能夠?yàn)檫@個(gè)蓬勃發(fā)展的生態(tài)系統(tǒng)做出貢獻(xiàn)，并看到我們的模型和代碼受到社區(qū)的廣泛歡迎，我們深感榮幸。讓我們攜手突破通用人工智能 (AGI) 的界限，并確保其造福全人類(lèi)。

注：需要說(shuō)明，本文僅概述了我們開(kāi)源 DeepSeek-Inference-Engine 代碼庫(kù)的路徑。對(duì)于未來(lái)的模型發(fā)布，我們將對(duì)開(kāi)源社區(qū)和硬件合作伙伴保持開(kāi)放和協(xié)作的態(tài)度。我們承諾在新模型發(fā)布之前主動(dòng)同步與推理（inference）相關(guān)的工程工作，目標(biāo)是使社區(qū)能夠從第一天起就獲得 SOTA 級(jí)支持。我們的最終目標(biāo)是建立一個(gè)同步的生態(tài)系統(tǒng)，使尖端的 AI 功能能夠在模型正式發(fā)布后無(wú)縫地應(yīng)用于各種硬件。

OpenAI 將發(fā)布什么？

看了 DeepSeek 振奮人心的開(kāi)源路徑，再來(lái)看看 OpenAI 是否有可能給我們帶來(lái)類(lèi)似的震撼。

o3、o4-mini、GPT-4.1 系列模型

對(duì)于 OpenAI 這次發(fā)布周，目前最可信的信息還是來(lái)自 OpenAI 自己，其已經(jīng)在自家的 CDN（內(nèi)容分發(fā)網(wǎng)絡(luò)）上發(fā)布了一些圖標(biāo)，幾乎明示了即將發(fā)布的一系列模型。從目前網(wǎng)友們收集到的數(shù)據(jù)看，OpenAI 這一次一共公布了至少 5 個(gè)圖標(biāo)：

但從這些圖標(biāo)看，OpenAI 有可能在今晚開(kāi)始的發(fā)布周中發(fā)布至少 5 個(gè)模型，包括 o3 滿(mǎn)血版與 o4-mini 兩個(gè)推理模型以及 GPT-4.1 系列模型（包括滿(mǎn)血版、mini 以及 nano）版。

開(kāi)源模型

此外，還有人猜測(cè) OpenAI 可能會(huì)開(kāi)源一個(gè)可與 DeepSeek-R1 比肩的開(kāi)源模型，而且這個(gè)模型很可能就是已經(jīng)在 OpenRouter 上線且可免費(fèi)使用的 Optimus Alpha。該模型支持 100 萬(wàn)上下文長(zhǎng)度，網(wǎng)友實(shí)測(cè)其編程性能非常好。

地址：https://openrouter.ai/openrouter/optimus-alpha

理由之一是如果用戶(hù)讓 Optimus Alpha 介紹自己，他會(huì)自稱(chēng)是來(lái)自 OpenAI 并且基于 GPT-4 架構(gòu)。

機(jī)器之心的測(cè)試

智能體軟件工程師

OpenAI CFO Sarah Friar 近日在高盛舉辦的一次活動(dòng)上透露，該公司正在開(kāi)發(fā)一款名叫 Agentic Software Engineer（A-SWE）的產(chǎn)品，即智能體軟件工程師 / 自主式軟件工程師。不同于編程助手（Copilot），A-SWE 可以自己完成構(gòu)建應(yīng)用、處理拉取請(qǐng)求、進(jìn)行質(zhì)量保證、修復(fù)錯(cuò)誤和編寫(xiě)文檔等任務(wù)。