編輯 | 云昭
“我們判斷,大模型將是下一代OS;通義要做AI時代的安卓系統(tǒng)!”
“未來全球可能只會有5~6家超級AI云計算平臺?!?/p>
9月24日,云棲大會如期而至。在主論壇上,阿里CEO吳泳銘發(fā)表了《超級人工智能》的主題演講。演講中,“吳媽”終于不藏了,堅定宣布了阿里在開放大模型上的決心與野心。
當然,做AI時代的安卓,只是阿里在大模型領(lǐng)域的戰(zhàn)略。吳泳銘緊接著亮出了第二個野心 。作為自己親自執(zhí)掌的阿里云智能集團,吳泳銘也給了阿里云一個全新的身份:
阿里云要做全球領(lǐng)先的全棧人工智能服務(wù)商。
這兩個野心背后都暗含著阿里近三年來對于生成式AI發(fā)展規(guī)律的判斷。
吳泳銘在會場給出了兩個重要的判斷。
其一,大模型是下一代的操作系統(tǒng)。其二,超級AI云是下一代的計算機。
此外,生成式AI以互聯(lián)網(wǎng)3倍甚至4倍的速度狂奔,阿里又是怎樣規(guī)劃未來世界的?吳泳銘在開場也給出了答案。有意思的是吳泳銘沒有太多提及“AGI”這個詞匯,而是采用了“ASI”這一說法。
ps:Meta CEO 扎克伯克非常愛用這個詞,包括近兩個月他瘋狂挖人組建的團隊也是用“ASI”來命名。
吳泳銘提出這樣一種觀點,非常值得關(guān)注:
實現(xiàn)通用人工智能AGI已是確定性事件,但這只是起點,終極目標是發(fā)展出能自我迭代、全面超越人類的超級人工智能ASI。
當然,除了吳泳銘的精彩判斷以外,另一位老熟人,阿里CTO周靖人也再次帶來非常豐富扎實且創(chuàng)新滿滿的阿里新品。
全程約2小時,料十足,這里重點整理了兩位演講的精彩部分。
吳泳銘的“ASI”定義
眾所周知,“AGI”與“ASI”是自ChatGPT爆火以來就誕生的兩個“野望”。但兩者究竟如何理解呢?區(qū)別又在哪里?
吳泳銘在keynote上給出了自己的定義:實現(xiàn)通用人工智能(AGI)已經(jīng)是確定性事件。而超級人工智能(ASI)則是最終目標則是要發(fā)展出自我迭代、全面超越人類的AI。
而且AGI不是終點,而是實現(xiàn)ASI的起點。
那具體來看,吳泳銘是如何規(guī)劃“通往ASI的路徑”的?
圖片
吳泳銘闡述了通往ASI的三階段演進路線:
第一階段:“智能涌現(xiàn)”,AI通過學(xué)習(xí)海量人類知識具備泛化智能。
第二階段:“自主行動”,AI掌握工具使用和編程能力以“輔助人”,這是行業(yè)當前所處的階段。
第三階段:“自我迭代”,AI通過連接物理世界并實現(xiàn)自學(xué)習(xí),最終實現(xiàn)“超越人”。
圖片
其中第一階段:“智能涌現(xiàn)”,特征是“學(xué)習(xí)人”。代表事件是:AI已經(jīng)逼近人類各學(xué)科測試的頂級水平,比如國際數(shù)學(xué)奧賽的金牌水平。AI逐漸具備了進入真實世界、解決真實問題、創(chuàng)造真實價值的可能性。
吳泳銘表示,這是過去幾年AI圈發(fā)展的主線。
第二個階段是“自主行動”,特征是“輔助人”。這個階段,AI不再局限于語言交流,而是具備了在真實世界中行動的能力。AI可以在人類的目標設(shè)定下,拆解復(fù)雜任務(wù),使用和制作工具,自主完成與數(shù)字世界和物理世界的交互,對真實世界產(chǎn)生巨大影響。這正是我們當下所處的階段。
對于這個階段,吳泳銘認為,實現(xiàn)這一跨越的關(guān)鍵,有兩點能力的躍遷。
首先是大模型具備了Tool Use能力,有能力連接所有數(shù)字化工具,完成真實世界任務(wù)。
“通過Tool Use,AI可以像人一樣調(diào)用外部軟件、接口和物理設(shè)備,執(zhí)行復(fù)雜的真實世界任務(wù)。這個階段,由于AI能夠輔助人類極大提高生產(chǎn)力,它將快速的滲透到物流、制造、軟件、商業(yè)、生物醫(yī)療、金融、科研等幾乎所有行業(yè)領(lǐng)域?!?/p>
其次,大模型Coding能力的提升,可以幫助人類解決更復(fù)雜的問題,并將更多場景數(shù)字化?,F(xiàn)在的Agent還比較早期,解決的主要是標準化和短周期的任務(wù)。要想讓Agent能解決更復(fù)雜、更長周期任務(wù),最關(guān)鍵的是大模型的Coding能力。因為Agent可以自主Coding,理論上就能解決無限復(fù)雜的問題,像工程師團隊一樣理解復(fù)雜需求并自主完成編碼、測試。發(fā)展大模型Coding能力是通往AGI的必經(jīng)之路。
未來,自然語言就是AI時代的源代碼,任何人用自然語言就能創(chuàng)造自己的Agent。你只需要輸入母語,告訴AI你的需求,AI就能自己編寫邏輯、調(diào)用工具、搭建系統(tǒng),完成數(shù)字世界的幾乎所有工作,并通過數(shù)字化接口來操作所有物理設(shè)備。
吳泳銘進一步指出,在未來,也許會有超過全球人口數(shù)量的Agent和機器人與人類一起工作,對真實世界產(chǎn)生巨大影響。在這個過程中,AI就能連接真實世界的絕大部分場景和數(shù)據(jù),為未來的進化創(chuàng)造條件。
而第三個階段,“自我迭代”,特征是“超越人”。
吳泳銘特別強調(diào)了兩個關(guān)鍵要素:真實世界的全量原始數(shù)據(jù)、self learning。
第一、AI連接了真實世界的全量原始數(shù)據(jù)。吳泳銘認為,現(xiàn)在大模型所獲的數(shù)據(jù)幾乎全部是人類定義和創(chuàng)造的“二手信息”,如果要實現(xiàn)超越人類的AI,就需要從真實物理世界中獲得更原始更全面的數(shù)據(jù)。
對于其他領(lǐng)域和更廣泛的物理世界,今天的AI接觸到的更多是人類歸納之后的知識,缺乏廣泛的、與物理世界交互的原始數(shù)據(jù)。這些信息是有局限的。AI要實現(xiàn)超越人類的突破,就需要直接從物理世界獲取更全面、更原始的數(shù)據(jù)。
吳泳銘還舉了一個自動駕駛方面的例子?!熬拖裨谧詣玉{駛的早期階段,只靠人類的總結(jié),Rule-based的方法去實現(xiàn)自動駕駛,無法實現(xiàn)很好的效果。新一代的自動駕駛,大部分采用端到端的訓(xùn)練方法,直接從原始的車載攝像頭數(shù)據(jù)中學(xué)習(xí),實現(xiàn)了更高水平的自動駕駛能力。”
只是讓AI學(xué)習(xí)人類歸納的規(guī)律,是遠遠不夠的。只有讓AI與真實世界持續(xù)互動,獲取更全面、更真實、更實時的數(shù)據(jù),才能更好的理解和模擬世界,發(fā)現(xiàn)超越人類認知的深層規(guī)律,從而創(chuàng)造出比人更強大的智能能力。
第二、Self-learning自主學(xué)習(xí)。吳泳銘將其視為AI發(fā)展的關(guān)鍵時刻。他是這樣形容這個階段的:
隨著AI滲透更多的物理世界場景,理解更多物理世界的數(shù)據(jù),AI 模型和agent能力也會越來越強,有機會為自己模型的升級迭代搭建訓(xùn)練infra、優(yōu)化數(shù)據(jù)流程和升級模型架構(gòu),從而實現(xiàn) Self learning。
有了數(shù)據(jù)和自主學(xué)習(xí)能力之后,一個早期的ASI便會成型。
未來的模型將通過與真實世界的持續(xù)交互,獲取新的數(shù)據(jù)并接收實時反饋,借助強化學(xué)習(xí)與持續(xù)學(xué)習(xí)機制,自主優(yōu)化、修正偏差、實現(xiàn)自我迭代與智能升級。每一次交互都是一次微調(diào),每一次反饋都是一次參數(shù)優(yōu)化。當經(jīng)過無數(shù)次場景執(zhí)行和結(jié)果反饋的循環(huán),AI將自我迭代出超越人類的智能能力,一個早期的超級人工智能(ASI)便會成型。
兩個判斷:阿里的兩個AI野心
正如文章開頭所提到的。吳泳銘在會場公開對外押了兩個“寶”。
第一個“寶”則是關(guān)于下一代OS的變化?!拔覀冋J為大模型代表的技術(shù)平臺將會替代現(xiàn)在OS的地位,成為下一代的操作系統(tǒng)。”
這是吳給出的第一個判斷。雖然業(yè)界很早就有這樣的說法,但這是阿里第一次在如此重要的場合闡明自己的立論依據(jù)。
圖片
在“LLM OS時代”,幾乎所有鏈接真實世界的工具接口都將與大模型進行鏈接,所有用戶需求和行業(yè)應(yīng)用將會通過大模型相關(guān)工具執(zhí)行任務(wù),LLM將會是承載用戶、軟件 與 AI計算資源交互調(diào)度的中間層,成為AI時代的OS。
可以做一些簡單的類比:
自然語言是AI時代的編程語言,Agent就是新的軟件,Context是新的Memory,大模型通過MCP這樣的接口,連接各類Tools和Agent類似PC時代的總線接口,Agent之間又通過A2A這樣的協(xié)議完成多Agent協(xié)作類似軟件之間的API接口。
此外,大模型還將吞噬軟件。吳泳銘認為,大模型作為下一代的操作系統(tǒng),將允許任何人用自然語言,創(chuàng)造無限多的應(yīng)用。未來幾乎所有與計算世界打交道的軟件可能都是由大模型產(chǎn)生的Agent,而不是現(xiàn)在的商業(yè)軟件。潛在的開發(fā)者將從幾千萬變成數(shù)億規(guī)模。
以前由于軟件開發(fā)的成本問題,導(dǎo)致只有少量高價值場景才會被工程師開發(fā)出來變成商業(yè)化的軟件系統(tǒng)。而在未來,所有終端用戶都可以通過大模型這樣的工具來滿足自己的需求。
此外,模型部署方式也會多樣化,它將運行在所有設(shè)備上?,F(xiàn)在主流的調(diào)用模型API的方式,來使用模型只是初級階段,其實看起來非常原始,有點像過去大型主機時代的分時復(fù)用階段,每個人只有一個終端連接上大型主機分時復(fù)用。
這種方式的問題在于:無法解決數(shù)據(jù)持久化,缺乏長期記憶,實時性不夠,隱私無法解決,可塑性也不夠。未來模型將運行在所有計算設(shè)備中,并具備可持久記憶,端云聯(lián)動的運行狀態(tài),甚至可以隨時更新參數(shù),自我迭代,類似我們今天的OS運行在各種環(huán)境之中。
正是基于這個判斷,我們做了一個戰(zhàn)略選擇:通義千問選擇開放路線,打造AI時代的Android?!拔覀冋J為在LLM時代,開源模型創(chuàng)造的價值和能滲透的場景,會遠遠大于閉源模型。我們堅定選擇開源,就是為了全力支持開發(fā)者生態(tài),與全球所有開發(fā)者一起探索AI應(yīng)用的無限可能?!?/p>
阿里的第二個押寶則是:超級AI云。吳泳銘認為,AI Cloud是下一代的計算機。
這一點不難理解。因為,大模型是運行于AI Cloud之上新的OS。這個OS可以滿足任何人的需求。每個人都將擁有幾十甚至上百個Agent,這些Agent 24小時不間斷地工作和協(xié)同,需要海量的計算資源。
所以,絕大部分AI能力將以Token的形式在云計算網(wǎng)絡(luò)上產(chǎn)生和輸送。吳指出,Token就是未來的電。
此外,數(shù)據(jù)中心內(nèi)的計算范式也在發(fā)生革命性改變,從CPU為核心的傳統(tǒng)計算,正在加速轉(zhuǎn)變?yōu)橐?GPU為核心的 AI 計算。新的AI計算范式需要更稠密的算力、更高效的網(wǎng)絡(luò)、更大的集群規(guī)模。
在這個新時代,AI將會替代能源的地位,成為最重要的商品,驅(qū)動千行百業(yè)每天的工作。
因此,這一切都需要充足的能源、全棧的技術(shù)、數(shù)百萬計的GPU和CPU,協(xié)同網(wǎng)絡(luò)、芯片、存儲、數(shù)據(jù)庫高效運作,并且24 小時處理全世界各地的需求。這需要超大規(guī)模的基礎(chǔ)設(shè)施和全棧的技術(shù)積累,只有超級AI云才能夠承載這樣的海量需求。未來,全世界可能只會有5-6個超級云計算平臺。
“在這個嶄新的時代,阿里云的定位是全棧人工智能服務(wù)商,提供世界領(lǐng)先的智能能力和遍布全球的AI云計算網(wǎng)絡(luò),向全球各地提供開發(fā)者生態(tài)友好的AI服務(wù)?!?/p>
圖片
瘋狂的阿里AI
那么野心亮出來了,阿里的底氣如何呢?
在keynote的下半場,那張熟悉的面孔再一次向我們秀出阿里的肌肉。
圖片
這一次的云棲大會上的發(fā)布,可以說是多到爆炸。阿里CTO周靖人花了近一個小時的篇幅為我們展示了一個AI巨無霸的全系版圖。
圖片
周靖人的演講主要分為兩部分,大模型和與云基礎(chǔ)設(shè)施。
這里因為篇幅關(guān)系,不再一一介紹每一款模型。(Ps:實在是多到眼花繚亂。)
比如昨天凌晨發(fā)布的Qwen3-next的語言模型以及Qwen3-Omni全模態(tài)模型。
編程模型方面,Qwen3-Coder已經(jīng)成為了全球開發(fā)者非常認可的模型。
而就在今天凌晨,Qwen3-Max正式版也一早引起了圈內(nèi)的試用和好評。
這里值得注意的是,這款阿里最新的通義旗艦?zāi)P蚎wen3-Max,據(jù)介紹,其性能已經(jīng)超過GPT5、Claude Opus 4等,躋身全球前三。Qwen3-Max包括指令(Iinstruct)和推理(Thinking)兩大版本,其預(yù)覽版已在 ChatbotArena 排行榜上位居并列第三,正式版性能可望再度實現(xiàn)突破。
Qwen3-Max也是通義千問家族中最大、最強的基礎(chǔ)模型,預(yù)訓(xùn)練數(shù)據(jù)量達36Ttokens,總參數(shù)超過萬億,擁有極強的Coding編程能力和Agent工具調(diào)用能力。有一點非常厲害,Qwen3-Max結(jié)合工具調(diào)用和并行推理技術(shù),其推理能力創(chuàng)下新高,尤其在聚焦數(shù)學(xué)推理的AIME 25和HMMT測試中,均達到突破性的滿分100分,為國內(nèi)首次。
圖片
多模態(tài)模型方面,通義萬相家族也上新了。首先是Wan2.5-preview系列模型,涵蓋文生視頻、圖生視頻、文生圖和圖像編輯四大模型。通義萬相2.5視頻生成模型能生成和畫面匹配的人聲、音效和音樂BGM,首次實現(xiàn)音畫同步的視頻生成能力,進一步降低電影級視頻創(chuàng)作的門檻。此外,通義萬相2.5視頻生成時長從5秒提升至10秒,支持24幀每秒的1080P高清視頻生成,并進一步提升模型指令遵循能力。
其次,萬相迎來了一位特殊的成員:語音大模型通義百聆,包括語音識別大模型Fun-ASR、語音合成大模型Fun-CosyVoice。Fun-ASR基于數(shù)千萬小時真實語音數(shù)據(jù)訓(xùn)練而成,具備強大的上下文理解能力與行業(yè)適應(yīng)性;Fun-CosyVoice可提供上百種預(yù)制音色,可以用于客服、銷售、直播電商、消費電子、有聲書、兒童娛樂等場景。
圖片
會上,周靖人還透露了一組數(shù)據(jù),Qwen模型已經(jīng)成為了全球最大的開源模型。
截至目前,阿里通義開源300余個模型,覆蓋不同大小的“全尺寸”及LLM、編程、圖像、語音、視頻等“全模態(tài)”,全球下載量突破6億次,全球衍生模型17萬個,穩(wěn)居全球第一。
此外,周還透露,目前已經(jīng)超100萬家客戶接入通義大模型,權(quán)威調(diào)研機構(gòu)沙利文2025上半年報告顯示,在中國企業(yè)級大模型調(diào)用市場中,阿里通義占比第一。
阿里如何定義AI時代的“計算機”
如此大的調(diào)用規(guī)模,面向未來,我們需要怎樣的AI基礎(chǔ)設(shè)施呢?
周靖人給出了阿里云的答案。
在網(wǎng)絡(luò)層面,阿里云新一代高性能網(wǎng)絡(luò)HPN 8.0全新亮相。為應(yīng)對大模型時代對海量數(shù)據(jù)傳輸?shù)男枨?,HPN8.0采用訓(xùn)推一體化架構(gòu),存儲網(wǎng)絡(luò)帶寬拉升至800Gbps,GPU互聯(lián)網(wǎng)絡(luò)帶寬達到6.4Tbps,可支持單集群10萬卡GPU高效互聯(lián),為萬卡大集群提供高性能、確定性的云上基礎(chǔ)網(wǎng)絡(luò),助力AI訓(xùn)推提效。
在存儲層面,阿里云分布式存儲面向AI需求全面升級。高性能并行文件存儲CPFS單客戶端吞吐提升至40GB/s, 可滿足AI訓(xùn)練對快速讀取數(shù)據(jù)的極致需求;表格存儲Tablestore為Agent提供高性能記憶庫和知識庫;對象存儲OSS推出 Vector Bucket,為向量數(shù)據(jù)提供高性價比的海量存儲,相比自建開源向量數(shù)據(jù)庫,成本驟降95%,結(jié)合OSS MetaQuery 語義檢索和內(nèi)容感知能力,可快速構(gòu)建RAG等AI應(yīng)用。
在AI智算集群層面,智能計算靈駿集群通過多級親和性與拓撲感知調(diào)度設(shè)計,基于HPN 網(wǎng)絡(luò)支持10萬卡穩(wěn)定互聯(lián),多級可擴展的架構(gòu)讓每張卡間互聯(lián)路徑更短、帶寬更優(yōu)。靈駿集群面向任務(wù)的穩(wěn)定性設(shè)計、故障分鐘級恢復(fù)能力,有效提高了模型訓(xùn)練任務(wù)的集群穩(wěn)定性。
當然除了這些基礎(chǔ)設(shè)施之外,阿里的“肌肉實力”遠不止這些。
大家都知道,今年是Agent爆發(fā)的一年,面向agent開發(fā)這一領(lǐng)域。阿里也有了很多重磅發(fā)布和開源。
大會現(xiàn)場,阿里云發(fā)布全新Agent開發(fā)框架ModelStudio-ADK,該框架突破以預(yù)定義編排方式開發(fā)Agent的局限,可幫助企業(yè)高效開發(fā)具備自主決策、多輪反思和循環(huán)執(zhí)行能力的Agent。使用ModelStudio-ADK,1個小時就能輕松開發(fā)一個能生成深度報告的Deep Research項目。
據(jù)了解,過去一年,阿里云百煉平臺的模型日均調(diào)用量增長了15倍。
而在框架層面,阿里云ModelStudio-ADK基于通義開源的AgentScope打造,可開發(fā)深度研究、硬件代理智能體、復(fù)雜檢索智能體等應(yīng)用。該框架還全面支持云端部署和云端組件調(diào)用,提供企業(yè)級、服務(wù)穩(wěn)定、靈活部署和運行的高代碼開發(fā)模式?! ?/p>
在模型層面,阿里云百煉持續(xù)上線全新通義千問家族旗艦?zāi)P?。目前,用戶可一鍵調(diào)用Qwen、Wan、DeepSeek等200多款業(yè)界領(lǐng)先的模型。
在組件層面,面向Agent開發(fā)和部署所需的各類組件,阿里云百煉集成了工具連接MCP Server、多模數(shù)據(jù)融合RAG Server、沙箱工具Sandbox Server、智能記憶存取Memory Server以及支付訂閱服務(wù) Pay Server等7大企業(yè)級能力。
寫在最后
GenAI時代的到來,讓幾年前增速減緩的技術(shù)、市場再一次呈現(xiàn)出爆發(fā)的景象。正如今天阿里的股價,一路狂漲逾7%。
我想這次云棲大會跟去年相比,有兩點非常的不同:一個是“吳媽”變得更加從容了,對于AI這件事,阿里的路線愈來愈清晰,步子越來越堅實了。這說明阿里的戰(zhàn)略方向與戰(zhàn)略定力已經(jīng)取得了世界級的成果,由此帶動了國內(nèi)乃至世界對于開源人工智能的信心。
第二點,則是阿里找到了大模型時代的增長敘事的脈絡(luò)。
阿里要打造AI時代的安卓系統(tǒng),阿里云要做全球領(lǐng)先的全棧超級AI云服務(wù)商,而后者,世界上大概也不過5、6家。
當然,這篇文章肯定描述不了一個完整的阿里野望。昨天,小編在打車趕往會場的路上,跟通行的人聊起了前不久爆火的“高德掃街榜”、聊起了夸克……
我想那又是AI時代之下,阿里的另外一個驚喜故事了。

































