2025年業(yè)界AI智能體技術進展與趨勢報告 精華
一、市場概況與研究背景
AI 智能體 (Agent) 作為當前人工智能領域的前沿方向,正在從實驗室概念迅速崛起為科技巨頭的戰(zhàn)略核心。2025 年被業(yè)內(nèi)普遍視為 "AI 智能體元年",標志著這一技術從基礎研究邁向大規(guī)模商業(yè)化應用的關鍵轉(zhuǎn)折點(16)。在這一背景下,全球科技巨頭紛紛加大在智能體領域的投入,推出各具特色的產(chǎn)品和技術,形成了激烈的市場競爭格局。
本報告聚焦于 2024 年 6 月至 2025 年 6 月期間,Google、OpenAI、Grok、Apple、字節(jié)跳動、阿里巴巴、騰訊、華為等八家全球領先科技企業(yè)在 AI 智能體領域的最新進展。通過對其產(chǎn)品布局、技術特點和應用場景的系統(tǒng)分析,旨在為行業(yè)參與者提供全面的市場洞察和戰(zhàn)略參考。
1.1 智能體技術發(fā)展現(xiàn)狀
當前,AI 智能體技術已從簡單的規(guī)則引擎演進為具備感知、理解、決策和執(zhí)行能力的復雜系統(tǒng)。隨著大語言模型 (LLM) 能力的持續(xù)提升,特別是在推理、多模態(tài)理解和工具使用方面的突破,智能體已能夠完成從信息查詢到復雜任務執(zhí)行的全流程工作(22)。
多模態(tài)融合成為智能體能力提升的關鍵方向。各大公司均在視覺、語音、文本等多模態(tài)理解與生成方面投入大量資源,使智能體能夠更全面地感知和理解環(huán)境。
思考推理能力突破,使得智能體在AIME 2025數(shù)學測試等復雜問題場景中取得了優(yōu)異成績。預期智能體將進一步改進推理能力,特別是在復雜邏輯和多步驟問題解決方面。
長上下文理解能力的突破,使得智能體能夠處理更長的輸入內(nèi)容并保持上下文一致性,為復雜任務執(zhí)行提供了基礎支持(37)。
工具調(diào)用能力的提升是另一個重要趨勢?,F(xiàn)代智能體已不再局限于純文本交互,而是能夠與各種外部工具和服務集成,如搜索引擎、數(shù)據(jù)庫、代碼解釋器等,大大擴展了其應用范圍和實用價值。
1.2 智能體應用場景擴展
隨著技術的成熟,AI 智能體的應用場景正在從簡單的客服和問答擴展到更廣泛的領域。當前,智能體主要應用于以下五大場景:
1.個人助理:提供個性化的生活和工作協(xié)助,如日程管理、信息查詢、任務提醒等(27)
2.AI 搜索推薦:通過智能體提升傳統(tǒng)搜索的效率和準確性,提供更智能的信息檢索和內(nèi)容推薦服務(5)
3.企業(yè)服務:幫助企業(yè)自動化日常流程、提升客戶服務質(zhì)量、優(yōu)化業(yè)務決策(37)
4.開發(fā)者工具:為軟件開發(fā)人員提供代碼生成、調(diào)試、測試等輔助功能,提升開發(fā)效率(34)
5.垂直行業(yè)解決方案:針對金融、醫(yī)療、教育、制造等特定行業(yè)需求提供專業(yè)解決方案(54)
1.3 研究范圍與方法
本報告研究范圍涵蓋 2024 年 6 月至 2025 年 6 月期間,八家目標企業(yè)在 AI 智能體領域的技術研發(fā)、產(chǎn)品發(fā)布和應用落地情況。研究方法主要包括:
?產(chǎn)品分析:對各公司發(fā)布的智能體相關產(chǎn)品進行功能、性能和技術特點分析
?技術研究:跟蹤各公司在大模型架構、多模態(tài)處理、工具調(diào)用等關鍵技術領域的創(chuàng)新
?應用場景分析:評估各公司智能體產(chǎn)品在五大應用場景中的落地情況和效果
?對比研究:對各公司在相同或相似應用場景中的產(chǎn)品進行橫向比較
二、Google 智能體戰(zhàn)略與產(chǎn)品分析
2.1 Google 智能體產(chǎn)品矩陣
Google 作為 AI 領域的先行者,在智能體領域構建了全面的產(chǎn)品矩陣。2024-2025 年度,Google 的智能體戰(zhàn)略主要圍繞 Gemini 大模型展開,同時推進 Project Astra 等重點項目的研發(fā)。
Gemini 系列大模型是 Google 智能體的核心技術底座。2025 年 5 月,Google 推出了 Gemini 2.5 Pro 和 Gemini 2.5 Flash 兩個重要版本,為智能體提供了強大的多模態(tài)理解和生成能力(3)。Gemini 2.5 Pro 支持 100 萬 token 的上下文窗口,具備業(yè)界領先的長文本理解能力,同時在視頻理解方面取得重大突破,能夠進行視頻內(nèi)容分析并直接從視頻輸入生成應用。
Project Astra是 Google 在智能體領域的旗艦項目,旨在打造能夠?qū)崟r理解和交互物理世界的 AI 智能體。該項目于 2024 年 I/O 大會上首次亮相,但由于技術復雜性高,發(fā)布時間多次調(diào)整(2)。最新消息顯示,Project Astra 將在 2025 年下半年正式發(fā)布,屆時將提供實時視覺理解、環(huán)境感知和復雜任務執(zhí)行能力(7)。
Google AI Agents是 Google 在 2025 年 I/O 大會上推出的新一代智能體產(chǎn)品,旨在重新定義網(wǎng)絡交互方式(5)。這些智能體可以瀏覽網(wǎng)頁、總結(jié)內(nèi)容并協(xié)助購物,提供個性化、免提的用戶體驗。它們與 Project Astra 和 Mariner 項目深度集成,支持同時執(zhí)行多項任務(5)。
2.2 技術研究與創(chuàng)新
Google 在智能體技術方面的研究主要集中在以下幾個方向:
多模態(tài)理解與生成:Gemini 2.5 Pro 引入了視頻到應用生成功能,用戶只需輸入視頻內(nèi)容,就能直接生成 Web 應用,顯著提升了 UI 設計和開發(fā)工作流程的效率。此外,Gemini 2.5 Pro 還具備高級安全防護機制,特別是針對間接提示注入攻擊的防護能力,使其成為 Google 迄今為止最安全的模型系列(3)。
上下文理解與長文本處理:Gemini 2.5 Pro 擁有 100 萬 token 的上下文窗口,能夠處理超長文本輸入,這對于構建能夠理解復雜任務和歷史對話的智能體至關重要(3)。Google 還通過 Deep Think 技術增強了模型的推理能力,使其在處理復雜數(shù)學和編程問題時表現(xiàn)出色(3)。
實時交互與環(huán)境感知:Project Astra 專注于開發(fā)能夠?qū)崟r理解物理環(huán)境的智能體技術。該項目整合了計算機視覺、自然語言處理和實時數(shù)據(jù)分析能力,使智能體能夠像人類一樣 "看" 和 "理解" 周圍環(huán)境。例如,用戶可以通過手機攝像頭詢問植物名稱或?qū)ふ襾G失的物品,Astra 能夠基于視覺輸入提供準確的回答和建議。
工具集成與自動化:Google 智能體支持與多種工具和服務的集成,包括搜索、文檔處理和 Gmail 等應用。在 2025 年 I/O 大會上,Google 進一步增強了 Gemini 與地圖、Gmail 等應用的集成,實現(xiàn)了實時攝像頭訪問和屏幕共享功能,為智能體提供了更豐富的交互方式。
2.3 應用場景與落地效果
Google 的智能體產(chǎn)品在多個應用場景中取得了顯著進展:
個人助理:通過將 Gemini 集成到 Google Assistant 中,Google 打造了更加智能的個人助理體驗。新的 AI 助理能夠理解更復雜的指令,例如 "幫我預訂下周飛往紐約的航班,并確保酒店能看到中央公園",并能自主完成多步驟任務。此外,Google 還在開發(fā)能夠進行實時視頻通話的 AI 助手,為用戶提供更加自然的交互體驗。
AI 搜索與推薦:Google 推出的智能體能夠超越傳統(tǒng)搜索,提供更加主動和智能的信息服務。這些智能體可以瀏覽網(wǎng)頁、總結(jié)內(nèi)容并協(xié)助購物,提供個性化、免提的用戶體驗(5)。Google 已將 AI 智能體功能整合到搜索結(jié)果中,使搜索更加直觀和高效(5)。
企業(yè)服務:Gemini 1.5 Pro 已在 Google Workspace Labs 中推出,能夠快速合成會議記錄、文檔和 Gmail 內(nèi)容,顯著提升辦公效率(1)。此外,Google 還提供了面向企業(yè)的 Vertex AI 平臺,支持企業(yè)構建和部署自定義智能體,用于自動化業(yè)務流程和提升客戶服務質(zhì)量。
開發(fā)者工具:Google 為開發(fā)者提供了 Gemini API 和一系列開發(fā)工具,支持構建基于 Gemini 的智能體應用(3)。這些工具包括代碼生成、調(diào)試和測試功能,幫助開發(fā)者更高效地創(chuàng)建智能體應用。此外,Google 還提供了豐富的文檔和示例,降低了智能體開發(fā)的技術門檻(3)。
垂直行業(yè)解決方案:Gemini 的多模態(tài)能力在多個垂直領域得到應用。例如,在醫(yī)療領域,Gemini 能夠分析醫(yī)學影像并輔助診斷;在金融領域,能夠分析市場數(shù)據(jù)并生成投資建議;在教育領域,能夠創(chuàng)建個性化學習內(nèi)容(12)。
三、OpenAI 智能體戰(zhàn)略與產(chǎn)品分析
3.1 OpenAI 智能體產(chǎn)品矩陣
OpenAI 作為 ChatGPT 的開發(fā)者,在智能體領域有著獨特的戰(zhàn)略布局。2024-2025 年度,OpenAI 的智能體戰(zhàn)略主要圍繞 GPT-4.5、GPT-5 等大模型的升級以及 Operator 等智能體產(chǎn)品的開發(fā)展開。
GPT-4.5 系列是 OpenAI 在 2025 年推出的重要升級版本。GPT-4.5 于 2025 年 2 月 27 日正式發(fā)布,為 ChatGPT Plus 和 Pro 用戶提供了更高級的推理能力和更廣泛的知識覆蓋。該模型引入了 256,000 token 的上下文窗口,訓練數(shù)據(jù)截止到 2024 年 6 月,顯著提升了實時信息處理能力。
GPT-5是 OpenAI 正在開發(fā)的下一代旗艦模型,預計將在 2025 年下半年發(fā)布。據(jù) OpenAI CEO Sam Altman 透露,GPT-5 將集成多種 AI 能力于一個系統(tǒng)中,減少對不同模型選擇的需求,并通過思維鏈處理提高推理能力。GPT-5 將重點改進推理能力、工具使用自動化和增強的多模態(tài)功能,包括視頻集成的可能性。
Operator是 OpenAI 在 2025 年 1 月推出的 AI 智能體工具,旨在幫助控制計算機和執(zhí)行任務。該工具能夠自動執(zhí)行重復性任務,如編寫代碼或預訂旅行,在企業(yè)自動化領域具有廣泛應用前景。Operator 的核心是計算機使用代理 (CUA) 模型,開發(fā)者可以訪問該模型以實現(xiàn)數(shù)據(jù)輸入和其他操作的自動化。
OpenAI 智能體 API是 OpenAI 于 2025 年 3 月推出的開發(fā)者工具,允許用戶創(chuàng)建自定義 AI 智能體。這些智能體可以掃描公司文件、搜索數(shù)據(jù)庫并瀏覽網(wǎng)站,為企業(yè)提供了強大的信息處理能力。OpenAI 承諾不會在這些文件上訓練其模型,確保了企業(yè)數(shù)據(jù)的安全性。
OpenAI DeepResearch是 OpenAI 推出的一款專注于深度推理與復雜任務解決的大模型。它在學術研究、科學探索等領域表現(xiàn)出色,能夠處理涉及大量專業(yè)知識與邏輯推導的問題。比如在高能物理實驗數(shù)據(jù)的分析解讀中,DeepResearch 能夠快速梳理海量數(shù)據(jù),提取關鍵信息,并基于復雜的物理模型進行推理,輔助科研人員得出有價值的結(jié)論。在藥物研發(fā)的分子結(jié)構分析場景里,該模型可以依據(jù)已知的化學原理和大量實驗數(shù)據(jù),對新型藥物分子結(jié)構的可行性進行深度評估,為藥物研發(fā)節(jié)省大量時間與資源。
OpenAI O3作為 OpenAI 旗下另一款重要的推理大模型,在通用性與實用性上具有顯著優(yōu)勢。它能夠快速理解各類復雜指令,并在多種常見應用場景中高效執(zhí)行任務。在智能客服場景中,O3 可以迅速理解客戶的復雜問題,結(jié)合知識庫信息,提供準確且詳細的解答,極大提升客戶服務效率與滿意度。在內(nèi)容創(chuàng)作輔助方面,O3 能夠根據(jù)給定的主題和創(chuàng)作要求,生成邏輯連貫、內(nèi)容豐富的文章大綱,甚至可以進一步豐富細節(jié),為創(chuàng)作者提供靈感與基礎素材,助力內(nèi)容創(chuàng)作的高效開展。
3.2 技術研究與創(chuàng)新
OpenAI 在智能體技術方面的研究主要集中在以下幾個方向:
推理能力增強:GPT-4.5 和即將推出的 GPT-5 在推理能力方面有顯著提升。GPT-4.5 在 AIME 2025 數(shù)學測試中取得了優(yōu)異成績,在 Live Code Bench 等編程基準測試中表現(xiàn)出色(14)。GPT-4.5 在 AIME 2025 數(shù)學測試中取得了優(yōu)異成績,在 Live Code Bench 等編程基準測試中表現(xiàn)出色。GPT-5 將進一步改進推理能力,特別是在復雜邏輯和多步驟問題解決方面。OpenAI DeepResearch 與 O3 同樣在推理技術上不斷創(chuàng)新,DeepResearch 采用了更為復雜的推理算法架構,能夠?qū)ι顚哟蔚膶I(yè)知識進行精準推理;O3 則優(yōu)化了推理路徑選擇機制,在面對多種可行推理方案時,能快速篩選出最優(yōu)解,提升推理效率。
工具自動化:OpenAI 正在研究如何使智能體更加自主地使用工具。Operator 智能體能夠控制計算機并執(zhí)行任務,展示了智能體與物理世界交互的能力(21)。OpenAI 還在研究工具使用的自動化,使智能體能夠根據(jù)任務需求自動選擇和使用適當?shù)墓ぞ?14)。
多模態(tài)集成:OpenAI 正在增強智能體的多模態(tài)能力,使它們能夠處理文本、圖像、音頻和視頻等多種形式的輸入和輸出(14)。這一能力將使智能體能夠在更多場景中發(fā)揮作用,如視頻分析、語音交互和圖像識別等(14)。
上下文理解:GPT-4.5 引入了 256,000 token 的上下文窗口,顯著提升了長文本理解能力(14)。這一能力使智能體能夠更好地理解復雜指令和歷史對話,提供更加連貫和相關的回應(14)。
3.3 應用場景與落地效果
OpenAI 的智能體產(chǎn)品在多個應用場景中取得了顯著進展:
個人助理:OpenAI 的智能體正在從回答問題轉(zhuǎn)向完成實際任務,為用戶提供更加全面的個人助理服務(22)。ChatGPT 已具備一定的智能體能力,能夠理解用戶意圖并執(zhí)行復雜任務,如制定旅行計劃、管理日程和查找信息等(22)。
AI 搜索與推薦:OpenAI 的智能體能夠與搜索引擎集成,提供更加智能和個性化的搜索結(jié)果(14)。這些智能體可以瀏覽網(wǎng)頁、分析內(nèi)容并提供詳細的總結(jié),幫助用戶更高效地獲取信息(14)。
企業(yè)服務:OpenAI 的企業(yè)產(chǎn)品已服務超過 200 萬企業(yè)用戶,幫助企業(yè)自動化業(yè)務流程和提升客戶服務質(zhì)量(22)。Operator 智能體能夠自動執(zhí)行重復性任務,如編寫代碼、數(shù)據(jù)分析和報告生成,顯著提高企業(yè)效率(21)。
開發(fā)者工具:OpenAI 提供了豐富的 API 和工具,幫助開發(fā)者構建基于智能體的應用。這些工具包括代碼生成、調(diào)試和測試功能,降低了智能體開發(fā)的技術門檻。OpenAI 還提供了詳細的文檔和示例,幫助開發(fā)者快速上手。
垂直行業(yè)解決方案:OpenAI 的智能體在多個垂直領域得到應用。例如,在醫(yī)療領域,智能體可以分析病歷并提供診斷建議;在金融領域,能夠分析市場趨勢并生成投資策略;在教育領域,能夠創(chuàng)建個性化學習計劃(14)。
四、Grok 智能體戰(zhàn)略與產(chǎn)品分析
4.1 Grok 智能體產(chǎn)品矩陣
Grok 是由 Elon Musk 創(chuàng)立的 xAI 公司開發(fā)的 AI 聊天機器人,與 X 平臺 (原 Twitter) 深度集成。作為一個相對年輕的 AI 產(chǎn)品,Grok 在 2024-2025 年度快速發(fā)展,形成了獨特的產(chǎn)品矩陣。
Grok 系列模型是 Grok 智能體的核心技術基礎。2025 年 2 月,xAI 發(fā)布了 Grok 3,這是一個全新的 AI 模型系列,為 Grok 智能體提供了更強大的多模態(tài)理解和生成能力。Grok 3 引入了圖像分析和模擬推理能力,增強了 Grok 的視覺理解和邏輯推理能力。該模型還引入了 "思考模式" 和 "大腦模式",使 Grok 能夠處理更復雜的問題和任務(25)。
Grok AI是 xAI 開發(fā)的核心智能體產(chǎn)品,與 X 平臺深度集成。Grok 的最大特點是能夠?qū)崟r訪問 X 平臺的數(shù)據(jù),使其能夠引用實時帖子和趨勢話題,這是其他 AI 工具難以實現(xiàn)的功能。這一特性使 Grok 在提供最新信息和實時分析方面具有獨特優(yōu)勢。
Grok Studio是 xAI 于 2025 年 4 月推出的開發(fā)者工具,支持創(chuàng)建文檔、代碼、報告和瀏覽器游戲,并提供實時協(xié)作功能(24)。該工具支持 Python 和 JavaScript 等語言的代碼執(zhí)行,以及與 Google Drive 的無縫集成,為開發(fā)者提供了強大的智能體開發(fā)環(huán)境(24)。
Grok API是 xAI 于 2025 年 4 月向全球開發(fā)者開放的應用程序接口,使開發(fā)者能夠?qū)?Grok 的智能體能力集成到自己的應用中(25)。這一舉措顯著擴大了 Grok 的應用范圍和開發(fā)者生態(tài)(25)。
4.2 技術研究與創(chuàng)新
Grok 在智能體技術方面的研究主要集中在以下幾個方向:
實時學習能力:與大多數(shù)基于靜態(tài)訓練數(shù)據(jù)的 AI 模型不同,Grok 具有持續(xù)學習和更新的能力,能夠?qū)崟r獲取最新信息(23)。這一特性使 Grok 能夠提供最新的信息和趨勢分析,特別適合實時性要求高的應用場景(23)。
多模態(tài)處理:Grok 3 引入了圖像分析和理解能力,顯著增強了 Grok 的多模態(tài)處理能力。這使 Grok 能夠處理文本、圖像和視頻等多種形式的輸入,擴展了其應用場景。
動態(tài)人格配置:Grok 3 引入了動態(tài)人格配置功能,用戶可以選擇從共情支持到輕松調(diào)侃等多種交互模式,使交互體驗更加個性化和 engaging。這一功能使 Grok 在情感交互和用戶體驗方面具有獨特優(yōu)勢。
上下文記憶:Grok 具有強大的上下文記憶能力,能夠記住對話歷史并保持連貫的對話體驗。這使 Grok 能夠提供更加自然和個性化的交互體驗,避免了 "金魚式" 對話的問題。
4.3 應用場景與落地效果
Grok 的智能體產(chǎn)品在多個應用場景中取得了進展:
個人助理:Grok 作為一個 AI 聊天機器人,主要定位為個人助理,能夠回答問題、提供建議和進行日常對話。其與 X 平臺的深度集成使其能夠提供實時信息和趨勢分析,增強了其作為個人助理的實用性。
AI 搜索與推薦:Grok 的實時學習能力使其在提供最新信息和趨勢分析方面具有優(yōu)勢(23)。用戶可以向 Grok 詢問最新的新聞、事件和趨勢,獲得及時和準確的回答(23)。
開發(fā)者工具:Grok Studio 為開發(fā)者提供了強大的智能體開發(fā)環(huán)境,支持代碼生成、執(zhí)行和調(diào)試(24)。這使開發(fā)者能夠快速創(chuàng)建和測試基于 Grok 的智能體應用,降低了智能體開發(fā)的技術門檻(24)。
實時數(shù)據(jù)分析:Grok 的實時學習和多模態(tài)處理能力使其能夠進行實時數(shù)據(jù)分析和趨勢預測(23)。例如,用戶可以向 Grok 詢問股市趨勢、社交媒體情緒或其他實時數(shù)據(jù),獲得基于最新信息的分析和建議(23)。
創(chuàng)意內(nèi)容生成:Grok Studio 支持創(chuàng)建各種類型的創(chuàng)意內(nèi)容,包括文檔、報告和游戲(24)。Grok 的創(chuàng)意生成能力使用戶能夠快速創(chuàng)建高質(zhì)量的內(nèi)容,顯著提高創(chuàng)作效率(24)。
五、Apple 智能體戰(zhàn)略與產(chǎn)品分析
5.1 Apple 智能體產(chǎn)品矩陣
Apple 在智能體領域的布局相對謹慎但穩(wěn)步推進。2024-2025 年度,Apple 的智能體戰(zhàn)略主要圍繞 Siri 升級、Apple Intelligence 項目和 Health 領域的 AI 應用展開。
Apple Intelligence是 Apple 在 AI 領域的旗艦項目,于 2024 年秋季首次推出(31)。該項目旨在將先進的 AI 技術整合到 Apple 的產(chǎn)品和服務中,為用戶提供更加智能和個性化的體驗。Apple Intelligence 的核心是一系列先進的大語言模型和多模態(tài)模型,為 Apple 的智能體產(chǎn)品提供技術支持(31)。
Siri 升級是 Apple 智能體戰(zhàn)略的重要組成部分。根據(jù) Bloomberg 記者 Mark Gurman 的報道,Apple 計劃在 2025 年春季通過 iOS 18.4 更新推出全面改版的 Siri(27)。這次升級將賦予 Siri 屏幕感知能力,使其能夠 "看到" 手機屏幕上發(fā)生的事情,并基于視覺信息采取行動(27)。此外,Siri 還將獲得個人上下文知識,能夠更像個人助理一樣直接訪問用戶的日歷、電子郵件和消息(27)。
Apple Doctors AI Agent是 Apple 正在開發(fā)的健康領域智能體,旨在提供健康建議和指導(30)。該項目源于早期的 "Project Quartz" 健康教練服務,目前已升級為 "Project Mulberry",計劃與 iOS 19.4 操作系統(tǒng)更新一起發(fā)布,可能在 2025 年春季或夏季推出(30)。該智能體將與 Health 應用集成,收集設備數(shù)據(jù)并提供個性化的健康改善建議(30)。
Apple Safari AI是 Apple 正在開發(fā)的 AI 增強版 Safari 瀏覽器,旨在減少對 Google 搜索的依賴,重塑移動搜索生態(tài)系統(tǒng)(29)。該項目將引入智能體功能,提供更加智能和個性化的搜索和瀏覽體驗(29)。
5.2 技術研究與創(chuàng)新
Apple 在智能體技術方面的研究主要集中在以下幾個方向:
視覺理解與感知:Apple 正在開發(fā)的 Siri 升級版本將具備屏幕感知能力,使其能夠基于視覺信息理解用戶界面并采取行動(27)。這一技術將使 Siri 能夠與應用程序和界面元素進行交互,顯著擴展其功能范圍(27)。
個人上下文理解:Apple 正在增強 Siri 的個人上下文理解能力,使其能夠直接訪問用戶的日歷、電子郵件和消息等個人數(shù)據(jù)(27)。這一能力將使 Siri 能夠提供更加個性化和上下文相關的響應,增強其作為個人助理的實用性(27)。
健康數(shù)據(jù)分析:Apple Doctors AI Agent 將基于 Health 應用收集的數(shù)據(jù),提供個性化的健康建議和指導(30)。該智能體將使用機器學習技術分析用戶的健康數(shù)據(jù),識別模式并提供建議,幫助用戶改善健康狀況(30)。
多模態(tài)交互:Apple 正在研究如何將語音、視覺和文本等多種模態(tài)整合到智能體交互中,提供更加自然和直觀的用戶體驗(31)。這一研究方向與 Apple 的 Human Interface Guidelines 一致,強調(diào)以用戶為中心的設計理念(31)。
5.3 應用場景與落地效果
Apple 的智能體產(chǎn)品在多個應用場景中取得了進展:
個人助理:經(jīng)過全面升級的 Siri 將提供更加智能和個性化的個人助理服務(27)。新的 Siri 將能夠理解更加復雜的指令,如 "幫我把下周的會議改到深圳,順便訂能看到平安大廈的酒店",并能夠記住對話歷史,提供連貫的交互體驗(51)。
AI 搜索與推薦:Apple 正在開發(fā)的 Safari AI 將提供更加智能的搜索體驗,減少對 Google 搜索的依賴(29)。這一產(chǎn)品將結(jié)合 Apple Intelligence 的能力,提供更加相關和個性化的搜索結(jié)果(29)。
健康與醫(yī)療:Apple Doctors AI Agent 將在健康領域提供專業(yè)的指導和建議(30)。該智能體將能夠分析用戶的健康數(shù)據(jù),提供個性化的飲食、運動和睡眠建議,并可能與醫(yī)療專業(yè)人員合作創(chuàng)建關于不同健康狀況的視頻解釋(30)。
企業(yè)服務:Apple 的智能體技術也在向企業(yè)領域擴展。例如,在上海車展期間,Apple 展示了微信生態(tài)與智能座艙場景的智能體融合,使用戶能夠在車內(nèi)通過智能體完成微信上的各種操作(52)。
開發(fā)者工具:雖然 Apple 在智能體開發(fā)者工具方面的投入相對較少,但 Apple Intelligence 和相關 API 為開發(fā)者提供了構建智能體應用的基礎(31)。隨著 Apple Intelligence 的發(fā)展,預計將有更多的開發(fā)者工具和資源發(fā)布(31)。
六、字節(jié)跳動智能體戰(zhàn)略與產(chǎn)品分析
6.1 字節(jié)跳動智能體產(chǎn)品矩陣
字節(jié)跳動作為中國領先的科技公司,在智能體領域的布局全面且深入。2024-2025 年度,字節(jié)跳動的智能體戰(zhàn)略主要圍繞豆包大模型、Agent TARS 和 Coze 平臺展開。
豆包大模型是字節(jié)跳動在智能體領域的核心技術底座。2025 年 4 月,字節(jié)跳動推出了豆包 1.5?深度思考模型,為智能體提供了強大的多模態(tài)理解和生成能力(37)。該模型在 AIME 2024 數(shù)學測試中表現(xiàn)優(yōu)異,接近 OpenAI o3-mini-high 水平,在 Codeforces 編程挑戰(zhàn)中接近 o1 水平,在 GPQA 科學推理中躋身國際第一梯隊(37)。2025 年 6 月,字節(jié)跳動又推出了豆包 1.6 系列,成為國內(nèi)首個支持 256K 上下文的思考模型,同時綜合成本較前代驟降 63%(36)。
Agent TARS是字節(jié)跳動于 2025 年 3 月開源的多模態(tài) AI 智能體框架,專注于通過視覺理解與工具集成實現(xiàn)智能化任務自動化(33)。該框架能夠執(zhí)行復雜的網(wǎng)頁任務,如數(shù)據(jù)采集、深度研究和信息分析,并支持與瀏覽器、命令行和文件系統(tǒng)的無縫集成(33)。Agent TARS 已吸引超過 1000 名開發(fā)者參與開源社區(qū)建設,未來計劃擴展移動端支持并構建插件生態(tài)系統(tǒng)。
Coze 平臺是字節(jié)跳動推出的智能體構建平臺,聚焦零代碼 / 低代碼開發(fā),使任何企業(yè)或個人無需掌握復雜的算法和編程知識,即可快速構建具備對話交互、任務執(zhí)行、數(shù)據(jù)處理能力的 AI 智能體(35)。該平臺分為國內(nèi)版 "扣子" 和國際版 Coze,針對不同市場需求做了定制化設計(35)。
Trae是字節(jié)跳動于 2025 年 1 月發(fā)布的 AI 原生集成開發(fā)環(huán)境工具,實現(xiàn)了從 Copilot 向 Autopilot 的演進(34)。該工具可選擇簡體中文或英文,并內(nèi)置了 GPT-4o、Claude-3.5-Sonnet 模型供免費使用(34)。2025 年 3 月,字節(jié)跳動又推出了 Trae 國內(nèi)版,搭載豆包 - 1.5-pro 模型,支持切換滿血版 DeepSeek-R1&V3(34)。
小云雀 AI是字節(jié)跳動推出的圖像智能體,實現(xiàn)了 "零門檻內(nèi)容生成" 功能(36)。用戶輸入一句話指令,即可自動完成智能成片、數(shù)字人視頻、AI 設計等高階創(chuàng)作,15-60 秒短視頻制作效率提升 10 倍(36)。該工具已登陸安卓端,主要面向短視頻創(chuàng)作者和電商運營等場景(36)。
6.2 技術研究與創(chuàng)新
字節(jié)跳動在智能體技術方面的研究主要集中在以下幾個方向:
多模態(tài)感知與推理:字節(jié)跳動的智能體技術能夠結(jié)合文字、圖像、交互歷史等多種模態(tài)信息,實時理解動態(tài)變化的界面,像人類大腦一樣協(xié)同工作(33)。這一能力使智能體能夠處理更加復雜的任務和場景(33)。
端到端任務執(zhí)行:字節(jié)跳動的智能體技術將感知、推理、動作執(zhí)行等能力集成在一個模型內(nèi),能夠直接接收自然語言指令和屏幕截圖,輸出鼠標點擊、鍵盤輸入等操作(33)。這一特性使智能體能夠更加自然地與數(shù)字環(huán)境交互(33)。
視覺理解與 GUI 操作:Agent TARS 框架能夠基于視覺理解網(wǎng)頁內(nèi)容,并與瀏覽器、命令行和文件系統(tǒng)無縫集成,實現(xiàn)復雜任務的規(guī)劃與執(zhí)行(33)。這一技術突破了傳統(tǒng)自動化工具的局限性,使智能體能夠像人類一樣操作電腦、手機和網(wǎng)頁(33)。
低成本高效推理:字節(jié)跳動通過技術創(chuàng)新大幅降低了智能體的使用成本。豆包 1.6 系列模型的綜合成本較前代驟降 63%,輸入成本低至 0.8 元 / 百萬 tokens(36)。這一優(yōu)勢使字節(jié)跳動的智能體產(chǎn)品在市場競爭中具有明顯的價格優(yōu)勢(36)。
6.3 應用場景與落地效果
字節(jié)跳動的智能體產(chǎn)品在多個應用場景中取得了顯著成果:
個人助理:字節(jié)跳動的智能體產(chǎn)品如豆包 App 和小云雀 AI 為用戶提供了多樣化的個人助理服務(36)。例如,小云雀 AI 能夠根據(jù)用戶的文字指令自動生成短視頻內(nèi)容,顯著提升內(nèi)容創(chuàng)作效率(36)。
AI 搜索與推薦:字節(jié)跳動的智能體技術在搜索和推薦領域得到廣泛應用。例如,豆包的 "深度思考" 模式能夠像人類思考問題時一樣,想一想、搜一搜、再接著想,最終以解決問題為目的(37)。在購物場景中,豆包能夠根據(jù)預算、大小等限制條件推薦合適的產(chǎn)品(37)。
企業(yè)服務:字節(jié)跳動的智能體產(chǎn)品在企業(yè)服務領域表現(xiàn)出色。例如,豆包 1.5?深度思考模型在火山方舟平臺上為企業(yè)提供強大的智能體能力(37)。此外,Coze 平臺為企業(yè)提供了零代碼 / 低代碼開發(fā)智能體的能力,降低了企業(yè)應用智能體的技術門檻(35)。
開發(fā)者工具:Trae 作為字節(jié)跳動的 AI 原生集成開發(fā)環(huán)境工具,為開發(fā)者提供了強大的智能體開發(fā)平臺(34)。該工具支持代碼補全、代碼理解、Bug 修復、基于自然語言生成代碼等功能,幫助程序員自動化完成開發(fā)任務(34)。在一些項目中,Trae 能夠?qū)崿F(xiàn)端到端開發(fā),用戶提問后能夠直接生成完整的代碼項目(34)。
垂直行業(yè)解決方案:字節(jié)跳動的智能體技術在多個垂直領域得到應用。例如,在電商領域,智能體能夠自動處理商品咨詢、訂單查詢和售后處理等任務;在金融領域,智能體能夠分析市場數(shù)據(jù)并生成投資建議;在教育領域,智能體能夠創(chuàng)建個性化學習內(nèi)容(35)。
七、阿里巴巴智能體戰(zhàn)略與產(chǎn)品分析
7.1 阿里巴巴智能體產(chǎn)品矩陣
阿里巴巴作為中國領先的科技公司,在智能體領域有著全面的布局。2024-2025 年度,阿里巴巴的智能體戰(zhàn)略主要圍繞通義千問大模型、Qwen-Agent 框架和 Manus 合作項目展開。
通義千問大模型是阿里巴巴在智能體領域的核心技術底座。2025 年 4 月 29 日,阿里巴巴發(fā)布了新一代通義千問模型 Qwen3,參數(shù)量雖僅為 DeepSeek-R1 的 1/3,但性能全面超越 R1、OpenAI o1 等全球頂尖模型(45)。Qwen3 支持 119 種語言和方言,具備多語言理解、推理、指令跟隨和生成能力(41)。該模型引入了 "混合思考模式",用戶可切換 "思考模式" 和 "非思考模式",自己控制思考程度(41)。
Qwen-Agent是阿里巴巴通義團隊于 2025 年 1 月開源的 AI 智能體框架,為開發(fā)者提供了快速搭建 AI 智能體的工具包(42)。該框架提供了完整的解決方案,包括 Agent 工作流、工具調(diào)用能力、內(nèi)置代碼解釋器、RAG 檢索技術和上下文記憶能力(42)。Qwen-Agent 支持一鍵部署 Gradio Web 界面,為用戶提供直觀友好的交互環(huán)境(42)。
Qwen3 模型系列是阿里巴巴于 2025 年 4 月發(fā)布的新一代大模型系列,包括 2 款 MoE 模型和 6 款密集模型(41)。這些模型在代碼、數(shù)學、通用能力等基準測試中表現(xiàn)出色,與 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等頂級模型相比,展現(xiàn)出極具競爭力的結(jié)果(41)。Qwen3 增強了智能體能力,優(yōu)化了代碼能力,并加強了對 MCP (模型上下文協(xié)議) 的支持(41)。
阿里云百煉平臺是阿里巴巴于 2025 年 6 月升級的企業(yè)級一站式大模型應用開發(fā)平臺(46)。該平臺全面構建 3.0 階段,提供模型、應用、生態(tài)三位一體全鏈路的企業(yè)級大模型應用與服務開發(fā)平臺(46)。平臺還首創(chuàng) "智能體打賞" 功能,聯(lián)動支付寶 APP 百煉 AI 錢包,用戶可直接為高質(zhì)量智能體進行打賞(46)。
Manus 戰(zhàn)略合作是阿里巴巴與中國創(chuàng)業(yè)公司 Monica 于 2025 年 3 月宣布的戰(zhàn)略合作項目(45)。雙方將基于通義千問系列開源模型,在國產(chǎn)模型和算力平臺上實現(xiàn) Manus 的全部功能(45)。這一合作將通義千問的底層模型能力與 Manus 的創(chuàng)新應用相結(jié)合,為中國用戶打造更具創(chuàng)造力的通用智能體產(chǎn)品(45)。
7.2 技術研究與創(chuàng)新
阿里巴巴在智能體技術方面的研究主要集中在以下幾個方向:
混合思考模式:Qwen3 引入了創(chuàng)新的 "混合思考模式",用戶可切換 "思考模式" 和 "非思考模式",自己控制思考程度(41)。這一設計使智能體能夠根據(jù)問題的復雜程度靈活調(diào)整思考深度,提高效率和響應速度(41)。
Agent 能力優(yōu)化:阿里巴巴在 Qwen3 模型中專門優(yōu)化了智能體和代碼能力,增強了模型的工具調(diào)用和任務執(zhí)行能力(41)。這一優(yōu)化使智能體能夠更加高效地完成各種復雜任務(41)。
MCP 協(xié)議支持:Qwen3 加強了對 MCP (模型上下文協(xié)議) 的支持,使智能體能夠更好地與外部工具和服務交互(41)。這一支持擴展了智能體的應用范圍和功能邊界(41)。
多模態(tài)能力增強:通義千問模型在多模態(tài)能力方面持續(xù)提升。例如,通義千問 3.5 支持長視頻理解與秒級事件定位,基于解析和定位能力支持操控 OS/Mobile Agent(40)。這一能力使智能體能夠處理更加復雜的多媒體內(nèi)容(40)。
7.3 應用場景與落地效果
阿里巴巴的智能體產(chǎn)品在多個應用場景中取得了顯著成果:
個人助理:通義千問和相關智能體為用戶提供了多樣化的個人助理服務。例如,用戶可以通過通義千問智能體完成日程管理、信息查詢和任務提醒等日常任務(40)。
AI 搜索與推薦:通義千問的智能體能力在搜索和推薦領域得到廣泛應用。例如,在電商場景中,智能體能夠理解用戶的復雜需求,如 "推薦一套適合周末徒步的裝備,預算在 1000 元以內(nèi),適合身高 175cm 的男性",并提供精準的產(chǎn)品推薦(42)。
企業(yè)服務:阿里云百煉平臺為企業(yè)提供了一站式智能體開發(fā)和部署解決方案(46)。企業(yè)可以利用該平臺構建各種智能體應用,如智能客服、數(shù)據(jù)分析和業(yè)務流程自動化等(46)。此外,通義千問與 Manus 的戰(zhàn)略合作也為企業(yè)提供了更強大的智能體能力(45)。
開發(fā)者工具:Qwen-Agent 框架為開發(fā)者提供了快速構建智能體的工具包(42)。該框架支持多種工具調(diào)用,包括調(diào)用搜索引擎檢索信息、利用代碼解釋器執(zhí)行 Python 代碼、連接數(shù)據(jù)庫進行數(shù)據(jù)查詢等(42)。這些功能顯著降低了智能體開發(fā)的技術門檻(42)。
垂直行業(yè)解決方案:通義千問和相關智能體在多個垂直領域得到應用。例如,在金融領域,智能體能夠分析市場數(shù)據(jù)并生成投資建議;在醫(yī)療領域,智能體能夠輔助診斷和提供治療建議;在教育領域,智能體能夠創(chuàng)建個性化學習內(nèi)容(45)。
八、騰訊智能體戰(zhàn)略與產(chǎn)品分析
8.1 騰訊智能體產(chǎn)品矩陣
騰訊作為中國領先的科技公司,在智能體領域的布局全面且深入。2024-2025 年度,騰訊的智能體戰(zhàn)略主要圍繞混元大模型、元寶智能體和智能體開放平臺展開。
混元大模型是騰訊在智能體領域的核心技術底座。2025 年 5 月 21 日,騰訊混元迎來全面升級,旗艦快思考模型混元 TurboS 和深度思考模型混元 T1 均發(fā)布了新的迭代版本。在全球公認的權威大語言模型評測平臺 Chatbot Arena 上,混元 TurboS 排名已攀升至全球前八,在國內(nèi)僅次于 DeepSeek?;煸?TurboS 采用大規(guī)模混合 Mamba-MoE 模型,在效果與性能上展現(xiàn)出顯著優(yōu)勢(47)。
混元多模態(tài)模型是騰訊智能體的重要技術支撐。騰訊發(fā)布了混元視覺深度推理模型 T1-Vision、混元 Voice 語音模型、混元 Image 2.0 和混元 3D 等多模態(tài)模型(47)。混元 T1-Vision 支持多圖輸入,具備原生長思維鏈,能夠?qū)崿F(xiàn) "邊看圖邊思考",整體效果相比此前提升 5.3%,整體理解速度提升 50%(47)?;煸?Voice 是一款端到端語音通話模型,相比級聯(lián)方案,響應速度提升超過 30%,降至 1.6 秒(47)。
元寶智能體是騰訊開發(fā)的 AI 聊天機器人,與微信生態(tài)深度集成。元寶已在微信上線,用戶可以將元寶添加到微信好友列表中,實現(xiàn)與智能體的直接對話(52)。元寶還與騰訊地圖、騰訊文檔等騰訊服務打通,提供更加全面的服務能力(52)。此外,元寶還推出了 Chrome 瀏覽器插件,擴展了應用場景(52)。
騰訊云智能體開發(fā)平臺是騰訊于 2025 年 5 月升級的企業(yè)級智能體開發(fā)平臺(47)。該平臺整合了騰訊云的 RAG (檢索增強生成) 技術和全面的 Agent (智能體) 能力,幫助企業(yè)快速激活私域知識并構建專屬智能體(47)。平臺提供了多種構建智能體的模式和配套工具,并能夠?qū)崿F(xiàn)零代碼支持多 Agent 的轉(zhuǎn)交協(xié)同(52)。
樂享企業(yè) AI 知識庫是騰訊為企業(yè)提供的知識管理工具,幫助企業(yè)對知識的有效性、更新時間、權限進行管控,便于 AI 采用(47)。該工具與騰訊云智能體開發(fā)平臺緊密集成,為企業(yè)智能體提供了強大的知識庫支持(47)。
8.2 技術研究與創(chuàng)新
騰訊在智能體技術方面的研究主要集中在以下幾個方向:
混合架構創(chuàng)新:混元 TurboS 采用大規(guī)?;旌?Mamba-MoE 模型架構,將 Mamba 結(jié)構的狀態(tài)空間模型 (SSM) 與傳統(tǒng) Transformer 結(jié)合,形成 "快慢雙通道" 推理機制(48)。這一創(chuàng)新使模型在保持高精度的同時,顯著提升了推理速度(48)。
多模態(tài)融合:騰訊的多模態(tài)模型在多個領域取得突破。例如,混元 Image 2.0 在主觀畫面質(zhì)量和美學層面的人工測評中被認為是 "AI 味" 最少的模型之一(47)?;煸?3D 在可控性與超高清生成能力上實現(xiàn)代際飛躍。這些技術為智能體提供了強大的多模態(tài)理解和生成能力。
視覺深度推理:混元 T1-Vision 支持多圖輸入,具備原生長思維鏈,能夠?qū)崿F(xiàn) "邊看圖邊思考"(47)。該模型在視覺理解和推理方面取得重大突破,整體效果相比此前提升 5.3%,整體理解速度提升 50%(47)。這一能力使智能體能夠更好地理解和處理視覺信息(47)。
長短思維鏈融合:騰訊在混元 TurboS 的后訓練階段引入了長短思維鏈融合技術,使得 TurboS 理科推理提升超 10%,代碼能力提升 24%,競賽數(shù)學成績大幅提升了 39%(47)。這一技術使智能體能夠更好地處理復雜問題和多步驟任務(47)。
8.3 應用場景與落地效果
騰訊的智能體產(chǎn)品在多個應用場景中取得了顯著成果:
個人助理:元寶智能體為用戶提供了多樣化的個人助理服務(52)。用戶可以與元寶進行自然對話,完成日程管理、信息查詢和任務提醒等日常任務。元寶還能夠理解更加復雜的指令,如 "幫我規(guī)劃下周末的家庭出游,包括交通、景點和餐廳推薦"(52)。
AI 搜索與推薦:騰訊在 QQ 瀏覽器中引入了智能體功能,提供更加智能的搜索和瀏覽體驗(52)。QQ 瀏覽器的 QBot 支持 AI 搜索、AI 瀏覽、AI 辦公、AI 學習和 AI 寫作等功能,并整合了 AI 高考通、下載助理、更新助理、股票助理四個智能體(52)。這些功能使瀏覽和搜索更加智能和高效(52)。
企業(yè)服務:騰訊云智能體開發(fā)平臺為企業(yè)提供了一站式智能體解決方案(47)。企業(yè)可以利用該平臺構建各種智能體應用,如智能客服、數(shù)據(jù)分析和業(yè)務流程自動化等(47)。例如,在金融領域,智能體能夠分析市場數(shù)據(jù)并生成投資建議;在零售領域,智能體能夠分析銷售數(shù)據(jù)并優(yōu)化庫存管理(47)。
開發(fā)者工具:騰訊為開發(fā)者提供了豐富的智能體開發(fā)工具和資源(47)?;煸竽P秃拖嚓P API 為開發(fā)者提供了構建智能體應用的基礎能力。此外,騰訊還提供了詳細的文檔和示例,降低了智能體開發(fā)的技術門檻(47)。
垂直行業(yè)解決方案:騰訊的智能體技術在多個垂直領域得到應用。例如,在游戲領域,騰訊正在探索 AI 隊友和 AI 培訓等應用;在醫(yī)療領域,智能體能夠輔助診斷和提供治療建議;在教育領域,智能體能夠創(chuàng)建個性化學習內(nèi)容(52)。
九、華為智能體戰(zhàn)略與產(chǎn)品分析
9.1 華為智能體產(chǎn)品矩陣
華為作為中國領先的科技公司,在智能體領域的布局全面且深入。2024-2025 年度,華為的智能體戰(zhàn)略主要圍繞盤古大模型、ModelArts Versatile 平臺和鴻蒙智能體框架展開。
盤古大模型 5.5是華為在智能體領域的核心技術底座。2025 年 6 月 20 日,華為正式發(fā)布盤古大模型 5.5,自然語言處理 (NLP)、計算機視覺 (CV)、多模態(tài)、預測、科學計算五大基礎模型全面升級(54)。盤古 NLP 大模型推出了 718B 深度思考模型,這是一個由 256 個專家組成的 MoE 大模型,在知識推理、工具調(diào)用、數(shù)學等領域大幅增強,處于業(yè)界第一梯隊(54)。該模型在高效長序列、低幻覺、快慢思考融合、Agent 等特性上進行了升級,提升了用戶體驗(54)。
ModelArts Versatile是華為于 2025 年 6 月發(fā)布的最佳企業(yè) Agent 平臺(54)。該平臺內(nèi)置了各類業(yè)務場景的經(jīng)驗模板,支持自助式的智能體開發(fā),賦能企業(yè)組織與開發(fā)者構建更專業(yè)、更高產(chǎn)、更主動的企業(yè)級智能體(54)。Versatile 提供了智能化工具鏈,實現(xiàn) Agent 分鐘級工作輸出,達成傳統(tǒng)人工天級工作成果,有效降低 Agent 開發(fā)的復雜度與專業(yè)性(54)。
鴻蒙智能體框架 (HMAF) 是華為于 2025 年 HDC 開發(fā)者大會上推出的智能體開發(fā)框架。該框架支持多智能體協(xié)同處理復雜任務,為鴻蒙生態(tài)系統(tǒng)提供了強大的智能體支持。鴻蒙 6.0 系統(tǒng)首次將盤古大模型深度嵌入系統(tǒng)底層,徹底顛覆了人機交互邏輯。
盤古助手全面升級是華為于 2025 年 6 月推出的智能體應用(54)。升級后的盤古助手在意圖理解、任務規(guī)劃和執(zhí)行能力方面全面提升,能夠更準確地理解用戶需求并完成復雜任務(54)。例如,盤古 Doer 智能助手能夠根據(jù)用戶的問題自動調(diào)用相關工具和服務,如搜索、地圖和天氣等,提供一站式解決方案(54)。
CloudRobo 具身智能平臺是華為基于盤古大模型的多模態(tài)能力及思維能力推出的智能體平臺(54)。該平臺整合了數(shù)據(jù)合成、數(shù)據(jù)標注、模型開發(fā)、仿真驗證、云邊協(xié)同部署以及安全監(jiān)管等端到端能力,提供具身多模態(tài)生成大模型、具身規(guī)劃大模型、具身執(zhí)行大模型三大核心模型,加速具身智能創(chuàng)新(54)。
9.2 技術研究與創(chuàng)新
華為在智能體技術方面的研究主要集中在以下幾個方向:
自適應快慢思考融合:盤古大模型 5.5 引入了自適應快慢思考合一的技術,通過構建難度感知的快慢思考數(shù)據(jù)和兩階段漸進訓練,實現(xiàn)模型根據(jù)問題難易程度自適應地切換快慢思考(58)。這一技術使模型能夠在簡單問題上敏捷回復,在復雜問題上深度思考,整體模型推理效率提升 8 倍(58)。
低幻覺技術:盤古大模型 5.5 在降低幻覺方面取得重大突破(58)。通過結(jié)構化思考驗證等創(chuàng)新方案,盤古模型在生成內(nèi)容的準確性和可靠性方面有顯著提升,減少了 "一本正經(jīng)地胡說八道" 的情況(58)。
長序列處理優(yōu)化:盤古大模型 5.5 在長序列處理方面進行了優(yōu)化,提出了 Adaptive SWA 和 ESA 兩個關鍵技術,在保證模型推理精度的前提下顯著降低計算量和 KVCache(58)。這一優(yōu)化使盤古模型能夠在一兆以上的長序列任務中應對自如(58)。
多模態(tài)世界模型:華為基于盤古多模態(tài)大模型開發(fā)了世界模型,能夠為智能駕駛、具身智能機器人的訓練構建所需要的數(shù)字物理空間(54)。例如,在智能駕駛領域,輸入首幀的行車場景、行車控制信息和路網(wǎng)數(shù)據(jù),盤古世界模型就可以生成每路攝像頭的行車視頻和激光雷達的點云,為智能駕駛提供大量訓練數(shù)據(jù)(54)。
9.3 應用場景與落地效果
華為的智能體產(chǎn)品在多個應用場景中取得了顯著成果:
個人助理:升級后的盤古助手為用戶提供了更加智能和個性化的個人助理服務(54)。該助手能夠理解復雜的自然語言指令,如 "幫我查找上周拍攝的黃山風景照片,整理成一個相冊,并分享到家庭群",并能夠準確執(zhí)行這些指令(54)。
AI 搜索與推薦:華為的智能體技術在搜索和推薦領域得到廣泛應用。例如,盤古大模型能夠理解用戶的復雜需求,如 "推薦一本適合 10 歲兒童閱讀的科幻小說,作者是中國作家,獲得過國家級獎項",并提供精準的內(nèi)容推薦(54)。
企業(yè)服務:ModelArts Versatile 平臺為企業(yè)提供了一站式智能體開發(fā)和部署解決方案(54)。企業(yè)可以利用該平臺構建各種智能體應用,如智能客服、數(shù)據(jù)分析和業(yè)務流程自動化等(54)。例如,在制造領域,智能體能夠分析生產(chǎn)數(shù)據(jù)并優(yōu)化工藝流程;在物流領域,智能體能夠優(yōu)化配送路線并預測交付時間(54)。
開發(fā)者工具:華為為開發(fā)者提供了豐富的智能體開發(fā)工具和資源(54)。盤古大模型 API 和相關工具為開發(fā)者提供了構建智能體應用的基礎能力。此外,華為還提供了詳細的文檔和示例,降低了智能體開發(fā)的技術門檻(54)。
垂直行業(yè)解決方案:盤古大模型和相關智能體在多個垂直領域得到應用。例如,在智能駕駛領域,盤古世界模型能夠生成復雜的駕駛場景,為自動駕駛系統(tǒng)提供訓練數(shù)據(jù);在氣象領域,基于盤古大模型的 "智霽" 系統(tǒng)實現(xiàn)了 AI 集合預報,提高了天氣預報的準確性;在農(nóng)業(yè)領域,中國農(nóng)業(yè)科學院基于盤古大模型構建了農(nóng)業(yè)科學發(fā)現(xiàn)大模型,成功幫助科學家改良水稻株型,降低株高 25% 并提升抗倒伏性而不影響產(chǎn)量(55)。
十、智能體技術發(fā)展趨勢與未來展望
10.1 技術發(fā)展趨勢
多模態(tài)融合深化:智能體將越來越多地融合文本、圖像、音頻、視頻等多種模態(tài)的信息處理能力,實現(xiàn)更加全面和自然的交互體驗(47)。未來,智能體將能夠像人類一樣感知和理解周圍環(huán)境,處理更加復雜的任務和場景(54)。
思考推理能力增強:智能體在思考推理能力方面有顯著提升,在 AIME 2025 數(shù)學測試中取得了優(yōu)異成績,在 Live Code Bench 等編程基準測試中表現(xiàn)出色(14)。預期智能體將進一步改進推理能力,特別是在復雜邏輯和多步驟問題解決方面。
長短上下文結(jié)合:智能體將結(jié)合長上下文理解和短期記憶能力,實現(xiàn)更加連貫和個性化的交互體驗(3)。未來,智能體將能夠記住與用戶的歷史交互,并基于這些信息提供更加精準和相關的響應(52)。
自主決策與行動能力增強:智能體將從被動響應用戶指令轉(zhuǎn)向主動識別和解決問題,具備更強的自主決策和行動能力(16)。未來,智能體將能夠像人類助理一樣,主動規(guī)劃和執(zhí)行任務,如 "發(fā)現(xiàn)用戶經(jīng)常在周二晚上去健身房,主動提醒用戶帶運動裝備"(22)。
工具調(diào)用與環(huán)境交互:智能體將具備更加豐富的工具調(diào)用能力,能夠與各種數(shù)字和物理環(huán)境進行交互(33)。未來,智能體將能夠無縫調(diào)用各種應用程序、服務和設備,實現(xiàn)更加全面的功能覆蓋(54)。
多智能體協(xié)同:多個智能體之間的協(xié)同工作將成為未來發(fā)展的重要方向。未來,不同功能和專長的智能體將能夠協(xié)作完成復雜任務,如 "一個智能體負責收集信息,另一個智能體負責分析數(shù)據(jù),第三個智能體負責生成報告"。
10.2 應用場景擴展
個人生活全面助手:智能體將成為個人生活的全面助手,涵蓋日程管理、健康監(jiān)測、購物建議、旅行規(guī)劃等多個方面(27)。未來,智能體將能夠理解用戶的生活習慣和偏好,提供高度個性化的服務和建議(27)。
企業(yè)流程自動化:智能體將在企業(yè)內(nèi)部流程自動化方面發(fā)揮越來越重要的作用(35)。未來,智能體將能夠自動化處理各種重復性工作,如數(shù)據(jù)錄入、報告生成、客戶服務等,顯著提高企業(yè)效率并降低成本(35)。
垂直行業(yè)深度應用:智能體將在金融、醫(yī)療、教育、制造等垂直行業(yè)實現(xiàn)更加深入的應用(54)。未來,智能體將能夠利用行業(yè)專業(yè)知識和數(shù)據(jù),提供更加專業(yè)和精準的解決方案,如輔助醫(yī)療診斷、個性化教育和智能制造優(yōu)化等(54)。
物理世界交互與具身智能:智能體將從數(shù)字世界擴展到物理世界,實現(xiàn)與現(xiàn)實環(huán)境的交互(54)。未來,智能體將能夠控制機器人和智能設備,完成各種物理任務,如家庭清潔、物品整理和設備維護等(54)。
多平臺無縫集成:智能體將在多個平臺和設備上實現(xiàn)無縫集成,提供一致的用戶體驗(31)。未來,用戶將能夠在手機、電腦、智能家居設備等多個終端上與智能體交互,享受連貫和一致的服務(31)。
10.3 市場競爭格局展望
技術競爭加劇:隨著智能體技術的成熟和應用場景的擴展,各大科技公司之間的競爭將進一步加劇(16)。未來,技術創(chuàng)新將成為市場競爭的關鍵因素,包括模型性能、多模態(tài)處理能力、工具調(diào)用效率等方面的競爭(16)。
生態(tài)系統(tǒng)構建:智能體市場將從單一產(chǎn)品競爭轉(zhuǎn)向生態(tài)系統(tǒng)競爭(47)。未來,擁有完善開發(fā)者生態(tài)、豐富應用場景和強大基礎設施的公司將在市場競爭中占據(jù)優(yōu)勢(47)。
行業(yè)垂直整合:智能體市場將出現(xiàn)更多的行業(yè)垂直整合,科技公司將與行業(yè)合作伙伴共同開發(fā)針對特定行業(yè)的智能體解決方案(54)。未來,垂直行業(yè)解決方案將成為智能體市場的重要組成部分(54)。
開源與標準化:智能體技術將越來越多地采用開源模式和標準化協(xié)議(33)。未來,開源社區(qū)將在智能體技術發(fā)展中發(fā)揮越來越重要的作用,標準化協(xié)議將促進不同智能體系統(tǒng)之間的互操作性(33)。
安全與隱私保護:隨著智能體應用的普及,安全和隱私保護將成為重要議題(3)。未來,如何在保證智能體功能的同時,確保用戶數(shù)據(jù)的安全和隱私將成為行業(yè)關注的焦點(3)。
十一、結(jié)論與建議
11.1 主要研究發(fā)現(xiàn)
本報告對 2024 年 6 月至 2025 年 6 月期間,Google、OpenAI、Grok、Apple、字節(jié)跳動、阿里巴巴、騰訊、華為等八家全球領先科技企業(yè)在 AI 智能體領域的發(fā)展進行了全面分析。主要研究發(fā)現(xiàn)如下:
技術底座全面升級:各大公司均在大模型技術方面進行了重大升級,為智能體提供了更強大的技術支持(3)。這些升級包括模型架構創(chuàng)新、多模態(tài)處理能力增強、思考推理能力增強和長上下文理解能力提升等方面(3)。
產(chǎn)品矩陣日益豐富:各大公司已形成了涵蓋基礎模型、開發(fā)框架、應用平臺和垂直解決方案的完整產(chǎn)品矩陣(3)。這種全面的產(chǎn)品布局使公司能夠覆蓋從技術研發(fā)到應用落地的全產(chǎn)業(yè)鏈(3)。
應用場景不斷擴展:智能體應用已從早期的簡單問答擴展到個人助理、企業(yè)服務、開發(fā)者工具和垂直行業(yè)解決方案等多個領域(27)。這種場景擴展反映了智能體技術從通用型向?qū)S眯?、從輔助工具向生產(chǎn)力引擎的轉(zhuǎn)變(27)。
技術路線呈現(xiàn)分化:各大公司在智能體技術路線上呈現(xiàn)出一定的分化(23)。例如,Google 和 OpenAI 更注重通用性和基礎研究,Apple 更注重與現(xiàn)有生態(tài)的整合,而中國公司則更注重行業(yè)應用和成本優(yōu)化(23)。
市場競爭格局形成:智能體市場已形成了以 Google、OpenAI、Apple 和中國科技巨頭為主導的競爭格局(16)。中國公司在本地化服務、行業(yè)應用和成本控制方面具有優(yōu)勢,而國際巨頭則在基礎研究和全球生態(tài)方面領先(16)。
11.2 對行業(yè)參與者的建議
基于本報告的研究發(fā)現(xiàn),我們對智能體行業(yè)的參與者提出以下建議:
技術研發(fā)建議:
?聚焦差異化技術路線:避免簡單的技術跟隨,應根據(jù)自身優(yōu)勢和市場定位,選擇差異化的技術路線(16)。例如,垂直行業(yè)解決方案提供商可以聚焦特定領域的專業(yè)知識和數(shù)據(jù),開發(fā)專用智能體模型(16)。
?加強多模態(tài)融合研究:多模態(tài)融合是智能體技術發(fā)展的重要方向,應加大在這一領域的研發(fā)投入(47)。特別是視覺理解、語音交互和自然語言處理的融合將為智能體帶來更強大的能力(47)。
?重視長上下文和低幻覺技術:長上下文理解和低幻覺生成是當前智能體技術的兩個關鍵挑戰(zhàn),應投入資源解決這些問題(58)。例如,可以借鑒華為的 Adaptive SWA 和 ESA 技術,優(yōu)化長序列處理效率(58)。
產(chǎn)品策略建議:
?構建完整的產(chǎn)品矩陣:從基礎模型、開發(fā)框架到應用平臺和垂直解決方案,構建完整的產(chǎn)品矩陣(3)。這種全面的產(chǎn)品布局能夠滿足不同客戶的需求,提高客戶粘性(3)。
?注重用戶體驗設計:智能體產(chǎn)品的用戶體驗設計至關重要,應注重自然交互、上下文理解和個性化服務等方面(27)。例如,可以借鑒 Apple 的 Siri 升級經(jīng)驗,增強智能體的上下文記憶和個性化能力(27)。
?加強工具集成能力:智能體的價值很大程度上取決于其與外部工具和服務的集成能力,應加強這方面的產(chǎn)品設計(33)。例如,可以提供豐富的 API 和插件,支持與各種應用和服務的集成(33)。
市場拓展建議:
?聚焦垂直行業(yè)應用:垂直行業(yè)應用是智能體商業(yè)化的重要方向,應根據(jù)自身優(yōu)勢選擇合適的行業(yè)進行深耕(54)。例如,醫(yī)療、金融、教育等領域?qū)χ悄荏w有較高的需求和付費意愿(54)。
?推動開源和標準化:開源和標準化是擴大智能體生態(tài)的有效途徑,應積極參與開源社區(qū)和標準化工作(33)。例如,可以借鑒字節(jié)跳動和阿里巴巴的經(jīng)驗,開源部分技術和工具,促進生態(tài)發(fā)展(33)。
?構建開發(fā)者生態(tài):開發(fā)者生態(tài)是智能體應用創(chuàng)新的重要源泉,應投入資源構建活躍的開發(fā)者社區(qū)(42)。例如,可以提供豐富的文檔、示例和培訓資源,降低開發(fā)門檻(42)。
風險管理建議:
?重視安全與隱私保護:隨著智能體應用的普及,安全和隱私保護將變得越來越重要,應提前布局相關技術和措施(3)。例如,可以借鑒 Google 和華為的經(jīng)驗,加強模型安全和隱私保護技術研發(fā)(3)。
?關注倫理和合規(guī)問題:智能體技術涉及諸多倫理和合規(guī)問題,應建立相應的治理框架和流程(3)。例如,可以制定明確的使用指南和道德準則,確保智能體的合理和負責任使用(3)。
?平衡創(chuàng)新與可靠性:在追求技術創(chuàng)新的同時,不應忽視系統(tǒng)的穩(wěn)定性和可靠性(58)。例如,可以借鑒華為的自適應快慢思考技術,在保證模型能力的同時,提高響應速度和穩(wěn)定性(58)。
11.3 未來研究方向
基于本報告的研究發(fā)現(xiàn)和行業(yè)發(fā)展趨勢,我們提出以下值得進一步研究的方向:
技術研究方向:
?多智能體協(xié)同機制:研究多個智能體之間的協(xié)作機制,實現(xiàn)復雜任務的分布式處理。
?物理世界交互技術:研究智能體與物理世界的交互技術,包括機器人控制、環(huán)境感知和操作能力等(54)。
?個性化智能體技術:研究如何根據(jù)用戶特征和偏好,生成個性化的智能體模型和交互方式(27)。
應用研究方向:
?垂直行業(yè)智能體解決方案:深入研究特定行業(yè)的智能體應用場景和需求,開發(fā)專用解決方案(54)。
?跨平臺智能體集成:研究如何在不同平臺和設備上實現(xiàn)智能體的無縫集成,提供一致的用戶體驗(31)。
?智能體輔助決策系統(tǒng):研究智能體在決策支持中的應用,開發(fā)能夠輔助人類進行復雜決策的智能系統(tǒng)(22)。
市場研究方向:
?智能體商業(yè)模式研究:研究智能體的商業(yè)化模式和盈利機制,探索可持續(xù)的商業(yè)模式(16)。
?智能體用戶接受度研究:研究用戶對智能體的接受度和使用習慣,為產(chǎn)品設計和市場推廣提供依據(jù)(27)。
?智能體市場競爭策略研究:研究不同市場參與者的競爭策略,分析市場競爭格局的演變趨勢(16)。
智能體技術正處于快速發(fā)展階段,未來將深刻改變?nèi)藗兊墓ぷ骱蜕罘绞健N覀兿嘈?,隨著技術的不斷進步和應用場景的不斷擴展,智能體將成為人工智能領域的下一個爆發(fā)點,為人類社會帶來更多的創(chuàng)新和價值。
參考資料
[1] Google I/O 2024: Multimodal Gemini, Project Astra, AI agents and 'teammates' | Constellation Research Inc.?? https://www.constellationr.com/blog-news/insights/google-io-2024-multimodal-gemini-project-astra-ai-agents-and-teammates??
[2] Project Astra Unveiled: Why Google's Next-Gen AI Agents Are Worth the 2025 Wait - Just Think AI?? https://www.justthink.ai/blog/project-astra-unveiled-why-googles-next-gen-ai-agents-are-worth-the-2025-wait??
[3] Google I/O 2025: Updates to Gemini 2.5 from Google DeepMind?? https://blog.google/technology/google-deepmind/google-gemini-updates-io-2025/??
[4] Google Delays Next-Gen AI Launch to 2025?? https://www.datagrom.com/ai-news/google-delays-next-gen-ai-launch-to-2025.html??
[5] Google Introduces AI Agents to Revolutionize Search?? https://www.datagrom.com/ai-news/google-introduces-ai-agents-to-revolutionize-search.html??
[6] Project Astra Postponed: Google’s Advanced AI Agents Await 2025 Launch - PUNE.NEWS?? https://pune.news/technology/project-astra-postponed-googles-advanced-ai-agents-await-2025-launch-260020/??
[7] Project Astra is back and better than ever — how Google is using AI to make its assistant even smarter | Tom's Guide?? https://www.tomsguide.com/ai/project-astra-is-back-and-better-than-ever-how-google-is-using-ai-to-make-its-assistant-even-smarter??
[8] Google I/O 2025: Gemini 2.5, Project Astra and 10…?? https://www.inkl.com/news/google-i-o-2025-gemini-2-5-project-astra-and-10-groundbreaking-ai-updates??
[9] Project Astra delay means Google’s AI agent won’t arrive until next year — what we know | Tom's Guide?? https://www.tomsguide.com/ai/project-astra-delay-means-googles-ai-agent-wont-arrive-until-next-year-what-we-know??
[10] Google’s Gemini 2.5 Pro: A Leap Forward in Enterprise AI with Production-Ready Power | Dhaka AI?? https://dhaka.ai/googles-gemini-2-5-pro-a-leap-forward-in-enterprise-ai-with-production-ready-power/??
[11] Google Gemini 2.0: A Comprehensive Look from an Enterprise Perspective - WWT?? https://www.wwt.com/blog/google-gemini-20-a-comprehensive-look-from-an-enterprise-perspective??
[12] Google Gemini AI Unleashed: What You Need to Know in 2025?? https://techresearchs.com/artificial-intelligence/google-gemini-ai-unleashed-what-you-need-to-know-in-2025/??
[13] OpenAI GPT-5: Ph.D.-Level Intelligence Expected by 2025 - Geek Metaverse News?? https://www.geekmetaverse.com/openai-gpt-5-ph-d-level-intelligence-2025/?amp=1??
[14] ChatGPT 5: Everything We Know So Far About OpenAI's Next-Gen AI Model?? https://www.techopedia.com/chatgpt-5-all-we-know??
[15] GPT-5: Release Date, Features & Everything You Need to Know?? https://www.helicone.ai/blog/openai-gpt-5??
[16] AI Agents: Current Status in 2024 and Outlook in 2025?? https://www.cointeeth.com/en/news/ai-agents-current-status-in-2024-and-outlook-in-2025??
[17] Sam Altman’s 2025 blueprint: OpenAI’s superintelligent AI agents to enter the workforce | Mint?? https://www.livemint.com/ai/artificial-intelligence/sam-altman-s-2025-blueprint-openai-s-superintelligent-ai-agents-to-enter-the-workforce-11736155142011.html??
[18] GPT 4.5 Release Date & Features: What to Expect?? https://blog.promptlayer.com/everything-we-know-openais-gpt-4-5-model/??
[19] GPT-4.5: OpenAI's New Model with Enhanced Conversational Abilities?? https://mymeet.ai/blog/openai-gpt-4-5??
[20] OpenAI has announced release dates for GPT-4.5 and GPT-5 — the latter will be available ?without restrictions? in the free version of ChatGPT?? https://itc.ua/en/news/openai-has-announced-release-dates-for-gpt-4-5-and-gpt-5-the-latter-will-be-available-without-restrictions-in-the-free-version-of-chatgpt/??
[21] OpenAI could ship Operator, an AI agentic system in January 2025 | Windows Central?? https://www.windowscentral.com/software-apps/openai-will-reportedly-join-the-microsoft-salesforce-ai-agentic-war-with-operator-in-january-2025-i-think-2025-is-going-to-be-the-year-that-agentic-systems-finally-hit-the-mainstream??
[22] OpenAI Product Chief Says ChatGPT Will Become Agentic in 2025?? https://www.pymnts.com/artificial-intelligence-2/2025/openai-cpo-chatgpt-to-become-agentic-in-2025/??
[23] Grok 3 by xAI: The AI Revolution You Need to Know About in 2025 - AI2sql.io?? https://ai2sql.io/grok-3-xai-2025??
[24] Latest updates on Grok AI: What’s New in 2025? | Toolkitly?? https://www.toolkitly.com/latest-updates/grok-3-ai/50??
[25] Grok 3: xAI’s New AI Model in 2025?? https://fastbots.ai/blog/grok-3-xai-s-new-ai-model-in-2025??
[26] Grok 3: xAI Chatbot - Features & Performance | Ultralytics?? https://www.ultralytics.com/blog/exploring-the-latest-features-of-grok-3-xais-chatbot??
[27] 2025 will be the year the true AI assistant becomes a reality for Apple, Google, Samsung, and OpenAI – and it's going to happen fast | TechRadar?? https://www.techradar.com/computing/artificial-intelligence/2025-will-be-the-year-the-true-ai-assistant-becomes-a-reality-for-apple-google-samsung-and-openai-and-its-going-to-happen-fast??
[28] WWDC 2025: Apple's AI lag and challenges in agentic AI development?? https://www.digitimes.com/news/a20250611PD225/apple-wwdc-2025-apple-intelligence-ai-agent.html?mod=3??
[29] Case Study: Apple’s AI Strategy and Transformation in 2025 - AIX | AI Expert Network?? https://aiexpert.network/ai-at-apple/??
[30] Apple Reportedly Developing AI Agent 'Doctors'?? https://www.pymnts.com/artificial-intelligence-2/2025/apple-reportedly-developing-ai-agent-doctors-in-latest-health-push/??
[31] New Siri Experience With Apple Intelligence Set For Spring 2025 - AppleMagazine?? https://applemagazine.com/z0f76a1d14fd21a8fb5fd0d03e0fdc3d3cedae52f?wsidchk=25637780??
[32] Revamped Siri in iPhone SE 2025: Enhanced Features & AI Integration?? https://codingmall.com/knowledge-base/25-global/219191-how-will-the-revamped-siri-in-the-iphone-se-2025-differ-from-the-current-version??
[33] LLM之Agent(十四)| 字節(jié)開源ComputerUse純視覺驅(qū)動GUI 智能體模型 UI-TARS_agenttars-CSDN博客?? https://blog.csdn.net/wshzd/article/details/146505495??
[34] Trae[2025年字節(jié)跳動發(fā)布的AI編程工具]_百科?? https://m.baike.com/wiki/Trae/7477851224541724698?baike_source=doubao??
[35] 字節(jié) Coze 平臺,讓 Agent 智能體開發(fā)“零門檻”起飛_字節(jié)的智能體-CSDN博客?? https://blog.csdn.net/linshantang/article/details/147815292??
[36] 字節(jié)跳動的AI Agent野心:如何鋪就通向AGI的‘快車道’?_遠方木舟?? http://m.toutiao.com/group/7517561203263963686/?upstream_biz=doubao??
[37] 字節(jié)按下 AI Agent 加速鍵-36氪?? https://36kr.com/p/3255132397596676??
[38] 字節(jié)打響Agent基建之戰(zhàn)_華爾街見聞?? http://m.toutiao.com/group/7516530268405219851/?upstream_biz=doubao??
[39] ByteDance upgrades Doubao AI app with real-time interactive video call function | South China Morning Post?? https://amp.scmp.com/tech/tech-trends/article/3311978/bytedance-upgrades-doubao-ai-app-real-time-interactive-video-call-function??
[40] 通義大模型_AI大模型_一站式大模型推理和部署服務-阿里云?? https://tongyi.aliyun.com/renxin?ref=openi.cn??
[41] 阿里Qwen3深夜開源,增強Agent能力,加強對MCP支持_51CTO博客_阿里 ql?? https://blog.51cto.com/u_16163480/13891826??
[42] Qwen-Agent智能體框架:阿里又一開源王炸!附詳細教程_阿里發(fā)布qwen-agent框架-CSDN博客?? https://blog.csdn.net/weixin_40774379/article/details/144941809??
[43] 阿里Manus王炸!2025Agent元年A股萬億押注,誰將血洗行業(yè)?_葉神?? http://m.toutiao.com/group/7481136850657100326/?upstream_biz=doubao??
[44] 模型列表_大模型服務平臺百煉(Model Studio)-阿里云幫助中心?? https://help.aliyun.com/zh/model-studio/models??
[45] 阿里通義千問 Qwen3 開源,引領大模型新時代|agent|千問qwen3|大模型|智能體|知名企業(yè)|編程|阿里巴巴集團_手機網(wǎng)易網(wǎng)?? http://m.163.com/dy/article/JUCQU3ER05566H5X.html??
[47] 騰訊混元上新:多模態(tài)和智能體,兩手都要抓 | 最前線_36氪?? http://m.toutiao.com/group/7507176575436096026/?upstream_biz=doubao??
[48] 騰訊混元大模型:技術演進、生態(tài)突圍與開發(fā)者機遇-騰訊云開發(fā)者社區(qū)-騰訊云?? https://cloud.tencent.com/developer/article/2504514?policyId=1003??
[49] 行業(yè)落地分享:騰訊混元RAG/Agent落地實踐-CSDN博客?? https://blog.csdn.net/python1222_/article/details/143306189??
[50] 騰訊 | 混元大模型業(yè)務落地實踐-CSDN博客?? https://blog.csdn.net/2401_85375151/article/details/144518210??
[51] 微信向左,元寶向右:騰訊的自我革命_Agent_數(shù)據(jù)_混元?? https://m.sohu.com/a/863060754_121325295/??
[52] Agent 成了騰訊 AI 最大的牌面_應用_用戶_產(chǎn)品?? https://m.sohu.com/a/905971462_104421/??
[53] Hunyuan 3D-2.5?? https://www.vset3d.com/hunyuan-3d-2-5-tencent-pushes-the-boundaries-of-3d-generation-with-ai/??
[54] 華為云發(fā)布盤古大模型5.5,宣布新一代AI云服務上線,成就行業(yè)AI先鋒-華為云?? https://www.huaweicloud.com/intl/zh-cn/news/20250620101057482.html??
[55] 華為發(fā)布盤古大模型5.5,技術突破加速人工智能重塑產(chǎn)業(yè)_環(huán)球網(wǎng)?? http://m.toutiao.com/group/7518981799235355155/?upstream_biz=doubao??
[56] 華為盤古大模型5.5問世!推理、智能體能力大爆發(fā)-騰訊新聞?? https://view.inews.qq.com/k/20250620A09X3900??
[57] 基于國產(chǎn)昇騰AI云服務訓練,華為云發(fā)布盤古大模型5.5_騰訊新聞?? https://new.qq.com/rain/a/20250620A09DR700??
[58] #華為開發(fā)者大會2025 上,華為諾亞方舟實驗室主任王云鶴,帶來盤古大模型5.5技術解密:在高效長序列、低幻覺、快慢思考融合、Agent等特性上進行升級;在模型架構層面,結(jié)合華為硬件的特性,設計了新的718B MoE和72B MoE,并對原來的38B、7B等稠密模型也進行了升級,讓盤古大模型在華為的硬件上跑得更快,性能更強,支撐伙伴們用好盤古。#HDC2025 #華為云 #盤古大模型-抖音?? https://www.iesdouyin.com/share/video/7518607648871222567/?reginotallow=&mid=7518607843344599849&u_code=0&did=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&iid=MS4wLjABAAAANwkJuWIRFOzg5uCpDRpMj4OX-QryoDgn-yYlXQnRwQQ&with_sec_did=1&video_share_track_ver=&titleType=title&share_sign=JtlEFMY0jk.NhU0RsLruz5r5v2NyVChzbtWHW57xCU8-&share_versinotallow=280700&ts=1750939364&from_aid=1128&from_ssr=1??
[59] Huawei Cloud unveils major upgrade with Pangu Models 5.5 | Capacity Media?? https://www.capacitymedia.com/article-huawei-cloud-pangu-upgrade??
[60] Huawei Cloud Introduces Major Pangu Large Model 5.5 Update, Enhancing Five Core Models with Comprehensive Improvements - AI - C114Pro?? https://www.c114pro.com/ainews/85009.html??
本文轉(zhuǎn)載自???????旺知識??,作者:旺知識
