在信息爆炸的時代,我們早已習慣了遇到問題就打開搜索引擎:想知道月球車項目何時取消,搜索;辨認傳統(tǒng)戲曲種類,搜索;甚至連歷史戰(zhàn)役的細節(jié),也能通過搜索找到答案。但你是否想過,我們寄予厚望的AI大模型,在面對這些問題時可能會「瞎編」答案?最近,字節(jié)跳動與新加坡南洋理工大學的研究員們帶來了一項突破性技術(shù)——MMSearchR1,它讓大型多模態(tài)模型(LMMs)學會了像人類一樣「按需搜索」,徹底改變了AI處理未知信息的方式...
一、市場概況與研究背景AI智能體(Agent)作為當前人工智能領(lǐng)域的前沿方向,正在從實驗室概念迅速崛起為科技巨頭的戰(zhàn)略核心。2025年被業(yè)內(nèi)普遍視為"AI智能體元年",標志著這一技術(shù)從基礎(chǔ)研究邁向大規(guī)模商業(yè)化應用的關(guān)鍵轉(zhuǎn)折點(16)。在這一背景下,全球科技巨頭紛紛加大在智能體領(lǐng)域的投入,推出各具特色的產(chǎn)品和技術(shù),形成了激烈的市場競爭格局。本報告聚焦于2024年6月至2025年6月期間,Google、OpenAI、Grok、Apple、字節(jié)跳動、...
一、為什么你的智能音箱總像個"失憶癥患者"?"嘿,Siri,推薦一部類似《星際穿越》的電影。""為你推薦《變形金剛》系列,科幻動作大片哦~"如果這樣的對話讓你血壓飆升,別急,這不是你的錯覺?,F(xiàn)在的AI助手就像剛認識三天的室友:表面客氣,實則對你的喜好只有模糊的"大眾印象"。它們要么用一套模板應付所有人(比如永遠推薦熱門電影),要么像金魚一樣只有七秒記憶——上次你明明說過討厭機器人題材,這次依然給你推《變形金...
2025-06-17 06:50:11 1040瀏覽 0點贊 0回復 0收藏
一、你的智能助手為啥總說胡話?LLM的三大"阿喀琉斯之踵"上周我讓家里的智能音箱查"2025年NBA總冠軍預測",它一本正經(jīng)地說:"根據(jù)數(shù)據(jù)分析,紐約尼克斯隊概率最高"——但凡關(guān)注籃球的都知道,尼克斯這賽季連季后賽門檻都沒摸到。這不是個例,我的研究員朋友曾收到AI生成的論文綜述,里面引用了2028年才發(fā)表的文獻——這就是當前大語言模型(LLMs)的尷尬現(xiàn)狀:能說會道卻常犯迷糊,像個"笨蛋天才"。獨立LLMs的三大硬傷正在暴露...
2025-06-17 06:47:26 784瀏覽 0點贊 0回復 0收藏
2025年春天,戛納電影節(jié)公布史上首個AI驅(qū)動電影長片單元——五部由生成式AI完成核心劇情框架的作品引發(fā)行業(yè)震動。這些電影采用“人類創(chuàng)意+生成式AI”混合模型(HyGenAI),號稱節(jié)省75%成本與時間。中國導演齊磊的AI科幻電影《星際郎中》正是典型代表:其利用貴州算力集群,將3個月影視后期壓縮至3小時,超算中心取代橫店實景搭建,小團隊操作算法即可替代百人劇組。這不是科幻小說。2025年的AI視頻生成工具正以“月拋式”速度進...
2025-06-05 06:04:56 2741瀏覽 0點贊 0回復 0收藏
作者介紹:本文作者來自通義實驗室RAG團隊,致力于面向下一代RAG技術(shù)進行基礎(chǔ)研究。該團隊的WebWalker工作也被ACL2025mainconference錄用。在當今信息爆炸的時代,如何高效地從海量的網(wǎng)絡數(shù)據(jù)中獲取有價值的信息,成為了人們面臨的一大挑戰(zhàn)。傳統(tǒng)的搜索引擎雖然能夠提供大量的信息,但在處理復雜的多步推理任務時往往顯得力不從心。來自阿里巴巴通義實驗室的研究員提供了WebDancer,一個原生的信息檢索的AgenticModel,使之能夠...
2025-06-05 06:02:01 998瀏覽 0點贊 0回復 0收藏
當AI能自己“想”出國際奧數(shù)題解法,當智能體不再需要人類“喂飯”就能自主學習,一場顛覆認知的AI革命已悄然拉開帷幕。告別“抄作業(yè)”的時代,人工智能正在學會“自己動手”——但這究竟是開啟了新文明的鑰匙,還是打開了潘多拉魔盒?今天我們將深入探討這場改變AI本質(zhì)的“體驗革命”。一、從“人類數(shù)據(jù)依賴癥”到“自我成長覺醒”:AI發(fā)展的十字路口在人工智能的世界里,曾經(jīng)有一個“抄作業(yè)”的時代。就像學生抱著教輔書刷題...
2025-05-22 00:01:10 864瀏覽 0點贊 0回復 0收藏
當AI不僅能生成逼真視頻,還能“理解”物理規(guī)則、“預測”社會互動時,世界模型正在重塑人工智能的邊界。從自動駕駛中實時路況模擬,到機器人通過“認知地圖”規(guī)劃路徑,再到虛擬社會中智能體的策略博弈——這項技術(shù)如何讓機器像人類一樣“思考世界”?本文將揭開世界模型的核心原理與未來圖景,帶你看看AI如何從“數(shù)據(jù)驅(qū)動”走向“世界理解”。隨著GPT4、Sora等多模態(tài)模型的興起,人工智能正從單一任務向“理解和模擬真實世界...
2025-05-22 00:00:15 5312瀏覽 0點贊 0回復 0收藏
近年來,大語言模型和人工智能智能體技術(shù)發(fā)展迅猛,在自然語言處理、智能決策等眾多領(lǐng)域廣泛應用。然而,隨著技術(shù)的快速迭代,評估大語言模型的標準和方法不斷變化,智能體在各領(lǐng)域的應用也日益復雜和多樣化。但目前缺乏對這些技術(shù)全面且系統(tǒng)的梳理和總結(jié),使得研究人員和從業(yè)者難以把握技術(shù)發(fā)展全貌和趨勢。本文通過對相關(guān)基準測試、智能體框架與應用的深入分析,不僅有助于明晰當前技術(shù)發(fā)展水平,發(fā)現(xiàn)存在的問題和挑戰(zhàn),還能...
2025-05-09 00:25:16 2863瀏覽 0點贊 0回復 0收藏
你是否有過這樣的時刻:僅僅為了完成一項簡單的任務,卻淹沒在眾多應用程序之中?預訂一次旅行意味著要在攜程、高德、淘寶以及其他十幾個應用程序之間來回切換——每個應用都需要你投入注意力,都在爭奪你的屏幕使用時間。讓我給你介紹一下AI智能體:它們就像是你全新的數(shù)字管家,不僅聽從指令,還能預判你的需求。這些可不是2020年那種普通的聊天機器人?,F(xiàn)代AI智能體,或者說任何用于任務管理的AI聊天機器人,只需一次隨意的...
2025-04-24 06:22:03 1175瀏覽 0點贊 0回復 0收藏
在科技飛速發(fā)展的今天,人工智能(AI)已經(jīng)成為大家耳熟能詳?shù)脑~匯。從手機里能陪你聊天的智能語音助手,到能自動識別照片內(nèi)容的圖像軟件,AI的身影無處不在。不過,你知道嗎?AI的發(fā)展正迎來一個關(guān)鍵轉(zhuǎn)折點,就像一場比賽進入了下半場。今天,就讓我們一起深入了解AI的這場“下半場”變革。一、AI上半場:模型與方法的狂歡(一)輝煌成就:打敗人類冠軍,通過各類考試過去幾十年,AI取得了不少令人驚嘆的成績。在棋盤上,AI化...
2025-04-24 06:20:25 1326瀏覽 0點贊 0回復 0收藏
你有沒有想過,要是電腦、手機上的各種軟件,能聽懂咱們說的話,按要求自動干活,那該多方便?現(xiàn)在,大語言模型(LLMs)就把這個想法變成了現(xiàn)實,催生出了能直接把自然語言命令轉(zhuǎn)化為實際行動的軟件智能體。其中,基于API的智能體和基于GUI的智能體格外引人注目,它們就像兩個身懷絕技的武林高手,各有各的招式,今天咱們就來好好嘮嘮它們的故事。大語言模型開啟智能體新時代以前,大語言模型最拿手的就是生成一段段通順的文字...
2025-03-31 07:46:19 1725瀏覽 0點贊 0回復 0收藏
當前,AI搜索人工智能領(lǐng)域主要由Perplexity、OpenAIDeepResearch等部分閉源搜索AI方案主導,閉源特性限制了透明度與創(chuàng)新。本文推出的ODS作為開源方案,填補了開源搜索AI的性能空白,促進該領(lǐng)域的社區(qū)發(fā)展、創(chuàng)新與創(chuàng)業(yè),且在基準測試中展現(xiàn)出超越部分閉源方案的性能,具有重要實用價值。文章推出開放深度搜索(ODS),旨在縮小專有搜索AI解決方案與開源同類產(chǎn)品的差距。ODS由開放搜索工具和開放推理智能體組成,可與用戶選定的基...
2025-03-31 01:55:14 2485瀏覽 0點贊 0回復 0收藏
你能想象嗎?未來,家里的機器人不僅能聽懂你的指令,幫你打掃衛(wèi)生、照顧老人小孩,還能像個貼心小助手一樣,根據(jù)你的心情和需求,主動提供合適的服務;游戲里的NPC不再是按部就班的“工具人”,而是能和你進行深度互動,給你帶來沉浸式的游戲體驗;在醫(yī)療領(lǐng)域,智能助手能快速準確地輔助醫(yī)生診斷病情,讓醫(yī)療服務更加高效和便捷。這些看似科幻電影里的場景,正隨著智能體AI(AgentAI)的發(fā)展逐漸成為現(xiàn)實。今天,咱們就一起來...
2025-03-19 00:18:05 1993瀏覽 0點贊 0回復 0收藏
研究背景是大語言模型雖然厲害,但在做復雜推理和獲取最新信息時不太給力?,F(xiàn)有的和搜索引擎結(jié)合的方法,像檢索增強生成和把搜索引擎當工具用,都有各自的問題。重要意義在于提出的SEARCHR1框架能讓大語言模型在推理的時候更好地利用搜索引擎,提高解決復雜問題的能力,而且還對相關(guān)訓練策略有新的發(fā)現(xiàn),對大語言模型的發(fā)展有很大幫助。文章針對大語言模型(LLMs)在復雜推理和獲取外部最新信息方面的不足,提出SEARCHR1強化學...
2025-03-19 00:17:06 2582瀏覽 0點贊 0回復 0收藏
今天要帶大家走進一個超級酷炫的技術(shù)領(lǐng)域,它正在悄悄改變我們與計算機交互的方式,甚至可能重塑未來的數(shù)字世界。你有沒有想過,有一天,我們跟電腦交流就像跟身邊的小伙伴聊天一樣自然,隨口說句話,電腦就能幫我們把復雜的事情都搞定?這可不是科幻電影里的情節(jié),隨著大語言模型操作系統(tǒng)(LLMOS)的出現(xiàn),這一切正在慢慢成為現(xiàn)實。今天,咱們就來深入聊聊這個神奇的LLMOS,看看它到底是怎么做到的。一、傳統(tǒng)操作系統(tǒng)的困境在...
2025-03-06 10:33:19 2418瀏覽 0點贊 0回復 0收藏
大家好!今天咱得聊聊人工智能這圈的大新聞?,F(xiàn)在大語言模型,就像雨后春筍一樣冒出來,大家都知道它們厲害,能聊天、能寫文章、能做題,可你知道它們的推理能力是咋一步步變強的嗎?最近,DeepSeekAI搞出了個大動作,整出了DeepSeekR1系列模型,這就好比給大語言模型的推理能力打了一針超強的“升級針”,直接讓它們的“智商”上了好幾個臺階。這模型到底咋做到的?它又會給我們的生活帶來啥意想不到的變化?今天咱就好好扒一...
2025-02-08 14:22:21 5890瀏覽 0點贊 0回復 0收藏
隨著人工智能發(fā)展,大語言模型取得顯著成果,但距離人類水平的通用智能仍有差距。理解并解決大語言模型在實現(xiàn)通用智能過程中的關(guān)鍵問題,如具身性、符號接地等,對推動人工智能邁向通用智能階段至關(guān)重要,這不僅能拓展AI應用領(lǐng)域,還能深化對智能本質(zhì)的理解,為構(gòu)建更強大、更智能的系統(tǒng)奠定基礎(chǔ)。本文聚焦于大語言模型(LLMs)通向通用人工智能(AGI)的研究,探討了實現(xiàn)AGI的基礎(chǔ)原理,包括具身性、符號接地、因果關(guān)系和記憶...
2025-01-16 11:39:04 3908瀏覽 0點贊 0回復 0收藏
隨著人工智能的快速發(fā)展,智能體成為重要創(chuàng)新領(lǐng)域。其在多個行業(yè)已得到應用且不斷進化,研究這些趨勢有助于企業(yè)和個人了解未來技術(shù)走向,提前做好準備,利用智能體提升效率、改善體驗,推動各行業(yè)變革,同時確保其合理、道德地發(fā)展。文章首先介紹了人工智能智能體的定義及2024年的發(fā)展趨勢,如在客戶服務、網(wǎng)絡安全等領(lǐng)域的應用。接著詳細闡述了2025年的十大趨勢,包括采用率增長、主動式智能體、超個性化、情感智能、多模態(tài)能...
2025-01-07 12:10:51 1.0w瀏覽 0點贊 0回復 0收藏
最近,像o1這樣的慢思考推理系統(tǒng)在解決復雜推理任務上表現(xiàn)出色,但核心技術(shù)未公開。研究界想探索其技術(shù)基礎(chǔ),本文在此背景下展開研究。其重要意義在于提出的框架和方法能有效訓練推理模型,在多個基準測試上取得不錯效果,有助于推動大語言模型在復雜推理領(lǐng)域的發(fā)展,縮小與行業(yè)領(lǐng)先系統(tǒng)的差距,且研究資源公開,利于后續(xù)進一步研究和合作。解讀本文旨在復現(xiàn)類似o1的慢思考推理系統(tǒng),提出“模仿、探索和自我改進”框架。首先通...
2024-12-27 14:44:53 4143瀏覽 0點贊 0回復 0收藏