在信息爆炸的時(shí)代,我們?cè)缫蚜?xí)慣了遇到問(wèn)題就打開(kāi)搜索引擎:想知道月球車(chē)項(xiàng)目何時(shí)取消,搜索;辨認(rèn)傳統(tǒng)戲曲種類(lèi),搜索;甚至連歷史戰(zhàn)役的細(xì)節(jié),也能通過(guò)搜索找到答案。但你是否想過(guò),我們寄予厚望的AI大模型,在面對(duì)這些問(wèn)題時(shí)可能會(huì)「瞎編」答案?最近,字節(jié)跳動(dòng)與新加坡南洋理工大學(xué)的研究員們帶來(lái)了一項(xiàng)突破性技術(shù)——MMSearchR1,它讓大型多模態(tài)模型(LMMs)學(xué)會(huì)了像人類(lèi)一樣「按需搜索」,徹底改變了AI處理未知信息的方式...
4天前 702瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、市場(chǎng)概況與研究背景AI智能體(Agent)作為當(dāng)前人工智能領(lǐng)域的前沿方向,正在從實(shí)驗(yàn)室概念迅速崛起為科技巨頭的戰(zhàn)略核心。2025年被業(yè)內(nèi)普遍視為"AI智能體元年",標(biāo)志著這一技術(shù)從基礎(chǔ)研究邁向大規(guī)模商業(yè)化應(yīng)用的關(guān)鍵轉(zhuǎn)折點(diǎn)(16)。在這一背景下,全球科技巨頭紛紛加大在智能體領(lǐng)域的投入,推出各具特色的產(chǎn)品和技術(shù),形成了激烈的市場(chǎng)競(jìng)爭(zhēng)格局。本報(bào)告聚焦于2024年6月至2025年6月期間,Google、OpenAI、Grok、Apple、字節(jié)跳動(dòng)、...
4天前 1361瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、為什么你的智能音箱總像個(gè)"失憶癥患者"?"嘿,Siri,推薦一部類(lèi)似《星際穿越》的電影。""為你推薦《變形金剛》系列,科幻動(dòng)作大片哦~"如果這樣的對(duì)話讓你血壓飆升,別急,這不是你的錯(cuò)覺(jué)。現(xiàn)在的AI助手就像剛認(rèn)識(shí)三天的室友:表面客氣,實(shí)則對(duì)你的喜好只有模糊的"大眾印象"。它們要么用一套模板應(yīng)付所有人(比如永遠(yuǎn)推薦熱門(mén)電影),要么像金魚(yú)一樣只有七秒記憶——上次你明明說(shuō)過(guò)討厭機(jī)器人題材,這次依然給你推《變形金...
2025-06-17 06:50:11 1040瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、你的智能助手為啥總說(shuō)胡話?LLM的三大"阿喀琉斯之踵"上周我讓家里的智能音箱查"2025年NBA總冠軍預(yù)測(cè)",它一本正經(jīng)地說(shuō):"根據(jù)數(shù)據(jù)分析,紐約尼克斯隊(duì)概率最高"——但凡關(guān)注籃球的都知道,尼克斯這賽季連季后賽門(mén)檻都沒(méi)摸到。這不是個(gè)例,我的研究員朋友曾收到AI生成的論文綜述,里面引用了2028年才發(fā)表的文獻(xiàn)——這就是當(dāng)前大語(yǔ)言模型(LLMs)的尷尬現(xiàn)狀:能說(shuō)會(huì)道卻常犯迷糊,像個(gè)"笨蛋天才"。獨(dú)立LLMs的三大硬傷正在暴露...
2025-06-17 06:47:26 784瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
2025年春天,戛納電影節(jié)公布史上首個(gè)AI驅(qū)動(dòng)電影長(zhǎng)片單元——五部由生成式AI完成核心劇情框架的作品引發(fā)行業(yè)震動(dòng)。這些電影采用“人類(lèi)創(chuàng)意+生成式AI”混合模型(HyGenAI),號(hào)稱(chēng)節(jié)省75%成本與時(shí)間。中國(guó)導(dǎo)演齊磊的AI科幻電影《星際郎中》正是典型代表:其利用貴州算力集群,將3個(gè)月影視后期壓縮至3小時(shí),超算中心取代橫店實(shí)景搭建,小團(tuán)隊(duì)操作算法即可替代百人劇組。這不是科幻小說(shuō)。2025年的AI視頻生成工具正以“月拋式”速度進(jìn)...
2025-06-05 06:04:56 2741瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
作者介紹:本文作者來(lái)自通義實(shí)驗(yàn)室RAG團(tuán)隊(duì),致力于面向下一代RAG技術(shù)進(jìn)行基礎(chǔ)研究。該團(tuán)隊(duì)的WebWalker工作也被ACL2025mainconference錄用。在當(dāng)今信息爆炸的時(shí)代,如何高效地從海量的網(wǎng)絡(luò)數(shù)據(jù)中獲取有價(jià)值的信息,成為了人們面臨的一大挑戰(zhàn)。傳統(tǒng)的搜索引擎雖然能夠提供大量的信息,但在處理復(fù)雜的多步推理任務(wù)時(shí)往往顯得力不從心。來(lái)自阿里巴巴通義實(shí)驗(yàn)室的研究員提供了WebDancer,一個(gè)原生的信息檢索的AgenticModel,使之能夠...
2025-06-05 06:02:01 994瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
當(dāng)AI能自己“想”出國(guó)際奧數(shù)題解法,當(dāng)智能體不再需要人類(lèi)“喂飯”就能自主學(xué)習(xí),一場(chǎng)顛覆認(rèn)知的AI革命已悄然拉開(kāi)帷幕。告別“抄作業(yè)”的時(shí)代,人工智能正在學(xué)會(huì)“自己動(dòng)手”——但這究竟是開(kāi)啟了新文明的鑰匙,還是打開(kāi)了潘多拉魔盒?今天我們將深入探討這場(chǎng)改變AI本質(zhì)的“體驗(yàn)革命”。一、從“人類(lèi)數(shù)據(jù)依賴(lài)癥”到“自我成長(zhǎng)覺(jué)醒”:AI發(fā)展的十字路口在人工智能的世界里,曾經(jīng)有一個(gè)“抄作業(yè)”的時(shí)代。就像學(xué)生抱著教輔書(shū)刷題...
2025-05-22 00:01:10 864瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
當(dāng)AI不僅能生成逼真視頻,還能“理解”物理規(guī)則、“預(yù)測(cè)”社會(huì)互動(dòng)時(shí),世界模型正在重塑人工智能的邊界。從自動(dòng)駕駛中實(shí)時(shí)路況模擬,到機(jī)器人通過(guò)“認(rèn)知地圖”規(guī)劃路徑,再到虛擬社會(huì)中智能體的策略博弈——這項(xiàng)技術(shù)如何讓機(jī)器像人類(lèi)一樣“思考世界”?本文將揭開(kāi)世界模型的核心原理與未來(lái)圖景,帶你看看AI如何從“數(shù)據(jù)驅(qū)動(dòng)”走向“世界理解”。隨著GPT4、Sora等多模態(tài)模型的興起,人工智能正從單一任務(wù)向“理解和模擬真實(shí)世界...
2025-05-22 00:00:15 5312瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
近年來(lái),大語(yǔ)言模型和人工智能智能體技術(shù)發(fā)展迅猛,在自然語(yǔ)言處理、智能決策等眾多領(lǐng)域廣泛應(yīng)用。然而,隨著技術(shù)的快速迭代,評(píng)估大語(yǔ)言模型的標(biāo)準(zhǔn)和方法不斷變化,智能體在各領(lǐng)域的應(yīng)用也日益復(fù)雜和多樣化。但目前缺乏對(duì)這些技術(shù)全面且系統(tǒng)的梳理和總結(jié),使得研究人員和從業(yè)者難以把握技術(shù)發(fā)展全貌和趨勢(shì)。本文通過(guò)對(duì)相關(guān)基準(zhǔn)測(cè)試、智能體框架與應(yīng)用的深入分析,不僅有助于明晰當(dāng)前技術(shù)發(fā)展水平,發(fā)現(xiàn)存在的問(wèn)題和挑戰(zhàn),還能...
2025-05-09 00:25:16 2857瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
你是否有過(guò)這樣的時(shí)刻:僅僅為了完成一項(xiàng)簡(jiǎn)單的任務(wù),卻淹沒(méi)在眾多應(yīng)用程序之中?預(yù)訂一次旅行意味著要在攜程、高德、淘寶以及其他十幾個(gè)應(yīng)用程序之間來(lái)回切換——每個(gè)應(yīng)用都需要你投入注意力,都在爭(zhēng)奪你的屏幕使用時(shí)間。讓我給你介紹一下AI智能體:它們就像是你全新的數(shù)字管家,不僅聽(tīng)從指令,還能預(yù)判你的需求。這些可不是2020年那種普通的聊天機(jī)器人?,F(xiàn)代AI智能體,或者說(shuō)任何用于任務(wù)管理的AI聊天機(jī)器人,只需一次隨意的...
2025-04-24 06:22:03 1175瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
在科技飛速發(fā)展的今天,人工智能(AI)已經(jīng)成為大家耳熟能詳?shù)脑~匯。從手機(jī)里能陪你聊天的智能語(yǔ)音助手,到能自動(dòng)識(shí)別照片內(nèi)容的圖像軟件,AI的身影無(wú)處不在。不過(guò),你知道嗎?AI的發(fā)展正迎來(lái)一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn),就像一場(chǎng)比賽進(jìn)入了下半場(chǎng)。今天,就讓我們一起深入了解AI的這場(chǎng)“下半場(chǎng)”變革。一、AI上半場(chǎng):模型與方法的狂歡(一)輝煌成就:打敗人類(lèi)冠軍,通過(guò)各類(lèi)考試過(guò)去幾十年,AI取得了不少令人驚嘆的成績(jī)。在棋盤(pán)上,AI化...
2025-04-24 06:20:25 1326瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
你有沒(méi)有想過(guò),要是電腦、手機(jī)上的各種軟件,能聽(tīng)懂咱們說(shuō)的話,按要求自動(dòng)干活,那該多方便?現(xiàn)在,大語(yǔ)言模型(LLMs)就把這個(gè)想法變成了現(xiàn)實(shí),催生出了能直接把自然語(yǔ)言命令轉(zhuǎn)化為實(shí)際行動(dòng)的軟件智能體。其中,基于API的智能體和基于GUI的智能體格外引人注目,它們就像兩個(gè)身懷絕技的武林高手,各有各的招式,今天咱們就來(lái)好好嘮嘮它們的故事。大語(yǔ)言模型開(kāi)啟智能體新時(shí)代以前,大語(yǔ)言模型最拿手的就是生成一段段通順的文字...
2025-03-31 07:46:19 1725瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
當(dāng)前,AI搜索人工智能領(lǐng)域主要由Perplexity、OpenAIDeepResearch等部分閉源搜索AI方案主導(dǎo),閉源特性限制了透明度與創(chuàng)新。本文推出的ODS作為開(kāi)源方案,填補(bǔ)了開(kāi)源搜索AI的性能空白,促進(jìn)該領(lǐng)域的社區(qū)發(fā)展、創(chuàng)新與創(chuàng)業(yè),且在基準(zhǔn)測(cè)試中展現(xiàn)出超越部分閉源方案的性能,具有重要實(shí)用價(jià)值。文章推出開(kāi)放深度搜索(ODS),旨在縮小專(zhuān)有搜索AI解決方案與開(kāi)源同類(lèi)產(chǎn)品的差距。ODS由開(kāi)放搜索工具和開(kāi)放推理智能體組成,可與用戶選定的基...
2025-03-31 01:55:14 2485瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
你能想象嗎?未來(lái),家里的機(jī)器人不僅能聽(tīng)懂你的指令,幫你打掃衛(wèi)生、照顧老人小孩,還能像個(gè)貼心小助手一樣,根據(jù)你的心情和需求,主動(dòng)提供合適的服務(wù);游戲里的NPC不再是按部就班的“工具人”,而是能和你進(jìn)行深度互動(dòng),給你帶來(lái)沉浸式的游戲體驗(yàn);在醫(yī)療領(lǐng)域,智能助手能快速準(zhǔn)確地輔助醫(yī)生診斷病情,讓醫(yī)療服務(wù)更加高效和便捷。這些看似科幻電影里的場(chǎng)景,正隨著智能體AI(AgentAI)的發(fā)展逐漸成為現(xiàn)實(shí)。今天,咱們就一起來(lái)...
2025-03-19 00:18:05 1993瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
研究背景是大語(yǔ)言模型雖然厲害,但在做復(fù)雜推理和獲取最新信息時(shí)不太給力?,F(xiàn)有的和搜索引擎結(jié)合的方法,像檢索增強(qiáng)生成和把搜索引擎當(dāng)工具用,都有各自的問(wèn)題。重要意義在于提出的SEARCHR1框架能讓大語(yǔ)言模型在推理的時(shí)候更好地利用搜索引擎,提高解決復(fù)雜問(wèn)題的能力,而且還對(duì)相關(guān)訓(xùn)練策略有新的發(fā)現(xiàn),對(duì)大語(yǔ)言模型的發(fā)展有很大幫助。文章針對(duì)大語(yǔ)言模型(LLMs)在復(fù)雜推理和獲取外部最新信息方面的不足,提出SEARCHR1強(qiáng)化學(xué)...
2025-03-19 00:17:06 2582瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
今天要帶大家走進(jìn)一個(gè)超級(jí)酷炫的技術(shù)領(lǐng)域,它正在悄悄改變我們與計(jì)算機(jī)交互的方式,甚至可能重塑未來(lái)的數(shù)字世界。你有沒(méi)有想過(guò),有一天,我們跟電腦交流就像跟身邊的小伙伴聊天一樣自然,隨口說(shuō)句話,電腦就能幫我們把復(fù)雜的事情都搞定?這可不是科幻電影里的情節(jié),隨著大語(yǔ)言模型操作系統(tǒng)(LLMOS)的出現(xiàn),這一切正在慢慢成為現(xiàn)實(shí)。今天,咱們就來(lái)深入聊聊這個(gè)神奇的LLMOS,看看它到底是怎么做到的。一、傳統(tǒng)操作系統(tǒng)的困境在...
2025-03-06 10:33:19 2418瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好!今天咱得聊聊人工智能這圈的大新聞。現(xiàn)在大語(yǔ)言模型,就像雨后春筍一樣冒出來(lái),大家都知道它們厲害,能聊天、能寫(xiě)文章、能做題,可你知道它們的推理能力是咋一步步變強(qiáng)的嗎?最近,DeepSeekAI搞出了個(gè)大動(dòng)作,整出了DeepSeekR1系列模型,這就好比給大語(yǔ)言模型的推理能力打了一針超強(qiáng)的“升級(jí)針”,直接讓它們的“智商”上了好幾個(gè)臺(tái)階。這模型到底咋做到的?它又會(huì)給我們的生活帶來(lái)啥意想不到的變化?今天咱就好好扒一...
2025-02-08 14:22:21 5890瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
隨著人工智能發(fā)展,大語(yǔ)言模型取得顯著成果,但距離人類(lèi)水平的通用智能仍有差距。理解并解決大語(yǔ)言模型在實(shí)現(xiàn)通用智能過(guò)程中的關(guān)鍵問(wèn)題,如具身性、符號(hào)接地等,對(duì)推動(dòng)人工智能邁向通用智能階段至關(guān)重要,這不僅能拓展AI應(yīng)用領(lǐng)域,還能深化對(duì)智能本質(zhì)的理解,為構(gòu)建更強(qiáng)大、更智能的系統(tǒng)奠定基礎(chǔ)。本文聚焦于大語(yǔ)言模型(LLMs)通向通用人工智能(AGI)的研究,探討了實(shí)現(xiàn)AGI的基礎(chǔ)原理,包括具身性、符號(hào)接地、因果關(guān)系和記憶...
2025-01-16 11:39:04 3908瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
隨著人工智能的快速發(fā)展,智能體成為重要?jiǎng)?chuàng)新領(lǐng)域。其在多個(gè)行業(yè)已得到應(yīng)用且不斷進(jìn)化,研究這些趨勢(shì)有助于企業(yè)和個(gè)人了解未來(lái)技術(shù)走向,提前做好準(zhǔn)備,利用智能體提升效率、改善體驗(yàn),推動(dòng)各行業(yè)變革,同時(shí)確保其合理、道德地發(fā)展。文章首先介紹了人工智能智能體的定義及2024年的發(fā)展趨勢(shì),如在客戶服務(wù)、網(wǎng)絡(luò)安全等領(lǐng)域的應(yīng)用。接著詳細(xì)闡述了2025年的十大趨勢(shì),包括采用率增長(zhǎng)、主動(dòng)式智能體、超個(gè)性化、情感智能、多模態(tài)能...
2025-01-07 12:10:51 1.0w瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
最近,像o1這樣的慢思考推理系統(tǒng)在解決復(fù)雜推理任務(wù)上表現(xiàn)出色,但核心技術(shù)未公開(kāi)。研究界想探索其技術(shù)基礎(chǔ),本文在此背景下展開(kāi)研究。其重要意義在于提出的框架和方法能有效訓(xùn)練推理模型,在多個(gè)基準(zhǔn)測(cè)試上取得不錯(cuò)效果,有助于推動(dòng)大語(yǔ)言模型在復(fù)雜推理領(lǐng)域的發(fā)展,縮小與行業(yè)領(lǐng)先系統(tǒng)的差距,且研究資源公開(kāi),利于后續(xù)進(jìn)一步研究和合作。解讀本文旨在復(fù)現(xiàn)類(lèi)似o1的慢思考推理系統(tǒng),提出“模仿、探索和自我改進(jìn)”框架。首先通...
2024-12-27 14:44:53 4137瀏覽 0點(diǎn)贊 0回復(fù) 0收藏