OpenAI推出新人工智能代理Deep Research
上個月,DeepSeek改寫了人工智能的劇本,這促使整個行業(yè)坐下來關(guān)注。一些科技巨頭被迫重新思考他們的游戲,因為舊的戰(zhàn)術(shù)可能會在這個快速變化的環(huán)境中削弱自己。

OpenAI是人工智能領(lǐng)域的關(guān)鍵參與者,對DeepSeek的挑戰(zhàn)做出了回應,承諾“提供更好的模型”并加快產(chǎn)品發(fā)布。就在宣布這一消息幾天后,這家總部位于舊金山的公司發(fā)布了一款新的人工智能代理,旨在進行深入而復雜的研究。
名為Deep Research (深度研究)的新產(chǎn)品可以在互聯(lián)網(wǎng)上對包括科學、金融、工程和政策在內(nèi)的各種主題進行多步驟研究。它建立在最近宣布的o3推理AI模型的特殊版本之上。
根據(jù)OpenAI的說法,Deep Research可用于廣泛的應用程序,包括為研究人員提供深入的知識,幫助購物者尋找超個性化的推薦。OpenAI在一篇博客文章中聲稱,Deep Research可以“在幾十分鐘內(nèi)完成人類需要幾個小時才能完成的任務”
OpenAI分享道:“Deep Research獨立發(fā)現(xiàn)、推理并整合來自網(wǎng)絡(luò)的見解。”為了實現(xiàn)這一點,它接受了需要瀏覽器和Python工具使用的真實任務的訓練,使用了我們第一個推理模型OpenAI o1背后的相同強化學習方法?!?/span>
“雖然o1在編碼、數(shù)學和其他技術(shù)領(lǐng)域表現(xiàn)出了令人印象深刻的能力,但許多現(xiàn)實世界的挑戰(zhàn)需要從不同的在線來源收集廣泛的背景和信息。深入的研究建立在這些推理能力的基礎(chǔ)上,以彌合這一差距,使其能夠解決人們在工作和日常生活中面臨的問題?!?/span>
Deep Research現(xiàn)已面向OpenAI Pro用戶開放,每月最多可查詢100次。此外,團隊用戶接下來將被授予訪問權(quán)限,企業(yè)用戶隨后將被授予。該公司在不久的將來會發(fā)布更具成本效益的Deep Research版本時,所有付費用戶都將有更高優(yōu)惠。
目前,該代理僅通過網(wǎng)絡(luò)提供,并計劃在本月晚些時候集成移動和桌面應用程序。
在性能基準方面,OpenAI分享說,Deep Research在Humanities Last Exam上的準確率達到了26.6%的新高,這是一種基于專家級問題的人工智能評估工具。
那么,Deep Research與DeepSeek的R1相比如何?這兩家公司在功能上似乎不是直接競爭對手。Deep Research更適合結(jié)構(gòu)化研究、引文管理和自動推理。而R1更適合解決復雜的數(shù)學和計算問題。盡管如此,兩者之間的比較是不可避免的,特別是考慮到它們名稱的相似和發(fā)布日期的接近。
Sam Altman在今年伊始大膽宣稱,OpenAI現(xiàn)在對如何創(chuàng)建AGI充滿信心。Deep Research的發(fā)布與公司開發(fā)AGI的更廣泛目標相一致。
OpenAI的Deep Research有可能大大減少在線研究所需的時間和精力。通過簡單的查詢,用戶可以輕松找到個人研究分析師。然而,說起來容易做起來難。
人工智能幻覺仍然是GenAI模型中的一個持續(xù)挑戰(zhàn),Deep Research也不例外。OpenAI承認,根據(jù)其內(nèi)部評估,Deep Research有時會產(chǎn)生幻覺或做出不正確的反應。在進行深入研究時,這可能是一個主要問題。
OpenAI分享說,Deep Research可能“難以區(qū)分權(quán)威信息和謠言,目前在信心校準方面表現(xiàn)出弱點,往往無法準確傳達不確定性。”然而,它預計隨著更多的使用和時間,這些問題會得到改善。
DeepSeek R1的發(fā)布重新引發(fā)了關(guān)于開源代碼在人工智能世界中的作用的爭論。盡管OpenAI有著開源的初衷和名字,但它已經(jīng)轉(zhuǎn)向了閉源開發(fā)方法。
Altman上周在Reddit AMA上寫道,他承認OpenAI“站在了歷史的錯誤一邊”,現(xiàn)在需要“想出一個不同的開源策略”。然而,他很快提到,并非OpenAI的每個人都認同這一觀點,這也不是最高優(yōu)先級的事情。
OpenAI首席產(chǎn)品官Kevin Weil表示,該公司被認為將其一些較舊、不太先進的型號開源。它也在考慮在引擎蓋下透露更多信息。他承認在透明度和競爭風險之間取得平衡的挑戰(zhàn),但指出OpenAI正在積極探索在不損害其競爭優(yōu)勢的情況下加強披露的方法。
OpenAI可能正在考慮一種更開源的方法,但這可能不會很快發(fā)生。該公司指控DeepSeek非法使用其人工智能模型,然而,Altman表示,該公司“沒有計劃起訴DeepSeek。”有趣的是,OpenAI本身也面臨著十幾起非法使用受版權(quán)保護的互聯(lián)網(wǎng)數(shù)據(jù)來訓練其模型的訴訟。OpenAI似乎擔心他們的模型被復制的可能性,開源確實可以使復制更容易。OpenAI是否愿意承擔這種風險還有待觀察。































