偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<rp id="wfgyo"><label id="wfgyo"></label></rp>

<ruby id="wfgyo"></ruby>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

ChatGPT只算L1階段，谷歌提出AGI完整路線圖

2023-11-08 15:51:00

按照谷歌這個標準來看，大多數(shù)已有AI產(chǎn)品其實都分別進入了不同的AGI階段，但只僅限于在技能水平上——要談及通用性，目前只有ChatGPT等模型完全合格。

AGI應該如何發(fā)展、最終呈什么樣子？

現(xiàn)在，業(yè)內(nèi)第一個標準率先發(fā)布：

AGI分級框架，來自谷歌DeepMind。

該框架認為，發(fā)展AGI必須遵循6個基本原則：

關注能力，而非過程
同時衡量技能水平和通用性
專注于認知和元認知任務
關注最高潛力，而非實際落地水平
注重生態(tài)有效性
關注整條AGI之路的發(fā)展，而非單一的終點

在此原則之上，AGI將呈現(xiàn)6大發(fā)展階段，每個階段都有對應的深度（性能）和廣度（通用性）指標。

我們當前的AI產(chǎn)品走到哪一階段了？這里也有答案。

詳細來看。

6項基本原則

什么是AGI？

對于這個問題，許多科學家、研究機構(gòu)都給出了自己的理解。

比如圖靈提出的圖靈測試認為機器是否能“思考”就是一個衡量指標；強人工智能的概念提出者則認為，AGI是一個擁有意識的系統(tǒng)；還有人說AGI一定是能在復雜性和速度上與人腦一樣甚至超越人腦……

谷歌認為，這些定義都不全面。

像圖靈測試，一些LLM已經(jīng)可以通過，但我們能稱那些模型為AGI嗎？

像類人腦說法，Transformer架構(gòu)的成功就已表明，嚴格基于大腦的思考過程對于AGI來說并不是必須的。

通過分析這些定義（一共9種，詳情可翻閱原文）的優(yōu)缺點，谷歌重新理出了6項基本原則：

1、關注能力，而非過程

這可以幫助我們?nèi)コ恍┎灰欢ㄊ菍崿F(xiàn)AGI的必備要求：

比如AGI不一定要用類似人類的方式思考或理解，也不意味著系統(tǒng)必須具有主觀意識等能力（主要是這種能力無法也通過固定的方法去測量）。

2、注重通用性和技能水平

目前所有的AGI定義都強調(diào)了通用性，這一點不必多說。但谷歌強調(diào)，性能也是AGI的關鍵組成部分（也就是可以達到人類的幾分水平）。在后面的具體階段制定中，主要也是根據(jù)這倆指標進行分類的。

3、專注于認知和元認知任務

前者目前基本為共識，即AGI可以執(zhí)行各種非體力任務。不過谷歌在此強調(diào)，AI系統(tǒng)執(zhí)行物理任務的能力也需要加強，因為它對于認知能力是有推動作用的。

此外，元認知能力，如學習新任務或知道何時向人類尋求幫助，是系統(tǒng)走向通用性的關鍵先決條件。

4、關注最高潛力，而非實際落地水平

證明一個系統(tǒng)可以在給定的標準上完成任務，就足以宣布該系統(tǒng)為AGI，我們不要求一定得在開放世界中完全部署出水平相同的系統(tǒng)。

因為，這可能會面臨一些非技術阻礙，比如法律和社會考慮、潛在道德問題。

5、注重生態(tài)有效性

所謂生態(tài)有效性，谷歌指的是選擇真正有用的現(xiàn)實任務去benchmark系統(tǒng)的進步，這些任務不僅包括經(jīng)濟價值也包括社會和藝術價值，要避開那些容易自動匹配和量化的傳統(tǒng)AI指標。

6、關注整條AGI之路的發(fā)展，而非單一的終點

這也是為什么谷歌要制定我們接下來將要看到的6個發(fā)展階段。

6大必經(jīng)階段

AGI之路的6個階段由深度指標（即技能水平，與人類相比）和廣度指標（通用性）進行劃分。

第零階段為“No AI”，計算軟件、編譯器等屬于該范疇，在通用性上只能執(zhí)行human-in-the-loop任務。

第一階段為“涌現(xiàn)級”（Emerging），技能相當于或略比沒有相關技能的人類要強。

ChatGPT、Bard和Llama 2等大模型就屬于該階段，并且已經(jīng)滿足了該階段要達到的通用性。

第二階段可理解為“剛剛合格級”（Competent），可以達到正常成年人50%的水平。

像語音助手Sir、能在短文寫作/簡單編碼等任務中達到SOTA水平的大模型都屬于這一階段。

不過，它們都只是在技能指標上合格了，通用性還夠不上，也沒有其它能夠達到這一階段通用性水平的AI產(chǎn)品。

第三階段為“專家級”（Expert），可達到正常成年人90%的水平。

谷歌認為，拼寫和語法檢查器如Grammarly、圖像生成模型Imagen等可以劃為該階段，主要也是在技能水平上達標了，通用性還不夠。

第四階段為“大師級”（Virtuoso），可達到正常人類99%的水平。

深藍、AlphaGo等都屬于。同樣，還沒有哪個AI產(chǎn)品可以達到屬于這一級別的通用能力。

最后一階段為“超人級”（Superhuman），在技能指標上，已經(jīng)可以超越頂尖科學家的AlphaFold、AlphaZero也可劃入該階段。

毫無疑問，具備超人智能級通用性的AI還沒誕生。

從中我們看出，按照谷歌這個標準來看，大多數(shù)已有AI產(chǎn)品其實都分別進入了不同的AGI階段，但只僅限于在技能水平上——要談及通用性，目前只有ChatGPT等模型完全合格。

但它們也只還處于最底層的“一級AGI”階段。

不過，正如原則2所說，評價AGI就是要看這技能水平和通用性這兩個指標，這樣劃分也算說得過去。

值得一提的是，我們可以看到，像DALLE-2這樣的圖像生成模型已經(jīng)可以歸類于“三級AGI”。

谷歌給出的理由是，因為它生成的圖像已經(jīng)比大多數(shù)人都要強了（也就是超越90%人類）。

這一劃分并未考慮大多數(shù)用戶由于提示技巧不佳，無法達成最佳性能的情況。

因為遵循原則4，我們只需要關注一個系統(tǒng)的潛力到了就夠了。

另外，對于最終階段的AGI，谷歌暢想，它除了蛋白質(zhì)結(jié)構(gòu)預測，還可能能同時進行與動物交流、分析大腦信號、進行高質(zhì)量預測等各種人類難以企及的任務，這樣才不枉費我們的期待。

最后，對于這個層級劃分，谷歌也承認還有很多事情要做：

比如在通用性維度上，應該用哪些標準任務集進行測量？完成多大比例的任務才行？有哪些任務是一定要滿足的？

這些問題一時都不大可能全部摸清。

你同意谷歌提出的這些原則和階段劃分嗎？

原文：
https://arxiv.org/abs/2311.02462。

責任編輯：姜華來源：量子位

AGI 人工智能

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<blockquote id="efi6y"></blockquote>

<blockquote id="efi6y"></blockquote>