偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

首個(gè)獲得駕照的AI!Agent擔(dān)任私人助理樣樣精通,還能幫助考試作弊

人工智能
最近,Jim Fan轉(zhuǎn)發(fā)了斯坦福博士生開發(fā)的一款A(yù)I Agent,它在美國加州的駕照考試現(xiàn)場獨(dú)立通過了考試。AI一小步,人類一大步,我們一起來看一下吧。

關(guān)于當(dāng)前基于Transformer的LLM能走多遠(yuǎn)的問題,人們?nèi)栽跔幷摬恍荨?/span>

與此同時(shí),另一邊,能夠幫助人們處理各項(xiàng)工作的AI Agent已經(jīng)悄然走入人們的生活。

以前的ChatGPT等大模型,熱衷于在人類考試中刷分以凸顯自己的實(shí)力,而不久前,又有一位AI Agent通過了美國加州的駕照考試。

——但與之前不同的是,這次的AI Agent是在監(jiān)考員的眼皮底下幫助人類成功作弊,通過考試!

圖片圖片

對(duì)此,AI Agent的作者表示,「很高興與大家分享一項(xiàng)不朽的成就,我們的 Web AI 代理剛剛通過在線加州駕駛考試創(chuàng)造了歷史,成為第一個(gè)在加州獲得駕駛執(zhí)照的虛擬 AI!」

「這標(biāo)志著一個(gè)開創(chuàng)性的時(shí)刻:人工智能首次完全自主地完成現(xiàn)實(shí)世界的人類知識(shí)任務(wù),這是人工智能的一小步,也是人類的一大步?!?/span>

雖然多少有點(diǎn)夸張,但不得不說,還是挺神奇的。

圖片圖片

從圖中我們可以看到,AI Agent完全靠自己審題、作答、并點(diǎn)擊下一道題。

對(duì)于這樣成功的表現(xiàn),Jim Fan也是表達(dá)了祝賀:

圖片圖片

從去年開始,一些加州居民可以在網(wǎng)上參加駕駛考試的筆試部分,免去了他們需要花時(shí)間去考試機(jī)構(gòu)所在地的麻煩。

為了防止作弊,官方采取了一些相應(yīng)的措施,要求考生必須允許機(jī)動(dòng)車輛管理局(DMV)訪問電腦的攝像頭,以記錄考試過程;并在考試期間共享屏幕。

——這樣參加考試的人就無法在考試中途打小抄了。

然而,還是有人在監(jiān)考員的眼皮底下作弊成功,而助手正是我們前面介紹的AI Agent(到底誰是助手也不好說)。

圖片圖片

這個(gè)AI Agent來自一家名為 MultiOn 的初創(chuàng)公司,由 Div Garg 創(chuàng)立。

Div Garg是斯坦福大學(xué)的博士輟學(xué)生,他最初創(chuàng)辦 MultiOn 是為了實(shí)現(xiàn)日常任務(wù)的自動(dòng)化,比如從亞馬遜訂購廁紙或安排日歷約會(huì)。

MultiOn 的產(chǎn)品可以控制用戶的瀏覽器,完成諸如在 Uber Eats 上訂餐或進(jìn)行 Resy 預(yù)訂等任務(wù)。

——需要注意的是,這并不是我們平時(shí)會(huì)見到的瀏覽器腳本,Agent背后依托的是AI的能力。

圖片圖片

這項(xiàng)服務(wù)目前是免費(fèi)的,AI Agent位于瀏覽器的右下角,你可以在這里輸入命令,這與微軟的必應(yīng) ChatGPT 助手完全不同。

這個(gè)AI Agent可以作為用戶的私人助理,它提供的大部分功能都很有用,即使不能完全改變生活。

上個(gè)月在舊金山的一家咖啡館演示 MultiOn 時(shí),Garg 用它向 Facebook 上的熟人群發(fā)了「生日快樂」信息。

隨后又利用 MultiOn 安排了與記者的下一次會(huì)面,目的正是向大眾演示如何利用AI Agent通過車管局的正式駕駛考試。

雖然看上去只不過是AI答對(duì)了一些問題,但實(shí)際上要達(dá)成這個(gè)目的并不簡單。

一般來說,AI需要一段長長的提示,才能選擇正確答案,然后點(diǎn)擊進(jìn)入下一個(gè)問題,而且AI不能有多余的動(dòng)作,以免被發(fā)現(xiàn)作弊。

平心而論,目前的這個(gè)AI Agent仍然需要人的手指隨時(shí)待命,以防出錯(cuò)。根據(jù)設(shè)置,MultiOn 在出錯(cuò)時(shí)會(huì)停止運(yùn)行,這時(shí)就需要人類測試者自己按下「繼續(xù)」按鈕。

另外,它也無法解析圖像,所以如果遇到了要求識(shí)別交通標(biāo)志的問題,都會(huì)回答錯(cuò)誤。

當(dāng)前的AI雖然擁有完善的知識(shí),但通常需要嚴(yán)格的提示才能進(jìn)行下一步。所以,對(duì)于這場考試來說,答對(duì)有關(guān)正確駕駛規(guī)范的難題是一方面,點(diǎn)擊按鈕進(jìn)入下一個(gè)問題更體現(xiàn)出它的能力。

Garg認(rèn)為這依靠了很多運(yùn)氣。這是 MultiOn 第一次參加正式的州立考,最終,MultiOn 在 46 道題中只錯(cuò)了五六道,正式達(dá)到了通過標(biāo)準(zhǔn)。

當(dāng)然,根據(jù)加州法律,以這種方式使用該技術(shù)可能構(gòu)成偽證罪。因?yàn)樵诳荚囍皶?huì)要求考生聲明自己將親自作答。

加利福尼亞州車管局曾在一份聲明中寫道:「作為一項(xiàng)防欺詐措施,在線考試參與者必須驗(yàn)證自己的身份,并同意在整個(gè)考試過程中接受監(jiān)控。隨著技術(shù)的發(fā)展,DMV 將繼續(xù)更新保障措施」。

人工智能助手的未來

MultiOn在通過DMV考試之前,就已經(jīng)引起了OpenAI及其首席執(zhí)行官Sam Altman的注意,Garg 表示正在與OpenAI密切合作。

但就目前而言,MultiOn對(duì)部署采取了謹(jǐn)慎的態(tài)度,這次成功的測試與其說是一項(xiàng)關(guān)鍵功能,不如說是一個(gè)概念驗(yàn)證。

Garg希望確保對(duì)自己產(chǎn)品的控制,從而避免出現(xiàn)惡意使用的情況。他希望人們不要在各種考試中作弊,因此他計(jì)劃對(duì)普通用戶禁用任何類似的「灰色地帶」功能。

與主要存在于 ChatGPT 沙盒中的 OpenAI GPT 助手不同,MultiOn 助手是作為谷歌 Chrome 瀏覽器的擴(kuò)展程序自主運(yùn)行的。用戶必須授予它有效控制電腦的權(quán)限。

「我們的技術(shù)直接在用戶的電腦上運(yùn)行,它實(shí)際上是在控制,在做事,很多事情都可能出錯(cuò)」。

目前,大約有 3 萬人注冊試用了該應(yīng)用的測試版。Garg預(yù)計(jì) MultiOn 還會(huì)有更多新功能,比如加強(qiáng)版移動(dòng)語音助手和內(nèi)置 MultiOn 技術(shù)的瀏覽器。

——不過,利用它在 SAT 或 ACT 等考試中作弊的可能性也不大,因?yàn)檫@兩個(gè)考試機(jī)構(gòu)都要求學(xué)生到考試中心參加考試。

MultiOn的官網(wǎng)上還向我們展示了產(chǎn)品的一些基本而有趣的用途,比如查詢天氣:

圖片圖片

更實(shí)用一點(diǎn)的是下面這個(gè)例子,用戶可以直接告訴Agent幫忙訂一個(gè)漢堡,后面的所有事情都完全不用操心了。

圖片圖片

包括選擇店鋪、選擇商品、下訂單和支付等等,Agent一條龍服務(wù),統(tǒng)統(tǒng)幫你搞定——確實(shí)稱得上是私人助理了。

除了這個(gè)演示,官網(wǎng)還列出了其他的一些功能:

圖片圖片

圖片圖片

圖片圖片

圖片圖片

比如線上購物、文章摘要、查找并播放音樂和視頻、在線互動(dòng)等。

有網(wǎng)友使用MultiOn在亞馬遜買了一本書,并表示「太瘋狂了」。

圖片圖片

圖片圖片

而另一位網(wǎng)友使用MultiOn自動(dòng)搜索并播放想要的視頻,還自動(dòng)進(jìn)行了評(píng)論:

圖片圖片

有了這次成功的駕照考試經(jīng)歷,Garg也是野心勃勃地表示,「明年我們的AI Agent就可以駕駛你的特斯拉了」!

圖片圖片

不知道大家對(duì)于未來的AI Agent又抱有怎樣的幻想呢?

參考資料:

https://twitter.com/DivGarg9/status/1728854189873549809

https://sfstandard.com/2023/11/14/multion-ai-assistant-california-driving-test/


責(zé)任編輯:武曉燕 來源: 新智元
相關(guān)推薦

2024-07-12 12:59:10

2021-05-10 15:03:35

無人機(jī)火災(zāi)技術(shù)

2025-07-28 08:52:00

AI模型訓(xùn)練

2025-07-18 07:46:17

2022-08-23 14:04:20

代碼人工智能

2023-06-13 13:53:00

GPT-4識(shí)圖微軟

2024-09-29 10:15:00

2019-06-27 14:00:13

edoraMycroft開源

2022-09-20 07:03:23

黑客安全碰撞測試

2018-05-02 11:18:01

2024-04-15 08:20:00

機(jī)器人技能

2018-01-18 09:55:32

AI 大事件

2025-09-05 09:05:00

AI模型訓(xùn)練

2017-08-21 16:41:29

開發(fā)者故事

2011-07-09 15:34:24

復(fù)合一體機(jī)用戶體驗(yàn)

2025-03-27 10:04:36

阿里云通義千問多模態(tài)

2009-04-07 12:40:59

技術(shù)IT就業(yè)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)