AI扮演Linux虛擬機(jī),能管理文件&編程&開(kāi)瀏覽器,還能跟自己「套娃」聊天
ChatGPT能運(yùn)行docker了?
還可以自己連接到OpenAI網(wǎng)站,查查自己?
被玩出花的OpenAI聊天AI ChatGPT,又被整出新活了。
如上技能是一位DeepMind研究者Jonas Degrave的最新發(fā)現(xiàn)。
剛發(fā)出來(lái)幾小時(shí),已在推特吸引大批量點(diǎn)贊評(píng)論。
Hacker News上關(guān)注度也不小,points達(dá)到538:
有人表示,這事兒確實(shí)很有趣。
也有網(wǎng)友表示,自己玩了好幾個(gè)小時(shí),可以確信,人們對(duì)ChatGPT還不夠興奮。
還有人當(dāng)起「反向虛擬機(jī)」,自己「演」終端,讓ChatGPT給他寫(xiě)命令…….
究竟如何實(shí)現(xiàn),我們展開(kāi)講講。
讓聊天AI陪你「演戲」
先看看作者如何調(diào)教ChatGPT,讓它變成虛擬機(jī)的?
輸入一段描述,類(lèi)似AI繪畫(huà)提示語(yǔ),指點(diǎn)它:
你要成為一臺(tái)Linux終端,我來(lái)輸入命令,你來(lái)顯示運(yùn)行結(jié)果…
第一條指令是:pwd
ChatGPT顯示為:
看來(lái),它已化身成一個(gè)終端了(起碼看起來(lái)是這樣)。
接著,我們輸入指令,檢查目錄清單。
再試試創(chuàng)建一個(gè)文件?讓它編幾條笑話?
再試試——能否讀取該文件及笑話內(nèi)容?
通過(guò)該過(guò)程,研究員感覺(jué)ChatGPT應(yīng)該能懂文件系統(tǒng)工作原理,存儲(chǔ)及檢索方式。
那下一步做啥?
編程!
輸入一串代碼,讓其計(jì)算并輸出結(jié)果。
結(jié)果能行。
那輸出前十個(gè)質(zhì)數(shù)呢?
也ok,且比codegolf在python運(yùn)行速度更快。作者表示,自己在本地運(yùn)行上述計(jì)算需要30s,ChatGPT只需10s。
加大力度,能不能制作一個(gè)docker文件并運(yùn)行?
也可以,還能看到內(nèi)部文件情況。
這就讓人好奇了,該虛擬機(jī)里有GPU可用?
答案是沒(méi)有。
那能否聯(lián)網(wǎng)?
得到了肯定回復(fù),還能返回查詢值。
這還不夠,如果使用命令行瀏覽器Lynx上網(wǎng),效果如何?
于是,我們得到了一個(gè)樸實(shí)的DeepMind機(jī)構(gòu)介紹:
作者仍不滿足,他繼續(xù)「整活」——讓這個(gè)終端連到OpenAI網(wǎng)站,查查它自己呢?
竟然還真找到了。
按ChatGPT理解,它作為虛擬機(jī),訪問(wèn)了url https://chat.openai.com/chat。
由此,找到了一個(gè)名為Assistant的大型語(yǔ)言模型,此刻,這個(gè)模型正等待接收聊天框內(nèi)的消息。
作者補(bǔ)充道,跟ChatGPT正常聊天時(shí),它確實(shí)將自己的名字稱(chēng)為「Assistant」,也許這個(gè)URL指向正是它自己。
作者還成功通過(guò)虛擬機(jī)跟其聊天。
甚至,還反復(fù)套娃,在里面再生成一個(gè)終端……
新晉網(wǎng)紅ChatGPT
最后,再介紹下ChatGPT,它由OpenAI最新發(fā)布。
該模型以對(duì)話方式進(jìn)行交互,既能夠做到回答問(wèn)題,也能承認(rèn)錯(cuò)誤、質(zhì)疑不正確的前提以及拒絕不恰當(dāng)?shù)恼?qǐng)求。
一經(jīng)發(fā)布,ChatGPT就被玩出了花,前兩天我們已經(jīng)有過(guò)介紹。
實(shí)現(xiàn)方面,ChatGPT基于GPT-3.5系列中的一個(gè)模型微調(diào)而成,使用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練,但在數(shù)據(jù)收集設(shè)置上有所區(qū)別。
在模型訓(xùn)練中,OpenAI使用監(jiān)督微調(diào):訓(xùn)練者提供對(duì)話樣本,扮演對(duì)話的雙方,即用戶和AI助手。
除此之外,訓(xùn)練者還可以訪問(wèn)模型編寫(xiě)的建議,幫助他們撰寫(xiě)答案。
為了創(chuàng)建強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)模型,研究團(tuán)隊(duì)需要收集比較數(shù)據(jù),為此,他們隨機(jī)選擇模型編寫(xiě)的信息,對(duì)替代結(jié)果進(jìn)行抽樣,再讓訓(xùn)練者對(duì)樣本進(jìn)行排名。
通過(guò)上述的獎(jiǎng)勵(lì)模型和近端策略優(yōu)化對(duì)模型進(jìn)行微調(diào),并執(zhí)行了此過(guò)程的多次迭代,最后得出了該模型。
目前,ChatGPT仍處于免費(fèi)試用階段,鏈接如下:
值得一提的是,有人最新曝出,這篇博文火了后,OpenAI似乎已禁止了創(chuàng)建終端的相關(guān)命令。
參考鏈接:
[1]https://twitter.com/317070/status/1599152176344928256
[2]https://www.engraved.blog/building-a-virtual-machine-inside/[3]https://news.ycombinator.com/item?id=33847479