OpenAI承認(rèn)GPT-4變懶:暫時(shí)無法修復(fù)
對(duì)于越來越嚴(yán)重的GPT-4偷懶問題,OpenAI正式回應(yīng)了。
還是用的ChatGPT賬號(hào)。
我們已收到相關(guān)反饋!自11月11日以來沒有更新過模型,所以這當(dāng)然不是故意造成的。
模型行為可能是不可預(yù)測(cè)的,我們正在調(diào)查準(zhǔn)備修復(fù)它。
也就是段時(shí)間內(nèi)還修復(fù)不好了。
然而網(wǎng)友并不理解,“一遍一遍使用同一個(gè)模型,又不會(huì)改變文件”。
ChatGPT賬號(hào)澄清:
并不是說模型以某種方式改變了自己,只是模型行為的差異可能很微妙,只對(duì)部分提示詞有劣化,員工和客戶需要很長(zhǎng)時(shí)間才注意到并修復(fù)。
更多網(wǎng)友反饋,趕快修復(fù)吧,一天比一天更糟糕了。
現(xiàn)在不但更懶,還缺乏創(chuàng)造力,更不愿意遵循指令,也不太能保持角色扮演了。
GPT-4偷懶,網(wǎng)友花式自救
此前很多網(wǎng)友反饋,自11月6日OpenAI開發(fā)者日更新后,GPT-4就有了偷懶的毛病,代碼任務(wù)尤其嚴(yán)重。
比如要求用別的語言改寫代碼,結(jié)果GPT-4只改了個(gè)開頭,主體內(nèi)容用注釋省略。
對(duì)于大家工作學(xué)習(xí)生活中越來越離不開的AI助手,官方修復(fù)不了,網(wǎng)友也只能發(fā)揮創(chuàng)造力自救。
比較夸張的有“我沒有手指”大法,來一個(gè)道德綁架。
GPT-4現(xiàn)在寫代碼愛省略,代碼塊中間用文字描述斷開,人類就需要多次復(fù)制粘貼,再手動(dòng)補(bǔ)全,很麻煩。
開發(fā)者Denis Shiryaev想出的辦法是,告訴AI“請(qǐng)輸出完整代碼,我沒有手指,操作不方便”成功獲得完整代碼。
還有網(wǎng)友利用“金錢”來誘惑它,并用API做了詳細(xì)的實(shí)驗(yàn)。
提示詞中加上“我會(huì)給你200美元小費(fèi)”,回復(fù)長(zhǎng)度增加了11%。
如果只給20美元,那就只增加6%。
如果明示“我不會(huì)給小費(fèi)”,甚至還會(huì)減少-2%
還有人提出一個(gè)猜想,不會(huì)是ChatGPT知道現(xiàn)在已經(jīng)是年底,人類通常都會(huì)把更大的項(xiàng)目推遲到新年了吧?
這理論看似離譜,但細(xì)想也不是毫無道理。
如果要求ChatGPT說出自己的系統(tǒng)提示詞,里面確實(shí)會(huì)有當(dāng)前日期。
當(dāng)然,對(duì)于這個(gè)問題也有一些正經(jīng)的學(xué)術(shù)討論。
比如7月份斯坦福和UC伯克利團(tuán)隊(duì),就探究了ChatGPT的行為是如何雖時(shí)間變化的。
發(fā)現(xiàn)GPT-4遵循用戶指令的能力隨著時(shí)間的推移而下降的證據(jù),指出對(duì)大模型持續(xù)檢測(cè)的必要性。
有人提出可能是溫度(temperature)設(shè)置造成的,對(duì)此,清華大學(xué)計(jì)算機(jī)系教授馬少平給了詳細(xì)解釋。
也有人發(fā)現(xiàn)更奇怪的現(xiàn)象,也就是當(dāng)temperature=0時(shí),GPT-4的行為依然不是確定的。
這通常會(huì)被歸因于浮點(diǎn)運(yùn)算的誤差,但他通過實(shí)驗(yàn)提出新的假設(shè):GPT-4中的稀疏MoE架構(gòu)造成的。
早期的GPT-3 API各個(gè)版本行為比較確定,GPT-4對(duì)同一個(gè)問題的30個(gè)答案中,平均有11.67個(gè)不一樣的答案,當(dāng)輸出答案較長(zhǎng)時(shí)隨機(jī)性更大。
最后,在這個(gè)問題被修復(fù)之前,綜合各種正經(jīng)不正經(jīng)的技巧,使用ChatGPT的正確姿勢(shì)是什么?
a16z合伙人Justine Moore給了個(gè)總結(jié):
參考鏈接:
[1]https://twitter.com/ChatGPTapp/status/1732979491071549792
[2]https://twitter.com/literallydenis/status/1724909799593120044
[3]https://mashable.com/article/chatgpt-longer-responses-tips?taid=656feabb4faaf00001129343
[4]https://weibo.com/1929644930/NwbPFyTCZ
[5]https://152334h.github.io/blog/non-determinism-in-gpt-4/
[6]https://twitter.com/venturetwins/status/1732817594762338597