ChatGPT越來(lái)越懶,都學(xué)會(huì)反過(guò)來(lái)PUA人類了
不知你有沒(méi)有注意到,最近一段時(shí)間,GPT-4 變得有些「懶惰」,現(xiàn)在的它,老是拒絕執(zhí)行某些任務(wù)或直接返回簡(jiǎn)化的結(jié)果。
這個(gè)問(wèn)題得到很多網(wǎng)友的共鳴,紛紛開(kāi)始抱怨 ChatGPT 變「懶惰」這個(gè)事實(shí)。
用戶聲稱,最近使用 GPT-4 或 ChatGPT API 時(shí),在高峰時(shí)段響應(yīng)變得非常緩慢且敷衍。在某些情況下,它會(huì)拒絕回答,而在另一些情況下,如果出現(xiàn)一系列問(wèn)題,對(duì)話就會(huì)中斷。
據(jù)報(bào)道,如果用戶請(qǐng)求 GPT-4 寫(xiě)一段代碼,會(huì)出現(xiàn)上述問(wèn)題。它可能只提供一些信息,然后指導(dǎo)用戶填寫(xiě)其余部分。有時(shí), GPT-4 會(huì)告訴人們「你可以自己做這件事 」。
GPT-4變「懶惰」一些示例展示
「GPT 確實(shí)變得更加抗拒做乏味的工作。本質(zhì)上是給你部分答案,然后告訴你做剩下的事情。不敢想象,當(dāng)你運(yùn)行查詢時(shí),你的數(shù)據(jù)庫(kù)只讀取了前 10 行的信息?!箤W⒂阡N售和營(yíng)銷的 Summit 創(chuàng)始人 Matthew Wensing 抱怨道。
「讓它擴(kuò)展一些代碼,生成的代碼要求達(dá)到 50 行,它讓我自己去做?!?/span>
有時(shí) ChatGPT 受夠了網(wǎng)友的請(qǐng)求,最后直接來(lái)了個(gè)「白眼」,讓你自己體會(huì)。
「現(xiàn)在的 ChatGPT 無(wú)法幫助用戶處理代碼腳本?!?/span>
沃頓商學(xué)院 Ethan Mollick 教授將 GPT-4 在 7 月和現(xiàn)在的表現(xiàn)進(jìn)行了對(duì)比,他得出的結(jié)論是:GPT-4 仍然是知識(shí)淵博的,但也存在懶惰這個(gè)問(wèn)題,GPT-4 非常樂(lè)意向用戶解釋如何修復(fù)代碼,而不是實(shí)際修復(fù)代碼。
隨后, Mollick 教授表示,「同樣,我們沒(méi)有證據(jù)表明 GPT-4 以任何方式變得更加愚蠢,這可能是系統(tǒng)負(fù)載的暫時(shí)問(wèn)題(例如 openAI 現(xiàn)在將 DALL-E 3 的圖片響應(yīng)從 4 張減少到 1 張),但在以下方面 GPT-4 肯定存在行為變化:系統(tǒng)在沒(méi)有刺激的情況下愿意做多少事情。」
不僅 X,Reddit 上也到處是討論的帖子,最近一則名為《ChatGPT 已經(jīng)變得非常懶惰》的帖子爆火。一位用戶寫(xiě)道,他們要求 ChatGPT 填寫(xiě)一個(gè)包含多個(gè)條目的 CSV 文件,但 ChatGPT 拒絕了,并回答道:「由于數(shù)據(jù)的廣泛性,完整提取整個(gè)產(chǎn)品相當(dāng)冗長(zhǎng)。但是,我可以提供包含此單個(gè)條目作為模板的文件,您可以根據(jù)需要填寫(xiě)其余數(shù)據(jù)。」
對(duì)于這一回答,發(fā)帖人直接發(fā)飆了:「這就是人工智能應(yīng)該有的樣子嗎?一個(gè)專橫的懶惰機(jī)器人,讓我自己去做?」
鑒于 ChatGPT 現(xiàn)在的表現(xiàn),網(wǎng)友開(kāi)始紛紛懷念以前的 GPT-4 了。
OpenAI 承認(rèn)了,但不確定是什么原因造成的
有些人開(kāi)始猜測(cè)是因?yàn)?OpenAI 合并模型、同時(shí)運(yùn)行 GPT-4 和 GPT-4 Turbo 導(dǎo)致服務(wù)器持續(xù)過(guò)載、公司試圖通過(guò)限制結(jié)果來(lái)節(jié)省資金等造成的。
眾所周知,OpenAI 的運(yùn)營(yíng)成本極其昂貴,今年 4 月,研究人員表示,每天需要花費(fèi) 70 萬(wàn)美元,即每次查詢花費(fèi) 36 美分,才能維持 ChatGPT 的運(yùn)行。根據(jù)行業(yè)分析師當(dāng)時(shí)的說(shuō)法,OpenAI 必須將其 GPU 群擴(kuò)大至 30000 臺(tái),才能在今年剩余時(shí)間內(nèi)保持其商業(yè)性能。除了為其所有合作伙伴提供計(jì)算之外,OpenAI 還需要支持 ChatGPT 其他流程。
對(duì)于這個(gè)問(wèn)題,ChatGPT 官方賬戶發(fā)布了推文,OpenAI 承認(rèn)了這個(gè)問(wèn)題,但不確定是什么原因造成的。「我們已收到您關(guān)于 GPT4 變得更加懶惰的所有反饋!自 11 月 11 日以來(lái)我們就沒(méi)有更新過(guò)模型,這當(dāng)然不是故意的。模型行為可能是不可預(yù)測(cè)的,我們正在研究修復(fù)它。」
簡(jiǎn)而言之,OpenAI 表示他們最近沒(méi)有對(duì) ChatGPT 或 GPT-4 進(jìn)行任何會(huì)使其變得更加懶惰的更改。事實(shí)上,自 11 月 11 日以來(lái),沒(méi)有任何變化。但他們解釋說(shuō),模型本身「可能是不可預(yù)測(cè)的」,他們正在尋求解決的問(wèn)題。
12 月初,OpenAI 員工 Will Depue 在 X 中也證實(shí)了,OpenAI 已注意到有關(guān) ChatGPT 變懶惰的報(bào)告,正在研究潛在的修復(fù)方案。
從他的回答中我們可以看出 ChatGPT 確實(shí)存在過(guò)度拒絕用戶問(wèn)題以及其他奇怪的行為(例如最近的懶惰問(wèn)題),但這些都是不斷服務(wù)和嘗試支持眾多用例過(guò)程中的迭代產(chǎn)物。他指出,當(dāng) ChatGPT 的某些部分顯著改進(jìn)時(shí),這些改進(jìn)通常不會(huì)被廣泛注意到。相反,當(dāng)模型的某些部分偶爾出現(xiàn)退化時(shí),這些問(wèn)題就會(huì)變得非常明顯。盡管存在一些問(wèn)題,如過(guò)度拒絕和偶爾的性能退化,但這些都是改進(jìn)過(guò)程中的一部分。OpenAI 鼓勵(lì)提供具體反饋以幫助快速解決這些問(wèn)題。
在等待 GPT-4 性能穩(wěn)定的同時(shí),用戶們互相打趣,「接下來(lái)你就會(huì)知道它會(huì)『請(qǐng)病假』?!?/span>