偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

斯坦福大學(xué)研究發(fā)現(xiàn),AI 聊天機器人 ChatGPT 的表現(xiàn)很不穩(wěn)定

人工智能
斯坦福大學(xué)的一項新研究發(fā)現(xiàn),熱門生成式人工智能(AI)聊天機器人 ChatGPT 的能力在幾個月內(nèi)有所波動。

9 月 7 日消息,斯坦福大學(xué)的一項新研究發(fā)現(xiàn),熱門生成式人工智能(AI)聊天機器人 ChatGPT 的能力在幾個月內(nèi)有所波動。

斯坦福大學(xué)的團隊評估了 ChatGPT 在幾個月內(nèi)如何處理不同的任務(wù)。他們發(fā)現(xiàn),ChatGPT 的能力隨時間的推移而出現(xiàn)了不一致。目前,ChatGPT 有兩個版本 —— 免費的 GPT-3.5 模型和更智能、更快速的付費 GPT-4 版本。 研究人員發(fā)現(xiàn),GPT-4 在 3 月份能夠有效地解決數(shù)學(xué)問題,識別質(zhì)數(shù)的準(zhǔn)確率為 97.6%。三個月后,其準(zhǔn)確率下降到了 2.4%。而另一方面,GPT-3.5 卻變得更好,從 7.4% 的準(zhǔn)確率提高到了 86.8%。

研究人員還注意到,在編寫代碼和視覺推理方面也有類似的波動。斯坦福大學(xué)計算機科學(xué)教授 James Zou 稱:“當(dāng)我們調(diào)整一個大型語言模型來提高它在某些任務(wù)上的表現(xiàn)時,那可能會有很多意想不到的后果,可能會損害這個模型在其他任務(wù)上的表現(xiàn)…… 這個模型回答問題的方式有各種各樣的相互依賴性,這可能導(dǎo)致我們觀察到的一些惡化行為?!?/p>

研究人員認(rèn)為,結(jié)果并不能真正反映 ChatGPT 性能的準(zhǔn)確性狀態(tài),而是顯示了微調(diào)模型帶來的意外后果。本質(zhì)上,當(dāng)修改模型的一部分來改善一個任務(wù)時,其他任務(wù)可能會受到影響。為什么會這樣很難確定,因為沒有人知道 ChatGPT 是如何運作的,而且它的代碼也不是開源的。

隨著時間的推移,研究人員注意到,ChatGPT 的回答不僅變得不太準(zhǔn)確,而且還停止了解釋其推理過程。

由于 ChatGPT 的運作方式,要研究和衡量它的表現(xiàn)可能很困難,這項研究強調(diào)了觀察和評估驅(qū)動 ChatGPT 等工具的大型語言模型(LLM)性能變化的必要性。該研究已經(jīng)在 arXiv 上發(fā)布,并正在等待同行評審,IT之家附鏈接在此。

責(zé)任編輯:龐桂玉 來源: IT之家
相關(guān)推薦

2020-07-08 16:46:46

人工智能病毒技術(shù)

2018-01-22 16:16:28

AI發(fā)展新趨勢機器學(xué)習(xí)

2022-10-13 16:01:38

技術(shù)大腦

2023-05-22 07:02:50

電子皮膚機器人

2023-04-12 15:45:56

人工智能ChatGPT

2025-08-28 09:00:00

機器人訓(xùn)練算法

2023-06-11 16:13:19

機器人ChatGPT人工智能

2023-02-15 14:33:26

2025-09-19 14:46:03

2023-06-29 15:04:21

微軟ChatGPT

2011-11-17 09:53:18

斯坦福大學(xué)iOS應(yīng)用開發(fā)

2021-03-18 11:30:15

人工智能AI機器學(xué)習(xí)

2024-12-03 10:30:00

AI模型

2009-05-07 08:49:11

鮑爾默斯坦福大學(xué)巴茨

2022-07-05 06:42:01

聊天機器人人工智能

2019-03-20 14:02:13

AI 行業(yè) 人工智能

2023-12-27 14:07:00

模型訓(xùn)練

2023-03-21 23:50:16

人工智能機器人ChatGPT

2023-10-13 09:00:00

點贊
收藏

51CTO技術(shù)棧公眾號