偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

大模型靠“深呼吸”數(shù)學(xué)再漲8分!谷歌DeepMind發(fā)現(xiàn)AI自己設(shè)計提示詞效果勝人類

人工智能 新聞
優(yōu)化問題無處不在,基于導(dǎo)數(shù)和梯度的算法是強(qiáng)大的工具,但現(xiàn)實應(yīng)用中也經(jīng)常遇到梯度不適用的情況。

提示詞中加上“深呼吸”,AI大模型數(shù)學(xué)成績就能再漲8.4分!

谷歌DeepMind團(tuán)隊最新發(fā)現(xiàn),用這個新“咒語”(Take a deep breath)結(jié)合大家已經(jīng)熟悉的“一步一步地想”(Let’s think step by step),大模型在GSM8K數(shù)據(jù)集上的成績就從71.8提高到80.2分。

而且這個最有效的提示詞,是AI自己找出來的

圖片

有網(wǎng)友開玩笑說,深呼吸以后,散熱風(fēng)扇就轉(zhuǎn)速就提高了。

圖片

也有人表示,剛高薪入職的提示工程師們也應(yīng)該深呼吸,工作可能干不久了

圖片

相關(guān)論文《大語言模型是優(yōu)化器》,再次引起轟動。

圖片

具體來說,大模型自己設(shè)計的提示詞在Big-Bench Hard數(shù)據(jù)集上最高提升50%。

圖片

也有人的關(guān)注點在“不同模型的最佳提示詞不一樣”。

圖片

并且不止提示詞設(shè)計這一個任務(wù),在論文中還測試了大模型在線性回歸和旅行商問題這些經(jīng)典優(yōu)化任務(wù)上的能力。

模型不同,最佳提示詞也不同

優(yōu)化問題無處不在,基于導(dǎo)數(shù)和梯度的算法是強(qiáng)大的工具,但現(xiàn)實應(yīng)用中也經(jīng)常遇到梯度不適用的情況。

為解決這個問題,團(tuán)隊開發(fā)了新方法OPRO,也就是通過提示詞優(yōu)化(Optimization by PROmpting)。

不是形式化定義優(yōu)化問題然后用程序求解,而是用自然語言描述優(yōu)化問題,并要求大模型生成新的解決方案。

一圖流總結(jié),就是對大模型的一種遞歸調(diào)用。

圖片

每一步優(yōu)化中,以之前生成的解決方案和評分作為輸入,大模型生成新的方案并評分,再將其添加到提示詞中,供下一步優(yōu)化使用。

圖片

論文主要使用谷歌的PaLM 2和Bard中的text-bison版本作為評測模型。

再加上GPT-3.5和GPT-4,共4種模型作為優(yōu)化器。

結(jié)果表明,不光不同模型設(shè)計出的提示詞風(fēng)格不同,適用的提示詞風(fēng)格也不同。

此前在GPT系列上的AI設(shè)計出的最優(yōu)提示詞是“Let’s work this out in a step by step way to be sure we have the right answer.”

這個提示詞使用APE方法設(shè)計,論文發(fā)表在ICLR 2023上,在GPT-3(text-davinci-002)上超過人類設(shè)計的版本“Let’s think step by step”。

圖片

但這次在谷歌系PaLM 2和Bard上,APE版本作為基線就還不如人類版本。

圖片

OPRO方法設(shè)計出來的新提示詞中,深呼吸”“拆解這個問題”對PaLM來說效果最好。

對text-bison版的Bard大模型來說,則更傾向于詳細(xì)的提示詞。

圖片

另外論文還展示了大模型在數(shù)學(xué)優(yōu)化器上的潛力。

線性回歸作為連續(xù)優(yōu)化問題的示例。

圖片

旅行商問題作為離散優(yōu)化問題的示例。

圖片

僅僅通過提示,大模型就能找到不錯的解決方案,有時甚至匹敵或超過手動設(shè)計的啟發(fā)式算法。

但團(tuán)隊也認(rèn)為大模型還無法替代傳統(tǒng)基于梯度的優(yōu)化算法,當(dāng)問題規(guī)模較大(如節(jié)點數(shù)量較多的旅行商問題)時,OPRO方法表現(xiàn)就不好。

對于未來改進(jìn)方向,團(tuán)隊提出當(dāng)前大模型還無法有效利錯誤案例,僅提供錯誤案例無法讓大模型捕捉捕捉到錯誤的原因。

一個有前景的方向是結(jié)合關(guān)于錯誤案例的更豐富的反饋,并總結(jié)優(yōu)化軌跡中高質(zhì)量和低質(zhì)量生成提示的關(guān)鍵特征差異。

這些信息可能幫助優(yōu)化器模型更高效地改進(jìn)過去生成的提示,并可能進(jìn)一步減少提示優(yōu)化所需的樣本數(shù)量。

論文放出大量最優(yōu)提示詞

論文來自谷歌與DeepMind合并后的部門,但作者以原谷歌大腦團(tuán)隊為主,包括Quoc Le周登勇

共同一作為康奈爾大學(xué)博士畢業(yè)的復(fù)旦校友Chengrun Yang,和UC伯克利博士畢業(yè)的上交大校友陳昕昀

團(tuán)隊還在論文中給出了大量實驗中得到的最優(yōu)提示詞,包括電影推薦、惡搞電影名字等實用場景,有需要的小伙伴可自取。

圖片

論文地址:https://arxiv.org/abs/2309.03409

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-09-10 10:43:11

AI模型

2020-08-26 10:25:16

智慧

2016-12-02 20:10:22

人工智能唇語序列

2024-12-02 12:30:44

2023-09-05 19:43:05

模型RLHFAI

2024-04-01 07:00:00

模型AI

2024-04-10 10:28:47

2024-06-17 07:46:01

2024-03-29 13:55:05

AI模型

2023-12-16 09:20:14

數(shù)據(jù)模型

2025-05-29 10:32:32

2024-06-03 06:49:53

2024-11-26 11:44:04

大模型GPT提示詞

2023-09-06 13:17:00

AI數(shù)據(jù)

2022-12-02 15:25:03

2024-11-04 15:54:16

2023-02-27 09:48:30

谷歌模型

2023-12-17 19:38:37

谷歌AI 模型人工智能

2024-11-08 12:18:39

SynthID谷歌AI

2024-12-05 12:26:53

點贊
收藏

51CTO技術(shù)棧公眾號