提示工程——Prompt在AGI系統(tǒng)中的旅程
在AGI系統(tǒng)中,Prompt(提示詞)作為AI系統(tǒng)的輸入具有重要意義。理解Prompt的生命周期和性質(zhì)對于有效地利用AI十分重要。因此就形成了提示工程,提示工程致力于制作和管理提示以便于利用AI大模型的能力。這種方法既要在技術(shù)層面,還要在基本的道德倫理方面對提示詞進(jìn)行管理,以確保人工智能的運(yùn)作符合需求并且透明、公平、沒有偏見。
本文通過生成式AI的應(yīng)用開發(fā)、實(shí)施和改進(jìn)的幾個(gè)階段,結(jié)合一個(gè)關(guān)于教育領(lǐng)域的例子,介紹提示詞的生命周期。
1.生命周期
提示的過程包括幾個(gè)相關(guān)的階段:
- 設(shè)計(jì):識別AI的預(yù)期輸出需求。確認(rèn)AI應(yīng)該執(zhí)行什么任務(wù)?我們需要它提供什么樣子的應(yīng)答?有了明確的目標(biāo),初始的提示詞的設(shè)計(jì)便來自于這些需求。
- 實(shí)施:將提示詞輸入到AI模型中。這個(gè)階段作為測試階段,我們觀察模型的響應(yīng)并將其與預(yù)期結(jié)果進(jìn)行比較。
- 評估:實(shí)施之后是評估階段,觀察人工智能的反應(yīng),并進(jìn)行嚴(yán)格評估,以確定它是否實(shí)現(xiàn)了預(yù)期的目標(biāo)。如果沒有,下一步就是了解原因。
- 細(xì)化:基于評估,需要對提示詞進(jìn)行細(xì)化以便改進(jìn)AI的輸出??赡苄枰魬?zhàn)提示詞,增加特異性、調(diào)整措辭或添加更多上下文。
- 迭代:再次實(shí)施優(yōu)化后的提示詞,并評估其結(jié)果。這個(gè)實(shí)施、評估和細(xì)化的過程被迭代地重復(fù),直到提示產(chǎn)生令人滿意的輸出。
- 驗(yàn)證:在不同的上下文或數(shù)據(jù)集上驗(yàn)證提示,以確保其可靠性和魯棒性。
- 部署:驗(yàn)證之后,提示詞將集成到生產(chǎn)環(huán)境中,準(zhǔn)備與最終用戶交互。
- 維護(hù):即使在部署之后,也必須持續(xù)監(jiān)視提示符的性能。如果它的性能下降或出現(xiàn)新的需求,提示詞可能需要重新評估,又開始重新進(jìn)入生命周期。
2.倫理道德
在整個(gè)生命周期中,納入倫理考慮因素至關(guān)重要,需要在生命周期中的每個(gè)階段確認(rèn)公平、公正、合法且符合倫理道德:
- 設(shè)計(jì)和實(shí)施:提示應(yīng)旨在鼓勵(lì)尊重用戶隱私并遵守道德準(zhǔn)則的人工智能行為。
- 評估和細(xì)化:監(jiān)測AI的反應(yīng)是否有偏見的跡象。如果檢測到偏倚,則應(yīng)改進(jìn)提示以減少偏倚。此外,響應(yīng)應(yīng)該是透明的,并且可以向用戶解釋。
- 確認(rèn)和部署:驗(yàn)證提示不會鼓勵(lì)不道德的行為或在各種環(huán)境和數(shù)據(jù)集之間存在偏見。即使在部署之后,也要持續(xù)監(jiān)測人工智能對道德遵守和偏見的反應(yīng)。
- 維護(hù):做好必要的調(diào)整,以保持道德標(biāo)準(zhǔn),并繼續(xù)檢查是否存在偏見。
3.一個(gè)例子
下面是一個(gè)關(guān)于教育領(lǐng)域的例子:
目的是使用AI創(chuàng)建一個(gè)簡化和向中學(xué)生解釋數(shù)學(xué)概念的系統(tǒng)。通過提示詞工程的過程,提高整個(gè)結(jié)果的有效性。
設(shè)計(jì)階段:初始提示詞可能是“什么是勾股定理?”人工智能的預(yù)期輸出是對該定理的簡單且可理解的解釋。
實(shí)施階段:該提示詞被輸入到AI模型中,評估響應(yīng)。人工智能的回答可能過于技術(shù)化,無法滿足我們目標(biāo)用戶要求。
優(yōu)化階段1:為了糾正這一點(diǎn),提示詞被調(diào)整為“用中學(xué)生能理解的方式解釋勾股定理?!?,然后實(shí)施改進(jìn)后的提示詞并評估大模型的響應(yīng)。如果人工智能提供了清晰的、適合年齡的解釋,我們將繼續(xù)對它進(jìn)行細(xì)化。
優(yōu)化階段2:在這個(gè)階段,需要考慮道德層面的問題。人工智能的解釋可能會無意中偏向特定的性別或文化。為了確保包容性和避免任何偏見,提示詞再次被細(xì)化為“以中學(xué)生可以理解的方式解釋勾股定理,確保使用性別中立并且文化包容作為例子?!?/p>
驗(yàn)證階段:這個(gè)修改后的提示詞在廣泛的數(shù)學(xué)概念中得到了驗(yàn)證。下一步,我們的目標(biāo)是確保AI能夠在不同主題中調(diào)整其語言水平和包容性。
使用模版:最后提示詞為:“用一種中學(xué)生能理解的方式解釋{數(shù)學(xué)概念},確保使用性別中立并且文化包容作為例子?!保梢杂萌魏我忉尩母拍钐鎿Q“{數(shù)學(xué)概念}”。
維護(hù)階段:監(jiān)控人工智能與學(xué)生的互動(dòng),跟蹤其有效性,并觀察其回應(yīng)中是否存在任何無意的偏見或道德問題。如果新的數(shù)學(xué)概念被引入到課程中,提示詞可能需要重新評估和改進(jìn),從而在提示詞的生命周期中開始新的循環(huán)。
這個(gè)例子強(qiáng)調(diào)了在提示詞的整個(gè)生命周期的迭代中考慮有效性、科學(xué)性和倫理道德,以創(chuàng)建一個(gè)有效的,公正的,道德健全的人工智能系統(tǒng)。
4.總結(jié)
在快速發(fā)展的AGI世界中,了解提示詞的生命周期(從設(shè)計(jì)到部署)至關(guān)重要。提示詞的在AGI的旅程過程包括多個(gè)階段,如:設(shè)計(jì)、實(shí)現(xiàn)、評估、細(xì)化、迭代、驗(yàn)證、部署和維護(hù)。 在提示詞的生命旅程中,AI回答的科學(xué)性可用性十分重要,決定了提示詞的正確與否。同樣重要的是在每個(gè)階段納入法律法規(guī)以及道德方面的考慮,以保證人工智能行為尊重用戶隱私、遵守道德準(zhǔn)則,并且沒有偏見。這樣才能確保人工智能的回答能夠公平對待不同背景的用戶群體。
通過教育領(lǐng)域大模型應(yīng)用的提示工程案例,我們看到了從一個(gè)簡單的問題需求到一個(gè)完善的提示詞指令的演變過程,幫助人工智能為中學(xué)生提供清晰,可理解和包容的復(fù)雜數(shù)學(xué)概念解釋。
當(dāng)我們利用人工智能的能力推動(dòng)各個(gè)領(lǐng)域的變革時(shí),必須制定正確的提示詞,通過這種全面周到的方法才能真正利用人工智能的力量,創(chuàng)造出不僅高效有效的解決方案,而且公平、公正和尊重所有用戶。