編輯 | 言征
當(dāng)?shù)貢r間,1月25日,OpenAI發(fā)布了新的模型,同時降低了GPT-3.5 Turbo的價格,并為開發(fā)人員引入了管理API密鑰和了解API使用情況的新方法。
新模型包括:兩個新的嵌入模型、一個更新的GPT-4 Turbo預(yù)覽模型、一個升級的GPT-3.5 Turbo模型、一個新的文本審核模型。
模型默認(rèn)情況下,發(fā)送到OpenAI API的數(shù)據(jù)將不會用于訓(xùn)練或改進(jìn)OpenAI模型。
1、兩個新嵌入模型,價格下降
OpenAI將引入兩種新的嵌入模型:一種是更小、高效的 text-embedding-3-small 模型,另一種是更大、更強(qiáng)的text-embedding-3-large 模型。
embeddings使得機(jī)器學(xué)習(xí)模型和其他算法更容易理解內(nèi)容之間的關(guān)系,并執(zhí)行聚類或檢索等任務(wù)。它們?yōu)镃hatGPT和助手API中的知識檢索等應(yīng)用程序以及許多檢索增強(qiáng)生成(RAG)開發(fā)工具提供了動力。
圖片
text-embedding-3-small是新一代的高效嵌入模型,與2022年12月發(fā)布的前代text-embeeding-ada-002模型相比進(jìn)行了重大升級,性能更強(qiáng)。相較而言,多語言檢索常用基準(zhǔn)(MIRACL)的平均得分從31.4%增加到44.0%,而英語任務(wù)常用基準(zhǔn)(MTEB)的平均分?jǐn)?shù)從61.0%增加到62.3%。
降價方面,與text-embedding-ada-002相比,text-embetting-3small的價格降低了5倍,從每1k代幣的價格0.0001美元降至0.00002美元。
text-embedding-3-large是新的下一代更大的嵌入模型,可創(chuàng)建高達(dá)3072個維度的嵌入,它擁有更強(qiáng)的性能。
將text-embedding-ada-002與text-embeeding-3-large進(jìn)行比較:在MIRACL上,平均得分從31.4%增加到54.9%,而在MTEB上,平均分?jǐn)?shù)從61.0%增加到64.6%。
價格上,text-embedding-3-large定價為0.00013/1k tokens。
圖片
值得一提的是,這個兩個新的嵌入模型都原生支持縮短嵌入。
使用更大的嵌入,例如將它們存儲在矢量存儲中進(jìn)行檢索,通常會帶來更高的成本,比如:消耗更多的計算、內(nèi)存和存儲等等。
這兩個新嵌入模型都使用了這樣一種技術(shù)進(jìn)行訓(xùn)練,即允許開發(fā)人員權(quán)衡使用嵌入的性能和成本。具體來說,開發(fā)人員可以通過傳遞dimensions API參數(shù)來縮短嵌入(即從序列結(jié)尾移除一些數(shù)字),而不會丟失嵌入的概念表示屬性。例如,在MTEB基準(zhǔn)上,文本嵌入-3大嵌入可以縮短到256的大小,同時仍然優(yōu)于1536大小的未縮減的text-embedding-ada-002。
這使得使用非常靈活。例如,當(dāng)使用僅支持長度不超過1024個維度的嵌入的向量數(shù)據(jù)存儲時,開發(fā)人員現(xiàn)在仍然可以使用我們最好的嵌入模型 text-embedding-3-large ,并為維度API參數(shù)指定1024的值,這將使嵌入從3072個維度縮短,犧牲一定的準(zhǔn)確性來換取更短、更小的向量。
2、更新的GPT-3.5 Turbo型號和更低的定價
下周,OpenAI將推出一款新的GPT-3.5 Turbo型號GPT-3.5-Turbo-0125,并將第三次降低GPT-3.5 Turbo的價格。新模型的輸入價格降低50%,降至0.0005美元/1K tokens,輸出價格降低了25%,降至0.0015美元/1K tokens。
該模型還將有各種改進(jìn),包括以請求的格式響應(yīng)的準(zhǔn)確性更高,以及修復(fù)導(dǎo)致非英語函數(shù)調(diào)用的文本編碼問題的錯誤。
使用固定gpt-3.5-turbo型號別名的客戶將在該型號發(fā)布兩周后自動從gpt-3.5-turbo-0613升級到gpt-3.5-durbo-0125。
3、更新GPT-4 Turbo預(yù)覽
自GPT-4 API發(fā)布以來,超過70%的GPT-4客戶請求已過渡到GPT-4 Turbo,因為開發(fā)人員利用了其更新的知識截止、更大的128k上下文窗口和更低的價格。OpenAI現(xiàn)在發(fā)布了一個更新的GPT-4 Turbo預(yù)覽模型,GPT-4-0125-preview。
此模型比以前的預(yù)覽模型更徹底地完成代碼生成等任務(wù),旨在減少模型無法完成任務(wù)的“懶惰”情況。
新模型還包括對影響非英語UTF-8代的錯誤的修復(fù)。對于那些想要自動升級到新的GPT-4 Turbo預(yù)覽版本的人,還推出了一個新的GPT-1-Turbo-preview型號,它將始終指向最新的GPT4-Turbo預(yù)覽型號。
OpenAI還聲稱計劃在未來幾個月內(nèi)推出GPT-4 Turbo,并實現(xiàn)全面上市。
4、更新審核模型
免費的Moderation API允許開發(fā)人員識別潛在的有害文本。作為正在進(jìn)行的安全工作的一部分,OpenAI將發(fā)布text-moderation-007,這是其迄今為止最強(qiáng)大的審核模型。
5、API使用和管理API密鑰的新方法
OpenAI正在推出兩項平臺改進(jìn),以使開發(fā)人員能夠更好地了解他們對API密鑰的使用和控制。
首先,開發(fā)人員現(xiàn)在可以從API密鑰頁面為API密鑰分配權(quán)限。例如,可以為密鑰分配只讀訪問權(quán)限以為內(nèi)部跟蹤面板供電,或者將其限制為僅訪問某些端點。
其次,使用情況儀表板和使用情況導(dǎo)出功能現(xiàn)在在啟用跟蹤之后公開API關(guān)鍵級別上的度量。這使得查看每個功能、團(tuán)隊、產(chǎn)品或項目級別的使用情況變得簡單,只需為每個功能、小組、產(chǎn)品或工程級別分別提供單獨的API鍵即可。
在接下來的幾個月里,OpenAI計劃進(jìn)一步提高開發(fā)人員查看API使用情況和管理API密鑰的能力。
原文鏈接:https://openai.com/blog/new-embedding-models-and-api-updates