偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<kbd id="2pzsn"></kbd>

<sub id="2pzsn"></sub>

<sup id="2pzsn"></sup>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

低成本LLM應(yīng)用開發(fā)利器——開源FrugalGPT框架原創(chuàng)

51CTO內(nèi)容精選

發(fā)布于 2024-5-6 08:40

瀏覽

0收藏

本文將詳細(xì)介紹一個LLM驅(qū)動型應(yīng)用程序的成本節(jié)約架構(gòu)FrugalGPT。

大型語言模型為計(jì)算機(jī)科學(xué)開辟了一個新的前沿；然而，它們（截至2024年）的運(yùn)營成本遠(yuǎn)遠(yuǎn)高于計(jì)算機(jī)科學(xué)中的其他任何產(chǎn)品。對于希望將運(yùn)營成本降至最低的公司來說，這是一個嚴(yán)重的問題。論文《FrugalGPT：如何在降低成本和提高性能的同時使用大型語言模型》（https://arxiv.org/abs/2305.05176）介紹了一種在保持質(zhì)量的同時顯著降低運(yùn)營成本的框架。

如何衡量LLM的成本

當(dāng)前，已經(jīng)存在多種方法可以確定LLM的運(yùn)營成本（電力使用、計(jì)算成本等）；但是，如果您使用第三方LLM（LLM-as-a-service），他們通常會根據(jù)您使用的詞元（token）向您收費(fèi)。不同的供應(yīng)商（OpenAI、Anthropic、Cohere等）使用不同的詞元計(jì)數(shù)方式，但為了簡單起見，我們將考慮基于LLM處理的詞元數(shù)量的成本。

這種類型的框架最重要的部分是不同模型的成本不同。這篇論文的作者們構(gòu)造了一個方便的表格，表格數(shù)據(jù)可以很容易地展現(xiàn)成本間的差異，而且這些差異是非常顯著的。例如，在該表中，AI21的輸出詞元的成本比GPT-4的高出一個數(shù)量級！

低成本LLM應(yīng)用開發(fā)利器——開源FrugalGPT框架-AI.x社區(qū)

本表數(shù)據(jù)來自上述FrugalGPT論文

作為成本優(yōu)化的一部分，我們總是需要找到一種方法來優(yōu)化答案質(zhì)量，同時還要盡可能將成本降至最低。通常，成本較高的模型往往是性能較高的模型，能夠給出比成本較低的模型更高質(zhì)量的答案。模型間的一般關(guān)系如下圖所示；其中，F(xiàn)rugalGPT的性能以紅色明顯展示在圖表的頂部位置。

低成本LLM應(yīng)用開發(fā)利器——開源FrugalGPT框架-AI.x社區(qū)

注意，論文中的圖1c（即上圖）基于HEADLINES數(shù)據(jù)集創(chuàng)建，其根據(jù)LLM準(zhǔn)確回答問題的頻率對各種LLM進(jìn)行了比較。

級聯(lián)LLMS實(shí)現(xiàn)質(zhì)量最優(yōu)化

利用模型之間的巨大成本差異，研究人員推出的FrugalGPT系統(tǒng)能夠依賴于一系列的LLM實(shí)現(xiàn)給用戶提供答案。簡單地說，用戶查詢從最便宜的LLM開始；如果答案足夠好，則查詢結(jié)束（返回答案）。但是，如果答案不夠好，則將查詢傳遞給下一個最便宜的LLM。

研究人員使用了以下邏輯：如果一個價(jià)格較低的模型答錯了一個問題，那么價(jià)格較高的模型很可能會給出正確的答案。因此，假設(shè)價(jià)格越貴質(zhì)量就越高，為了最大限度地降低成本，規(guī)定模型鏈的訂購順序是從最便宜到最昂貴。

低成本LLM應(yīng)用開發(fā)利器——開源FrugalGPT框架-AI.x社區(qū)

論文中的圖2e展示了LLM級聯(lián)式示意圖。

很明顯，圖中展示的這種設(shè)置架構(gòu)依賴于確定答案何時足夠好，何時不夠好。為了解決這個問題，作者創(chuàng)建了一個DistilBERT模型，該模型將接受問題和答案，然后為答案打分。由于DistilBERT模型比序列中的其他模型小得多（指數(shù)量級），因此與其他模型相比，運(yùn)行它的成本幾乎可以忽略不計(jì)。

比查詢最佳LLM更好的平均質(zhì)量

人們可能會自然而然地問：如果質(zhì)量是最重要的，那么，為什么不查詢最好的LLM并研究如何降低運(yùn)行最好LLM的成本呢？

當(dāng)這篇論文發(fā)表時，GPT-4是作者們發(fā)現(xiàn)的最好的LLM；但是，GPT-4并不總是比FrugalGPT系統(tǒng)給出更好的答案?。ㄑ奂獾淖x者會將其視為本文前面的成本相對于性能圖表的一部分）論文作者們推測，正如最有能力的人并不總是給出正確的答案一樣，最復(fù)雜的模型也不會。因此，通過使用DistilBERT對答案進(jìn)行過濾，您可以刪除任何不符合標(biāo)準(zhǔn)的答案，并增加獲得優(yōu)秀答案的幾率。

低成本LLM應(yīng)用開發(fā)利器——開源FrugalGPT框架-AI.x社區(qū)

論文中的圖5a顯示了FrugalGPT優(yōu)于GPT-4的情形。

因此，這個系統(tǒng)不僅可以降低成本，而且可以提高質(zhì)量，而不僅僅是使用最好的LLM！

繼續(xù)研究節(jié)省成本問題

這篇論文的結(jié)果令人著迷。對我來說，這提出了一個問題，即我們?nèi)绾卧诓槐赝顿Y于進(jìn)一步的模型優(yōu)化的情況下進(jìn)一步節(jié)省成本。

實(shí)現(xiàn)這樣的可能性的一種辦法是將所有模型答案緩存在向量數(shù)據(jù)庫中，然后在開始LLM級聯(lián)之前進(jìn)行相似性搜索以確定緩存中的答案是否有效。這將通過用相對較低成本的查詢和相似性操作代替昂貴的LLM操作來顯著降低成本。

此外，這會讓你懷疑過時的模型是否仍然值得進(jìn)行成本優(yōu)化，就像你可以降低它們的每個詞元的成本一樣，它們?nèi)匀豢梢栽贚LM級聯(lián)上創(chuàng)造價(jià)值。同樣，這里的關(guān)鍵問題是，在什么時候通過在鏈上添加新的LLM來獲得遞減回報(bào)。

有待進(jìn)一步研究的問題

隨著世界創(chuàng)造出更多的LLM，我們也越來越多地構(gòu)建使用它們的系統(tǒng)，我們希望找到更加節(jié)約成本的方法來運(yùn)行它們。本文討論的FrugalGPT論文為未來的開發(fā)人員創(chuàng)建了一個強(qiáng)大的框架，讓我非常想知道這個框架能走多遠(yuǎn)。

在我看來，這個框架非常適合于基于不同用戶的答案統(tǒng)一型的一般查詢，例如導(dǎo)師型LLM。然而，對于答案因用戶而異的使用場景，例如充當(dāng)客戶服務(wù)代理的LLM，評分系統(tǒng)必須知道LLM與誰交談。

總之，找到一個能為用戶特定交互而又節(jié)約成本的框架未來將是非常重要的。

主要參考文獻(xiàn)

[1] Chen, L.,等人，F(xiàn)rugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance (2023)，arXiv。

譯者介紹

朱先忠，51CTO社區(qū)編輯，51CTO專家博客、講師，濰坊一所高校計(jì)算機(jī)教師，自由編程界老兵一枚。

原文標(biāo)題：FrugalGPT and Reducing LLM Operating Costs，作者：Matthew Gunton

鏈接：https://towardsdatascience.com/frugalgpt-and-reducing-llm-operating-costs-ff1a6428bf96。

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

大型語言模型

已于2024-5-6 08:45:10修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

簡單、快速、低成本、強(qiáng)大！高分辨率圖像生成擴(kuò)散外推方法CutDiffusion發(fā)布！

angel ? 5716瀏覽 ? 0回復(fù)
精打細(xì)算用好 LLMs ：LLM 落地應(yīng)用成本及響應(yīng)延遲優(yōu)化

Baihai_IDP ? 4359瀏覽 ? 0回復(fù)
通過多樣本學(xué)習(xí)加速LLM應(yīng)用開發(fā)

51CTO內(nèi)容精選 ? 3829瀏覽 ? 0回復(fù)
基于開源AI數(shù)據(jù)框架LlamaIndex構(gòu)建上下文增強(qiáng)型LLA應(yīng)用

51CTO內(nèi)容精選 ? 6396瀏覽 ? 0回復(fù)
AutoML領(lǐng)域開源開發(fā)利器AutoGloon之實(shí)戰(zhàn)演練

51CTO內(nèi)容精選 ? 5512瀏覽 ? 0回復(fù)
如何創(chuàng)建LLM應(yīng)用程序的框架

51CTO內(nèi)容精選 ? 3621瀏覽 ? 0回復(fù)
LangChain 與 LlamaIndex：構(gòu)建 LLM 應(yīng)用程序的利器，如何強(qiáng)強(qiáng)聯(lián)手？

丟翅膀的魚 ? 5236瀏覽 ? 0回復(fù)
基于LLM的多Agent框架在金融市場數(shù)據(jù)的應(yīng)用

大語言模型論文跟蹤 ? 4248瀏覽 ? 0回復(fù)
LLM應(yīng)用開發(fā)者新利好：再也不用寫集成代碼了！

51CTO技術(shù)棧 ? 3494瀏覽 ? 0回復(fù)
最新開源Auto-RAG：最低成本解決多跳問題

AIGC前沿技術(shù)追蹤 ? 6958瀏覽 ? 0回復(fù)
我從 2024 年的 LLM 應(yīng)用開發(fā)實(shí)踐中學(xué)到了什么？Part 1

Baihai_IDP ? 3509瀏覽 ? 0回復(fù)
低成本+高性能+超靈活！Deepseek 671B + Milvus 重新定義知識庫搭建！

玄姐聊AGI ? 7126瀏覽 ? 0回復(fù)
用開源框架Chipper解鎖本地AI：無需云或API密鑰即可構(gòu)建RAG應(yīng)用

51CTO內(nèi)容精選 ? 4326瀏覽 ? 0回復(fù)
詳解RAG應(yīng)用開發(fā)幻覺檢測利器LettuceDetect?

51CTO內(nèi)容精選 ? 2467瀏覽 ? 0回復(fù)
Qwen3 低成本手撕Search-R1的強(qiáng)化學(xué)習(xí)訓(xùn)練框架

CourseAI ? 2154瀏覽 ? 0回復(fù)
三大框架 Dify/RAGFlow/n8n怎么選？企業(yè)低成本落地AI的最優(yōu)解

AI博物院 ? 8445瀏覽 ? 0回復(fù)
這 10 個低成本開源 AI 智能體好使

PyTorch研習(xí)社 ? 4386瀏覽 ? 0回復(fù)
阿里重磅開源AgentScope，多智能體應(yīng)用開發(fā)利器

PyTorch研習(xí)社 ? 1872瀏覽 ? 0回復(fù)
Karpathy的nanochat：構(gòu)建企業(yè)LLM技術(shù)基線的最低成本方案

七牛云行業(yè)應(yīng)用 ? 1388瀏覽 ? 0回復(fù)

51CTO內(nèi)容精選

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

如何使用n8n構(gòu)建AI工作流 21分鐘前發(fā)布
RAS 革命：從 RAG 到結(jié)構(gòu)化知識增強(qiáng)，破解 LLM 短板的新范式 2天前發(fā)布

熱門推薦

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

別再怪AI“聽不懂人話”了，90%的返工和錯誤，都錯在你下達(dá)指令的第一句話 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測中展現(xiàn)出驚人效率，僅用15秒便將百頁P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

DeepSeek 成長史：從量化投資到 AI 革命的一個 “非主流” 量化大佬的 AI 夢 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)

上一篇：谷歌之外，值得考慮的八大AI搜索引擎

下一篇：開發(fā)者的LlamaIndex入門指南

社區(qū)精華內(nèi)容

目錄

<table id="sj3nh"></table>