編譯丨諾亞
出品 | 51CTO技術棧(微信號:blog51cto)
在IT行業(yè),“精益”常用來描述追求更高效率和成本效益的流程,生成式AI也不例外。一些企業(yè)的AI系統(tǒng)運行成本高達數(shù)百萬美元,并消耗大量電力,促使企業(yè)尋求更高效、精益的AI解決方案。
企業(yè)自然傾向于借助公共云快速部署生成式AI,因其提供便捷的一站式服務。大型云服務商已從AI投資中獲益。但使用云服務的成本有時會超過傳統(tǒng)數(shù)據(jù)中心,盡管如此,企業(yè)仍在尋找有效降低成本的方法,這正是精益AI概念的意義所在。
1.精益AI是如何工作的
精益人工智能是一種戰(zhàn)略方法,強調在交付最大商業(yè)價值的同時注重效率、成本效益以及最小資源消耗。許多精益人工智能的方法借鑒了最初用于制造業(yè)和產品開發(fā)的精益管理方法。
精益人工智能側重于優(yōu)化人工智能系統(tǒng)的開發(fā)、部署和運營。它采用較小的模型、迭代開發(fā)實踐以及資源高效的技巧來減少浪費。通過優(yōu)先考慮敏捷的數(shù)據(jù)驅動決策制定和持續(xù)改進,精益人工智能使企業(yè)能夠以可持續(xù)且可擴展的方式利用人工智能的力量。這確保了人工智能計劃既具有影響力又經濟可行。
如今,企業(yè)意識到更大的并不總是更好的。企業(yè)人工智能轉型的景觀由小型語言模型(SLM)和一波開源進展所標志。這種演變是對生成式人工智能系統(tǒng)使用大型語言模型(LLM)所帶來的高昂成本和資源需求的一種直接回應。許多企業(yè)現(xiàn)在希望重新評估成本與商業(yè)價值之間的平衡。
2.大型語言模型的挑戰(zhàn)
像OpenAI的GPT-4和Meta的Llama這樣的大型語言模型在理解和生成人類語言方面展示了非凡的能力。然而,這些優(yōu)勢伴隨著許多越來越難以讓企業(yè)接受的挑戰(zhàn)。這些模型的計算需求及其相應的云成本非常高,給預算帶來壓力并限制了更廣泛的采用。還有能源消耗的問題,這不僅帶來了財務負擔,也帶來了重大的環(huán)境影響。
操作延遲是另一個障礙,特別是對于需要實時響應的應用程序而言。我們也不應忽視管理和維護這些龐大模型的復雜性,這些模型需要專門的專業(yè)知識和基礎設施,而并非所有組織都具備這些條件。
3.轉向小型語言模型
在這種背景下,小型語言模型被加速用于生成式人工智能在云端和非云端環(huán)境中的部署。它們正越來越多地被視為實用的選擇。小型語言模型旨在顯著降低計算資源需求和能源消耗。這意味著更低的運營成本和更具吸引力的人工智能計劃投資回報率。更快的訓練和部署周期也使得小型語言模型對那些需要在快節(jié)奏市場中保持敏捷性和響應性的企業(yè)更具吸引力。
企業(yè)通常不會使用大型語言模型,所以建議它們這樣做是不現(xiàn)實的。相反,它們將構建更有針對性的人工智能系統(tǒng)來解決特定的應用場景,例如設備維護、運輸物流和制造優(yōu)化等領域,在這些領域中,精益人工智能方法可以立即產生商業(yè)價值。
小型語言模型還加強了定制化。這些模型可以針對具體任務和行業(yè)領域進行精細調整,產生專業(yè)應用并產生可衡量的商業(yè)成果。無論是在客戶服務、金融分析還是醫(yī)療診斷領域,這些更精簡的模型都證明了自己的有效性。
4.開源的優(yōu)勢
開源社區(qū)一直是推動小型語言模型進步和采用的驅動力。Meta的新版本Llama 3.1提供了多種大小選項,能夠在不過度消耗資源的情況下提供強大的能力。其他模型,如斯坦福大學的Alpaca和Stability AI的StableLM,表明小型模型的表現(xiàn)可以媲美甚至超越其大型對手,尤其是在特定領域的應用中。
來自Hugging Face、IBM的Watsonx.ai等公司的云平臺和工具使得這些模型更容易獲取,并降低了各類企業(yè)的入門門檻。這種人工智能能力的民主化是一個游戲規(guī)則改變者。更多的組織可以在不依賴專有且往往價格昂貴的解決方案的情況下融入先進的人工智能技術。
5.企業(yè)的轉變
采用小型語言模型對企業(yè)來說有多重好處:
- 成本效益:這些模型讓企業(yè)能以更低的成本部署人工智能,這對需要最大化技術投資的初創(chuàng)公司和中小企業(yè)尤為重要。
- 敏捷性提升:更快的部署速度和更靈活的定制能力確保AI功能更好地適應不斷變化的業(yè)務需求。
- 數(shù)據(jù)隱私與主權:在本地或私有云部署小型模型可以更好地保護數(shù)據(jù)隱私,滿足監(jiān)管要求并確保數(shù)據(jù)安全。
- 可持續(xù)發(fā)展:較低的能源消耗支持企業(yè)的環(huán)保目標。
借助開源創(chuàng)新,小型語言模型降低了大型AI系統(tǒng)的成本和復雜度,為企業(yè)提供了高效、可定制的路徑。這種轉變提高了AI投資的價值,并促進了可持續(xù)且可擴展的增長。在可持續(xù)且經濟實惠的人工智能領域,小型模型正變得越來越重要。
參考鏈接:https://www.infoworld.com/article/3480593/small-language-models-and-open-source-are-transforming-ai.html


































