偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Hugging?Face是LLM新的GitHub

譯文
人工智能
Hugging?Face正在成為LLM新“GitHugging?Face正在成為LLM新“GitHub”,并提供了簡化LLM開發(fā)和部署的工具。 Hub”,并提供了簡化LLM開發(fā)和部署的工具。

譯者 | 李睿

審校 | 重樓

近年來,大型語言模型(LLM)席卷了科技行業(yè),開辟了創(chuàng)新的新領域,顛覆了從搜索到客戶服務的一切。支持這場人工智能革命的是GitHubHugging Face這樣的開放生態(tài)系統(tǒng),它使開發(fā)人員和企業(yè)能夠快速構建、部署和擴展LLM。就像GitHub已經成為軟件開發(fā)和協(xié)作的首選平臺一樣,Hugging Face現在正在成為所有與LLM相關事物的事實上的中心。

大型語言模型的興起

GPT-3BERTPaLM這樣的LLM可以讓科技界發(fā)揮自己的想象力,它們能夠生成類似人類的文本、回答問題、總結文檔,甚至根據簡單的文本提示編寫代碼。根據麥肯錫公司發(fā)布的一份研究報告,專注于LLM的自然語言處理初創(chuàng)公司的投資從2020年的1億美元激增至2021年的15億美元以上。

這種興趣激增源于LLM在應對各種人工智能挑戰(zhàn)方面的多功能性。例如,OpenAI公司的ChatGPT擅長于會話任務,而像Cohere的生成式自然語言處理API這樣的工具可以總結文本并調節(jié)內容。LLM正在改變企業(yè)的運營方式,推動從智能搜索到自動化客戶支持的各方的進步。

麥肯錫公司估計,到2025年,LLM將在美國經濟中每年創(chuàng)造2000億至3000億美元的經濟價值。谷歌、Meta和微軟等美國科技巨頭以及初創(chuàng)公司都在競相挖掘LLM的潛力。但是在LLM上構建、部署和迭代需要專門的基礎設施和工具。

GitHub在軟件協(xié)作中的關鍵作用

為了理解Hugging Face作為LLM中心日益重要的意義,可以了解GitHub在軟件開發(fā)中扮演的不可或缺的角色。GitHub2008年推出,是用于版本控制和源代碼管理的開源Git協(xié)議的先驅。

如今,GitHub擁有2億多個代碼庫和8300萬多名開發(fā)人員。它為開發(fā)人員提供了協(xié)作、審查代碼、跟蹤問題和發(fā)布軟件的工具。GitHub已經成為軟件團隊運作不可或缺的一部分,微軟公司在2018年以75億美元收購GitHub就是一個例子。

根據StackOverflow2021年調查顯示,90%以上的開發(fā)人員使用GitHub。該平臺的社交編碼能力打破了軟件開發(fā)中的障礙。開發(fā)人員可以利用開源項目來加速構建。而企業(yè)使用GitHub的企業(yè)產品來簡化編碼工作流程。GitHub深深植根于開發(fā)者文化,塑造了軟件社區(qū)創(chuàng)建、擴展和部署代碼的方式。

Hugging Face成為LLM的首選平臺

就像GitHub推動了開源開發(fā)一樣,Hugging Face正在引領LLM的開放生態(tài)系統(tǒng)方法。Hugging Face成立于2016年,最初專注于自然語言處理。在2020年,它轉向LLM并創(chuàng)建了Transformer庫,該庫將不同的LLM架構(例如BERTGPT-2)與標準化API統(tǒng)一起來。

這個庫通過抽象掉與LLM一起工作的復雜性,使LLM的訪問民主化。如今,Hugging Face已經成為一個擁有20多萬用戶的充滿活力的社區(qū)。其主要產品有:

  • 模型中心超過10萬個人工智能模型的存儲庫,包括OpenAI公司的CLIPSalesforce公司的BLENDERLLM。它降低了使用LLM的門檻。
  • 標記器:預訓練模型用于標記和編碼LLM文本。對數據預處理至關重要。
  • 數據集:精心策劃的數據集,用于培訓和評估LLM。
  • Spaces:用于部署、監(jiān)控和擴展LLM驅動的應用程序的一個MLOps平臺。
  • Infinite:基于GPT模型的維基風格數據集,用于生成自然語言查詢的答案。

這套工具解決了LLM從發(fā)現到部署的整個開發(fā)生命周期。Hugging Face還構建了與Streamlight等平臺的集成,實現了無代碼LLM實驗。

到目前為止,Hugging Face已經籌集了1億美元的資金,這反映了日益飆升的知名度。去年,Hugging Face估值翻了五倍,達到20億美元。國際頂級人工智能實驗室和公司也在與Hugging Face合作。

LLM的GitHub

Hugging Face龐大的模型、數據集和開發(fā)工具中心為它贏得了“LLM GitHub”的綽號。它的模型中心是任何想要與LLM合作的人的起點。開發(fā)人員可以在其網站上找到Meta AIOPT-175B等模型的優(yōu)化實現。

然后,他們可以通過Hugging FaceTransformers庫無縫訪問這些模型。這大幅降低了使用先進LLM的門檻企業(yè)不再需要從頭開始構建自己的LLM。與其相反,他們可以采用Hugging Face預先設定的LLM,并對其進行微調,以適應搜索和分析等領域的定制用例。

Spaces支持協(xié)作構建、測試和部署LLM應用程序。結合Hugging Face的開放數據集和活躍的社區(qū)論壇,它復制了GitHubLLM量身定制的開源精神的核心元素。

美國一家大型科技公司的機器學習工程師Leo Zhao總結了Hugging Face在LLM工作流程中的融入:“每當我們需要一個新項目的LLM時,Hugging Face是我們所到的第一站。們的模型中心有大量的選項可供選擇。只需幾行代碼,我們就可以立即標記并將數據提供給模型。Spaces使得在GPU集群上縮放模型訓練變得容易。它確實是一個與LLM相關的一站式平臺。

GitHub的類比也適用于Hugging Face如何圍繞LLM培養(yǎng)協(xié)作社區(qū)。它的技術論壇已經成為數以萬計的LLM開發(fā)人員和用戶的重要知識和支持來源。Hugging Face通過其廣受歡迎的LLM會議進一步培養(yǎng)了這個社區(qū),使最新進展的訪問民主化。

克服LLM采用的挑戰(zhàn)

事實證明,Hugging Face在幫助企業(yè)克服采用LLM的關鍵障礙方面發(fā)揮了重要作用。根據麥肯錫公司進行的一項研究,企業(yè)LLM方面面臨的最大挑戰(zhàn)是評估價值和確定用例。Hugging Face通過集中廣泛的LLM選擇和推薦的微調數據集來緩解這一問題。

此外,將LLM投入生產會帶來復雜的數據和基礎設施問題。Hugging Face的端到端平臺從模型訪問到部署,為企業(yè)掃清了這些障礙。

大規(guī)模構建和運行LLM所需的財務投資也阻礙了LLM的采用。Hugging Face通過提供易于訪問的預訓練模型來降低成本。Space通過其無服務器架構和對可擴展云計算硬件(例如TPU)的支持進一步優(yōu)化了支出。對于規(guī)模較小的團隊和初創(chuàng)公司來說,這可以使大型LLM實驗變得可行。

用LLM改變未來

展望未來, Hugging Face似乎有望繼續(xù)發(fā)展成為LLM的中心。它的社區(qū)已經超過了流行的人工智能論壇。越來越多的開發(fā)人員和企業(yè)在他們的生產管道中依賴于像Transformers庫和Tokenizers這樣的工具。

LLM將推動市場營銷、銷售和財務等領域發(fā)生翻天覆地的變化。麥肯錫公司預計,LLM可以將30%45%的當前工作活動實現自動化,從而產生重大的社會影響。像Hugging Face這樣降低LLM創(chuàng)新門檻的平臺,將是實現其變革潛力的核心。

就像GitHub加速了軟件工程一樣,Hugging Face使開發(fā)人員和企業(yè)能夠更快速、更有效地利用LLM的能力。對于日益增長的LLM驅動的經濟來說,Hugging Face代表著通往未來的大門。它的綜合平臺可以催化新市場,開啟人類與人工智能的大規(guī)模合作,開創(chuàng)下一個技術進步時代。

原文標題:Hugging Face Is the New GitHub for LLMs,作者:Arvind Bhardwaj

責任編輯:華軒 來源: 51CTO
相關推薦

2024-02-29 16:35:01

StarCoder2大型語言模型人工智能

2024-01-02 09:10:17

k開源數據

2023-12-06 15:40:17

AI

2024-08-28 08:25:25

Python預訓練模型情緒數據集

2024-12-05 13:50:00

AI大模型

2024-09-26 10:42:20

2024-10-08 09:30:00

AI模型

2023-07-10 14:35:53

2024-11-15 08:24:41

2024-06-21 08:42:54

BERTNLP自然語言處理

2023-06-30 09:00:00

Falcon LLM開源

2024-11-13 08:34:32

T5聊天機器人大模型

2023-11-28 13:53:00

數據模型

2025-03-03 13:19:21

2024-05-06 12:22:00

AI訓練

2025-04-01 09:31:34

PyTorch自動語音識別ASR系統(tǒng)

2024-01-15 16:25:15

AI模型

2023-02-23 17:51:03

亞馬遜云科技AI

2022-07-13 16:45:34

?大模型AI微軟

2025-03-26 10:57:40

PyTorchGGUF
點贊
收藏

51CTO技術棧公眾號