Hugging Face最受歡迎15大AI機(jī)構(gòu)出爐!清華第五,OpenAI第十,冠軍竟是它?
Hugging Face上最受歡迎的15個(gè)AI公司出爐了!
目前的冠軍,是Stability AI。
開(kāi)源英雄Meta AI,取得亞軍之位。
而我們熟知的微軟、谷歌、OpenAI,分別名列第八、九、十的位置。
圖片
15個(gè)最受AI開(kāi)源社區(qū)歡迎的公司
截止23年11月24日,榜單如下——
1. Stability AI,20000個(gè)贊
圖片
2022年AI大爆炸的兩個(gè)標(biāo)志性事件,一個(gè)是ChatGPT,一個(gè)就是Stable Diffusion。
作為開(kāi)源的圖像生成模型,可以說(shuō),Stable Diffusion的發(fā)布將AI生圖提高到了全新的高度,影響不亞于Open AI發(fā)布ChatGPT。
Stability AI,就是大名鼎鼎的Stable Diffusion背后的公司之一,掌門(mén)人和聯(lián)合創(chuàng)始人是Emad Mostaque。
不過(guò),他此前有一些不好的傳言。
圖片
另外,Stability AI也開(kāi)源了自己的大語(yǔ)言模型——StableLM。
2. Meta AI,20000個(gè)贊
圖片
實(shí)至名歸,Llama模型的開(kāi)源鼻祖,如今大模型領(lǐng)域開(kāi)源和閉源模型能夠分庭抗禮,沒(méi)有全被OpenAI、谷歌等明星初創(chuàng)公司和大科技公司壟斷,Meta AI功不可沒(méi)。
也因此,小扎被公認(rèn)為「開(kāi)源英雄」,而圖靈三巨頭之一的Yann LeCun,在Meta也起著定海神針的作用。
圖片
雖然排名第二,但是贊數(shù)和第一完全沒(méi)有差距。可以說(shuō)Meta AI就是最受開(kāi)源社區(qū)歡迎的AI公司。
正所謂,「開(kāi)源AI社區(qū)共一石,Meta獨(dú)占八斗」。如果沒(méi)有Meta和LeCun對(duì)于AI開(kāi)源社區(qū)的貢獻(xiàn),整個(gè)AI行業(yè)的格局都會(huì)完全改變。
整個(gè)AI行業(yè)和開(kāi)源AI的未來(lái)的發(fā)展,某種程度上都要倚仗LeCun和小扎繼續(xù)真金白銀的投入,以及不斷地?fù)u旗吶喊。
3. Runway,11000個(gè)贊
視頻生成工具Gen-2,已經(jīng)成為生成式AI視頻領(lǐng)域的標(biāo)桿,每次一發(fā)布更新,都能引起業(yè)內(nèi)不小的震撼。
圖片
從三無(wú)青年到15億美元獨(dú)角獸CEO,Runway CEO的故事,不過(guò)是又一個(gè)「平平無(wú)奇」的硅谷神話。
2018年,Cris Valenzuela(CEO)、Anastasis Germanidis和Alejandro Matamala-Ortiz 在紐約創(chuàng)辦Runway, 今年5月,Runway已完成了1.41億美元的C輪融資,估值達(dá)到15 億美元。
圖片
4. CompVis,10000個(gè)贊
Stable Diffusion,是Stability AI、RunwayML、LMU Munich、EleutherAI 和LAION的研究人員合作的結(jié)果。
在CompVis領(lǐng)導(dǎo)下的Stable Diffusion V1,改變了開(kāi)源AI模型的性質(zhì),在全球范圍內(nèi)催生出了數(shù)百個(gè)其他模型和創(chuàng)新。
Runway的Patrick Esser和LMU 慕尼黑的Robin Rombach領(lǐng)導(dǎo)了這個(gè)項(xiàng)目,他們?cè)诤5卤ご髮W(xué)CompVis小組的研究奠定了這個(gè)項(xiàng)目的基礎(chǔ)。
在海德堡大學(xué),他們創(chuàng)建了廣泛使用的VQGAN和Latent Diffusion。這兩個(gè)模型再加上OpenAI和Google Brain的成果,使Stable Diffusion得以實(shí)現(xiàn)。
5. 清華KEG,7,000個(gè)贊
清華KEG實(shí)驗(yàn)室,一直是國(guó)內(nèi)AI技術(shù)的領(lǐng)頭羊。
中國(guó)頂尖開(kāi)源大模型ChatGLM2-6B,可以說(shuō)是清華系的ChatGPT,由清華知識(shí)工程研究室和智譜AI訓(xùn)練。
圖片
ChatGLM2-6B允許免費(fèi)商用后,我國(guó)的開(kāi)源大模型也開(kāi)啟了「安卓時(shí)刻」。
而清華系17人,則直接撐起了中國(guó)大模型創(chuàng)業(yè)的半壁江山。
圖片
6. BigScience,7,000個(gè)贊
BigScience Research Workshop,不是正式成立的實(shí)體,而是由HuggingFace、GENCI和IDRIS發(fā)起的開(kāi)放式協(xié)作組織,以及一個(gè)同名的LLM研討會(huì),匯聚了全球1000+研究人員。
這1000多名志愿研究者,在BigScience項(xiàng)目中創(chuàng)建了擁有1760億參數(shù)的模型BLOOM。
圖片
BLOOM是BigScience Large Open-science Open-access Mul-tilingual Language Model首字母的縮寫(xiě),全名代表著大科學(xué)、大型、開(kāi)放科學(xué)、開(kāi)源的多語(yǔ)言大模型。
7. 阿聯(lián)酋技術(shù)創(chuàng)新研究所,7000個(gè)贊
阿聯(lián)酋技術(shù)創(chuàng)新研究所隸屬于阿布扎比政府先進(jìn)技術(shù)研究委員會(huì) (ATRC) ,負(fù)責(zé)監(jiān)督酋長(zhǎng)國(guó)的技術(shù)研究。
圖片
2023年9月6日,阿聯(lián)酋(UAE)技術(shù)創(chuàng)新研究所(TII)推出Falcon180B,再次突破生成式AI的界限。
Falcon 180B擁有驚人的1800億參數(shù),經(jīng)過(guò)3.5萬(wàn)億個(gè)token的訓(xùn)練,在預(yù)訓(xùn)練LLM的HuggingFace排行榜上名列前茅。甚至,它在各種基準(zhǔn)測(cè)試中,都勝過(guò)了Meta的LaMA 2這種級(jí)別的競(jìng)爭(zhēng)對(duì)手,包括推理、編碼、熟練程度和知識(shí)測(cè)試。
圖片
而且作為第一個(gè)有影響力的不限制商用的開(kāi)源模型,F(xiàn)alcon用中東金主爸爸的豪氣,把開(kāi)源模型的限制徹底打下來(lái)了。
這就不奇怪為什么開(kāi)源社區(qū)對(duì)他們好感爆棚。
8. 微軟,6500個(gè)贊
在ChatGPT大爆發(fā)之后,突然化身「創(chuàng)業(yè)公司」的微軟,成為了硅谷大廠中今年最亮的一顆星。
微軟快速跟進(jìn),利用大模型能力改造了Bing,加班加點(diǎn)推出Copilot,并把他們?nèi)M(jìn)了自家的拳頭產(chǎn)品Office和Windows之中,給科技圈秀了一把這家「年近50」科技巨頭的「狼性」。
圖片
另一邊,微軟Azure作為云計(jì)算行業(yè)的頭部玩家,無(wú)縫駛?cè)肓薃I算力需求的快車道。
他們和Meta合作,對(duì)Llama 2等開(kāi)源模型提供的良好支持,也進(jìn)一步刷了一波在開(kāi)源社區(qū)的好感度和存在感。
在最近的OpenAI驚天宮斗系列劇中,微軟差點(diǎn)通過(guò)「OpenAI 0元購(gòu)」,成為了AI賽道的「終極寡頭」。
圖片
9. Google AI,6000個(gè)贊
作為對(duì)于AI技術(shù)投入最早也最大的科技巨頭,谷歌在AI社區(qū)中的影響力不用懷疑。
圖片
從AI基礎(chǔ)研究到AI產(chǎn)品,谷歌早已渾身上下都流淌著AI的血液。
DeepMind在強(qiáng)人工智能領(lǐng)域不斷地取得令人矚目的突破,谷歌云作為AI算力提供商是AI行業(yè)的基礎(chǔ)設(shè)計(jì)建設(shè)中最重要的一環(huán)。
雖然谷歌Bard和Palm大模型暫時(shí)在競(jìng)爭(zhēng)之中不占優(yōu)勢(shì),但傳說(shuō)中的Gemini似乎遲早要將谷歌拉回AI行業(yè)舞臺(tái)的最中心。
圖片
而對(duì)于開(kāi)源社區(qū)的發(fā)展,谷歌的貢獻(xiàn)同樣功不可沒(méi),無(wú)數(shù)的開(kāi)源項(xiàng)目已經(jīng)成為AI開(kāi)源社區(qū)的基石。
圖片
10. OpenAI,4000個(gè)贊
作為AI行業(yè)今年大爆發(fā)的直接引領(lǐng)者,OpenAI的地位是毋庸置疑的。
雖然被調(diào)侃為「ClosedAI」,但是OpenAI對(duì)于AI開(kāi)源社區(qū)的貢獻(xiàn)也是有目共睹的。
Whisper作為開(kāi)源且性能最好的語(yǔ)音識(shí)別模型,幾乎所有相關(guān)的從業(yè)人員都能從中受益。
圖片
希望剛剛結(jié)束了「權(quán)游」的OpenAI,能繼續(xù)瞄準(zhǔn)AGI,為整個(gè)AI行業(yè)開(kāi)拓上限。
11. BigCode Project,4,000個(gè)贊
BigCode是一個(gè)開(kāi)放的科學(xué)合作組織,致力于為編碼應(yīng)用程序進(jìn)行負(fù)責(zé)任的LLM訓(xùn)練。
他們的主要工作有——
StarCoder,一種最先進(jìn)的代碼語(yǔ)言模型。
BigCode項(xiàng)目中的StarCoder,是一個(gè)160億參數(shù)的模型,它使用了80多種編程語(yǔ)言、GitHub問(wèn)題、Git提交和Jupiter 筆記本的一萬(wàn)億個(gè)token。
StarCoder可以通過(guò)聊天進(jìn)行微調(diào),創(chuàng)建一個(gè)性化的編碼助手StarChat。
另外還有OctoPack,用于指令調(diào)優(yōu)大型代碼模型的工件;The Stack,最大的可用預(yù)訓(xùn)練數(shù)據(jù)集,具有外圍代碼;SantaCoder,一個(gè)1.1B參數(shù)的代碼模型。
12. MosaicML,4000個(gè)贊
在今年6月被DataBrick斥資13億刀收購(gòu)的獨(dú)角獸MosaicML,非常引人矚目。
從此,MosaicML的生成式AI平臺(tái)和Databricks的數(shù)據(jù)管理能力結(jié)合,將形成雙贏。
圖片
這家公司創(chuàng)立于21年,僅有62人。
創(chuàng)始人Naveen Rao是創(chuàng)辦的第一家公司Nervana Syatems,被英特爾收購(gòu)。另一位創(chuàng)始人Hanlin Tan,是一位連續(xù)創(chuàng)業(yè)者,曾創(chuàng)立云計(jì)算公司,以及在谷歌、微軟和英特爾擔(dān)任職位。
MosaicML提供了一些開(kāi)源、可商用的LLM,比如MPT模型。
MPT-7B和MPT-30B兩個(gè)模型,是目前最先進(jìn)的開(kāi)源、可商用的LLM之一。
圖片
13. UKP Lab,3000個(gè)贊
UKP Lab(無(wú)處不在的知識(shí)處理實(shí)驗(yàn)室)由Iryna Gurevych教授于2009年創(chuàng)立,是達(dá)姆施塔特工業(yè)大學(xué)計(jì)算機(jī)科學(xué)系的一部分。
圖片
UKP Lab在自然語(yǔ)言處理(NLP)方面開(kāi)展前沿研究,重點(diǎn)關(guān)注大型語(yǔ)言模型、對(duì)話式人工智能、問(wèn)答、跨文檔NLP以及新穎的數(shù)據(jù)集和問(wèn)題定義。
圖片
14. EleutherAI,3000個(gè)贊
EleutherAI成立于2020年7月,由Connor Leahy、Sid Black和Leo Gao創(chuàng)立,從一個(gè)討論GPT-3的Discord服務(wù)器,發(fā)展成為一個(gè)專注于大規(guī)模人工智能研究的非營(yíng)利性研究機(jī)構(gòu)。
圖片
現(xiàn)在,它是是一個(gè)開(kāi)源的社區(qū)人工智能項(xiàng)目,旨在創(chuàng)建一個(gè)完全去中心化的、具有自治文明的單例人工智能。任何能連接互聯(lián)網(wǎng)且有GitHub帳戶的人都可以參與。
2021年,EleutherAI發(fā)布了The Pile,是一個(gè)825GB的多樣化文本數(shù)據(jù)集。
2021年6月,EleutherAI公布了GPT-J,它是一個(gè)60億參數(shù)的模型,在Pile上訓(xùn)練。發(fā)布時(shí),它是世界上最大的公開(kāi)GPT-3風(fēng)格的語(yǔ)言模型。
隨著GPT-NeoX的出現(xiàn),EleutherAI計(jì)劃將參數(shù)一直提高到1750億,發(fā)起了爭(zhēng)奪最大GPT-3模型的挑戰(zhàn)賽。
2023年4月,它發(fā)布了Pythia系列大模型。
15. Salesforce,3000個(gè)贊
Salesforce,是創(chuàng)建于1999年3月的一家客戶關(guān)系管理(CRM) 軟件服務(wù)提供商,總部設(shè)于美國(guó)舊金山,可提供隨需應(yīng)用的客戶關(guān)系管理平臺(tái)。
創(chuàng)始人是Marc Benioff。27歲時(shí),他就成為Oracle歷史上最年輕的高級(jí)副總裁。
圖片
正是因?yàn)轭A(yù)見(jiàn)到,會(huì)有越來(lái)越多的企業(yè)通過(guò)互聯(lián)網(wǎng)得到軟件服務(wù),他才選擇離開(kāi)Oracle,在37歲時(shí)創(chuàng)立Slesforce。
他提出了云計(jì)算和SaaS的理念,被譽(yù)為「軟件終結(jié)者」。
當(dāng)下Salesforce正在推出AI功能,試圖將人工智能整合到辦公空間即時(shí)通訊應(yīng)用Slack等產(chǎn)品中,并為銷售人員等推出了一款名為Einstein GPT的生成式人工智能產(chǎn)品。
圖片
Benioff稱,「我們非??释_保Salesforce成為第一大人工智能CRM?!?/p>
參考資料:
https://twitter.com/osanseviero/status/1727260746289905920