偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

生成式AI浪潮下的開源新思考

譯文 精選
人工智能
如今,生成式 AI 帶來了全新的技術(shù)和倫理挑戰(zhàn)。它正在改變我們對(duì)"開放"的理解。我們需要重新思考開源模式,不是要放棄開源,而是讓它適應(yīng)新時(shí)代。

譯者 | 劉汪洋

審校 | 重樓

開源軟件是什么?簡(jiǎn)單說,就是源代碼對(duì)所有人開放,任何人都能自由使用和修改的軟件開發(fā)方式。這個(gè)理念從誕生起就推動(dòng)著技術(shù)創(chuàng)新。

1983 年,軟件開發(fā)者理查德·斯托曼(Richard Stallman)因無法獲取一臺(tái)出現(xiàn)故障的閉源打印機(jī)的源代碼而感到沮喪。正是這次經(jīng)歷,催生了自由軟件運(yùn)動(dòng)。從那時(shí)起,開源生態(tài)系統(tǒng)一步步發(fā)展壯大,成為今天互聯(lián)網(wǎng)和軟件創(chuàng)新的重要推動(dòng)力。

但這已經(jīng)是 40 多年前的事了。

如今,生成式 AI 帶來了全新的技術(shù)和倫理挑戰(zhàn)。它正在改變我們對(duì)"開放"的理解。我們需要重新思考開源模式,不是要放棄開源,而是讓它適應(yīng)新時(shí)代。

AI 與開源自由

傳統(tǒng)開源軟件有四項(xiàng)基本自由:運(yùn)行、研究、修改和重新分發(fā)任何軟件代碼。但生成式 AI 的特性與這些自由原則存在根本沖突:

  • 運(yùn)行方面:AI 模型需要強(qiáng)大的基礎(chǔ)設(shè)施和巨額計(jì)算成本。很多人根本跑不起,這就等于限制了訪問。
  • 研究和修改方面:AI 模型極其復(fù)雜。如果拿不到代碼和訓(xùn)練數(shù)據(jù),想要理解和修改它們幾乎是不可能的。
  • 重新分發(fā)方面:許多 AI 模型從設(shè)計(jì)上就不讓你隨意分發(fā),特別是那些包含訓(xùn)練權(quán)重和專有數(shù)據(jù)集的模型。

這些限制并不是故意的,而是現(xiàn)代 AI 系統(tǒng)的復(fù)雜性和成本造成的。訓(xùn)練最先進(jìn)的 AI 模型實(shí)在太燒錢了。據(jù)說 OpenAI 的 GPT-4 訓(xùn)練成本高達(dá) 7800 萬美元,這還不包括員工工資,總支出超過了 1 億美元。

“開源” AI 的復(fù)雜局面

真正開放的 AI 模型應(yīng)該包括什么?推理源代碼、訓(xùn)練源代碼、模型權(quán)重和訓(xùn)練數(shù)據(jù)——這些都要完全透明才行。

但現(xiàn)實(shí)中,很多打著"開放"旗號(hào)的模型只是發(fā)布了推理代碼或部分權(quán)重。有些提供有限許可,有些完全不讓商業(yè)使用。

這種不完全的開放做法給人開源的錯(cuò)覺,但實(shí)際上根本達(dá)不到要求。

開放源代碼促進(jìn)會(huì)(Open Source Initiative,OSI)分析發(fā)現(xiàn),幾個(gè)聲稱開源的熱門大語言模型——包括 Llama2 和 Llama 3.x(Meta 開發(fā))、Grok(X)、Phi-2(微軟)和 Mixtral(Mistral AI)——在本質(zhì)上都不符合開源原則。

可持續(xù)性和激勵(lì)難題

傳統(tǒng)開源軟件主要靠志愿者或資助資金支持,不需要太多基礎(chǔ)設(shè)施投入。但 AI 模型不一樣——訓(xùn)練和維護(hù)成本高昂,而且還在不斷上漲。

Anthropic 的 CEO 達(dá)里奧·阿莫迪(Dario Amodei)預(yù)測(cè),訓(xùn)練一個(gè)頂級(jí)模型最終可能要花 1000 億美元 。

沒有可持續(xù)的資金模式,開發(fā)者陷入了兩難境地:要么通過閉源或非商業(yè)許可來限制訪問,要么冒著財(cái)務(wù)崩潰的風(fēng)險(xiǎn)。

"開放權(quán)重"和許可的混亂現(xiàn)狀

AI 模型的可訪問性越來越讓人困惑。許多平臺(tái)自稱"開放",但實(shí)際上施加了各種限制,這完全違背了真正的開源精神。

這種"掛羊頭賣狗肉"的做法有很多表現(xiàn):

  • 一些標(biāo)記為"開放權(quán)重"的模型完全禁止商業(yè)使用。這讓它們更像學(xué)術(shù)研究工具,而不是供大家探索開發(fā)的實(shí)用商業(yè)工具。
  • 有些提供商給你預(yù)訓(xùn)練模型的訪問權(quán),但嚴(yán)格保護(hù)訓(xùn)練數(shù)據(jù)集和方法。這樣一來,你根本沒法復(fù)制或驗(yàn)證他們的研究成果。
  • 許多平臺(tái)不讓你重新分發(fā)模型,阻止開發(fā)者在模型基礎(chǔ)上構(gòu)建或改進(jìn),即使你能完全"訪問"代碼。

在這些情況下,“研究開放”不過是“商業(yè)封閉”的委婉表達(dá)。結(jié)果就是一種隱性的供應(yīng)商綁定——組織在看似開放的平臺(tái)上投入時(shí)間和資源,但在嘗試擴(kuò)展或商業(yè)化應(yīng)用時(shí)才發(fā)現(xiàn)各種限制。

這種混亂不只是讓開發(fā)者覺得煩。它嚴(yán)重?fù)p害了人們對(duì) AI 生態(tài)系統(tǒng)的信任。利益相關(guān)者合理地認(rèn)為"開放" AI 應(yīng)該和開源軟件社區(qū)一樣,保證透明度、修改權(quán)和商業(yè)自由。但現(xiàn)實(shí)卻讓他們失望。

法律沒跟上技術(shù)發(fā)展

生成式 AI 發(fā)展得太快,相關(guān)法律框架沒跟上,產(chǎn)生了一堆復(fù)雜的知識(shí)產(chǎn)權(quán)問題。

第一個(gè)主要爭(zhēng)議圍繞訓(xùn)練數(shù)據(jù)的使用。深度學(xué)習(xí)模型從互聯(lián)網(wǎng)獲取大量數(shù)據(jù),比如公開圖像和網(wǎng)頁文本。這種大規(guī)模數(shù)據(jù)收集引發(fā)了激烈的知識(shí)產(chǎn)權(quán)爭(zhēng)論。

技術(shù)公司說他們的 AI 系統(tǒng)是在"研究和學(xué)習(xí)"受版權(quán)保護(hù)的材料,創(chuàng)造新的、變革性的內(nèi)容。但版權(quán)所有者認(rèn)為這些 AI 公司非法復(fù)制了他們的作品,生成的內(nèi)容威脅到他們的生計(jì)。

AI 生成內(nèi)容的所有權(quán)也是個(gè)法律模糊地帶。除了美國(guó)版權(quán)局聲明"如果內(nèi)容完全由 AI 生成,不能受版權(quán)保護(hù)"外,沒人確切知道如何給 AI 生成的內(nèi)容分類。

因?yàn)榛A(chǔ) AI 模型已經(jīng)成為地緣政治重要工具,所以圍繞生成式 AI 的法律不確定性變得更加復(fù)雜。各國(guó)在競(jìng)相開發(fā)先進(jìn)AI能力的過程中,可能不愿限制數(shù)據(jù)訪問,這使得知識(shí)產(chǎn)權(quán)保護(hù)更為嚴(yán)格的國(guó)家面臨競(jìng)爭(zhēng)劣勢(shì)。

開源在 AI 時(shí)代必須做出改變

生成式 AI 的列車已經(jīng)開動(dòng),而且沒有放緩的跡象。我們希望建設(shè)一個(gè) AI 促進(jìn)創(chuàng)新而不是阻礙創(chuàng)新的未來。

在這種情況下,技術(shù)領(lǐng)導(dǎo)者需要一個(gè)框架來確保安全透明的商業(yè)使用、促進(jìn)負(fù)責(zé)任的創(chuàng)新、解決數(shù)據(jù)所有權(quán)和許可問題,并區(qū)分"開放"和"免費(fèi)"。

一個(gè)新興概念叫"

為了適應(yīng)這個(gè)新現(xiàn)實(shí),開源社區(qū)必須開發(fā) AI 專用的開放許可模式,建立公私合作伙伴關(guān)系來資助這些模式,并建立可信的透明度、安全性和倫理標(biāo)準(zhǔn)。

開源曾經(jīng)改變了世界。生成式 AI 正在再次改變開源。為了保持開放的精神,我們必須更新相關(guān)法律條文,承認(rèn) AI 的獨(dú)特需求,同時(shí)直面挑戰(zhàn),創(chuàng)造一個(gè)包容和可持續(xù)的生態(tài)系統(tǒng)。

譯者介紹

劉汪洋,51CTO社區(qū)編輯,昵稱:明明如月,一個(gè)擁有 5 年開發(fā)經(jīng)驗(yàn)的某大廠高級(jí) Java 工程師。

原文標(biāo)題:Rethinking Open Source in the Age of Generative AI,作者:Dr. Yair Adato

責(zé)任編輯:姜華 來源: 51CTO
相關(guān)推薦

2025-03-21 14:11:19

2025-06-10 08:34:47

B 端軟件生成式 AIMCP

2025-02-18 10:34:36

2023-08-04 08:16:14

2025-06-03 14:19:34

2023-12-01 15:34:34

人工智能

2020-05-12 10:01:10

網(wǎng)絡(luò)安全新基建安全威脅

2024-04-25 15:58:26

生成式AIIT

2023-10-30 11:13:55

2024-01-09 14:00:26

2023-06-18 12:18:57

2024-01-10 16:42:23

人工智能工業(yè)

2023-12-13 16:28:02

2024-03-11 09:55:51

2025-04-10 08:33:05

2024-03-25 13:34:54

2023-04-28 07:39:46

人工智能法案OpenAI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)