舉報(bào)人「自殺」,OpenAI表示震驚!NYU教授發(fā)長(zhǎng)文悼念:警鐘仍在回響
幾天前,消息曝出,曾在OpenAI工作四年,指控公司侵犯版權(quán)的Suchir Balaji,上月底在舊金山公寓中被發(fā)現(xiàn)死亡,年僅26歲。
Suchir Balaji曾參與了ChatGPT后訓(xùn)練、GPT-4預(yù)訓(xùn)練,以及o1推理的研發(fā)工作。
今年10月,他在自己的一篇博文和「紐約時(shí)報(bào)」的專(zhuān)訪中指出,OpenAI在使用新聞和其他網(wǎng)站的信息訓(xùn)練其AI模型時(shí),違反了「合理使用」原則。
目前,OpenAI的發(fā)言人已經(jīng)證實(shí)了Balaji的離世,并在郵件中表達(dá)了沉痛的哀悼。
而正與OpenAI CEO奧特曼陷入法律糾紛的馬斯克,則在X平臺(tái)上發(fā)了一個(gè)耐人尋味的 「Hmm」。
在消息曝出當(dāng)日,馬庫(kù)斯迅速在X上發(fā)帖悼念:
「Suchir Balaji是個(gè)很好的年輕人?!?/span>
「這是悲劇?!?/span>
第二天,他專(zhuān)門(mén)撰寫(xiě)了一篇博客,來(lái)紀(jì)念Suchir Balaji。
紀(jì)念Suchir Balaji(1998 - 2024)
11月初,馬庫(kù)斯通過(guò)Zoom與畢業(yè)于伯克利的前OpenAI員工Suchir Balaji,進(jìn)行了一次富有啟發(fā)性的交談。
讓人痛心的是,他在短短三周之后,便離開(kāi)了這個(gè)世界。
根據(jù)警方報(bào)告,這似乎是一起自殺事件。
馬庫(kù)斯表示,關(guān)于二人的通話內(nèi)容,可以不違背保密原則地說(shuō):「Suchir Balaji對(duì)OpenAI和版權(quán)問(wèn)題表示擔(dān)憂;而正是由于這些共同的顧慮,他們才得以相識(shí)?!?/span>
在10月的個(gè)人博客里,Balaji發(fā)表了一篇文章,探討了我們這個(gè)時(shí)代最重要的問(wèn)題之一:生成式AI是否符合「合理使用」(fair use)的標(biāo)準(zhǔn)?
博文地址:https://suchir.net/fair_use.html
在這篇博文中,Balaji詳細(xì)分析了美國(guó)《1976年版權(quán)法》第107條中定義的四個(gè)合理使用因素,特別關(guān)注了以下兩個(gè)因素:
1. 使用的目的和性質(zhì):Balaji指出,ChatGPT等生成式AI模型的商業(yè)性質(zhì)可能不利于被視為合理使用。
2. 對(duì)受版權(quán)保護(hù)作品潛在市場(chǎng)或價(jià)值的影響:他引用了一些研究,論證ChatGPT的出現(xiàn)可能對(duì)某些在線知識(shí)社區(qū)(如Stack Overflow)的流量和用戶(hù)參與度產(chǎn)生負(fù)面影響,進(jìn)而影響這些平臺(tái)的市場(chǎng)價(jià)值。
其實(shí),AI訓(xùn)練數(shù)據(jù)的版權(quán)問(wèn)題早已存在。一年前,當(dāng)《紐約時(shí)報(bào)》起訴OpenAI并證實(shí)了其輸出內(nèi)容與網(wǎng)站上的部分報(bào)道高度相似時(shí),OpenAI在文本和版權(quán)方面的問(wèn)題就已經(jīng)開(kāi)始凸顯。
類(lèi)似的現(xiàn)象也出現(xiàn)在圖像和視頻生成領(lǐng)域。今年一月,馬庫(kù)斯和Reid Southen在《IEEE Spectrum》上揭示了圖像生成軟件(如Midjourney和DALL-E)存在的類(lèi)似問(wèn)題。
他們發(fā)現(xiàn)的最令人震驚的現(xiàn)象是,即便沒(méi)有直接點(diǎn)名,系統(tǒng)也會(huì)產(chǎn)生類(lèi)似抄襲商業(yè)角色的復(fù)制品。
比如,輸入「意大利水管工」就會(huì)生成任天堂的馬里奧角色,而指令里完全沒(méi)有提到馬里奧這個(gè)名字。
相比之下,真正的藝術(shù)家理應(yīng)會(huì)創(chuàng)造一個(gè)全新的、原創(chuàng)的水管工形象。
將近一年過(guò)去了,明顯的侵權(quán)問(wèn)題依然存在。
OpenAI最新發(fā)布的視頻生成模型Sora與其他AI一樣,顯然是在大量受版權(quán)保護(hù)的材料上進(jìn)行了訓(xùn)練。
與前代產(chǎn)品相似,它也會(huì)不時(shí)產(chǎn)生缺乏創(chuàng)意、近似抄襲的輸出,就像Southen生成的這些例子:
超級(jí)英雄復(fù)仇的電影場(chǎng)景
一個(gè)有意大利人的橫版游戲
無(wú)獨(dú)有偶,TechCrunch也在幾天前指出了相同的問(wèn)題。報(bào)道稱(chēng),OpenAI從未公開(kāi)Sora所使用的訓(xùn)練數(shù)據(jù)來(lái)源,但從目前的結(jié)果來(lái)看,至少有部分?jǐn)?shù)據(jù)可能來(lái)自Twitch直播和電子游戲?qū)崨r。
法律專(zhuān)家警告:OpenAI疑似將游戲內(nèi)容用作Sora訓(xùn)練數(shù)據(jù)恐將引發(fā)法律爭(zhēng)議
比如,它可以生成類(lèi)似于使命召喚和反恐精英風(fēng)格的第一人稱(chēng)射擊游戲片段。
還有充滿(mǎn)90年代《忍者神龜》風(fēng)格的街機(jī)格斗游戲片段。
Sora似乎還對(duì)Twitch直播的格式有所了解。下面這張視頻截圖中可以看到,大體的布局和細(xì)節(jié)都得到了還原。
甚至,這張截圖中出現(xiàn)了著名Twitch主播Raúl álvarez Genes(網(wǎng)名Auronplay)的影像,甚至連他左臂的紋身都被「復(fù)刻」了出來(lái)。
這些版權(quán)問(wèn)題的嚴(yán)重性已經(jīng)不言而喻。Suchir的擔(dān)憂確實(shí)切中要害。
然而,挑戰(zhàn)既定觀念總是要付出代價(jià)的。
正如《印度時(shí)報(bào)》所指出的,Suchir「對(duì)OpenAI涉嫌侵犯版權(quán)的公開(kāi)批評(píng)...使他的離世備受關(guān)注,引發(fā)人們對(duì)敢于反對(duì)強(qiáng)大科技企業(yè)的人所承受的壓力和挑戰(zhàn)的深思」。
雖然我們無(wú)從得知他離世的真正原因,但愿人們不會(huì)忘記Suchir的擔(dān)憂和他展現(xiàn)的勇氣。
加州SB-1047舉報(bào)人保護(hù)法案被否決令人遺憾。社會(huì)確實(shí)需要采取更多措施來(lái)保護(hù)像Suchir Balaji這樣的人。
最后,讓我們引用Suchir在十月份博客結(jié)論中的一段話作為結(jié)尾:
在合理使用的四個(gè)構(gòu)成要素中,似乎沒(méi)有任何一項(xiàng)支持ChatGPT可以合理使用其當(dāng)前的訓(xùn)練數(shù)據(jù)。
然而,這些論據(jù)本質(zhì)上并非僅針對(duì)ChatGPT,類(lèi)似的論點(diǎn)同樣適用于各個(gè)領(lǐng)域中的眾多生成式AI產(chǎn)品。