編輯 | 伊風(fēng)
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
開(kāi)源了!
3月11日,馬斯克曾發(fā)表了一篇“字少事大”的推文,并且設(shè)為了置頂。就一句話:xAI要在本周開(kāi)源自家聊天機(jī)器人 Grok了。
消息一出,關(guān)注著Musk VS. OpenAI的吃瓜群眾立馬表示了熱烈的歡迎。經(jīng)過(guò)漫長(zhǎng)的等待,Grok終于在當(dāng)?shù)貢r(shí)間周日發(fā)布了開(kāi)源!
Grok-1,參數(shù)量達(dá)到了3140億的混合專家(MoE)模型,體量大于OpenAI GPT-3.5的1750億,成為參數(shù)量最大的開(kāi)源大語(yǔ)言模型。
圖片
保持了馬斯克一貫的幽默、諷刺作風(fēng),Grok用約會(huì)軟件上“weights in my bio”(我的體重寫在簡(jiǎn)介里了)作梗,來(lái)表示公開(kāi)了模型的權(quán)重。
而OpenAI則趕來(lái)指責(zé)道“你們偷了我的笑話!”
馬斯克則回應(yīng)道,“還是來(lái)聊聊OpenAI里Open的事情吧!”
這樣的“一唱一和”也許正是馬斯克開(kāi)源Grok想要達(dá)到的效果——繼續(xù)對(duì)OpenAI進(jìn)行挖苦,以為自己的訴訟博得更多的輿論支持。
看來(lái),這場(chǎng)AI大戲還將繼續(xù)。且看Grok是否能成為一枚優(yōu)秀的棋子,為馬斯克拿下一城吧。
1、Grok究竟“open”到什么程度?
一句話總結(jié),雖然不是完全開(kāi)源,但已做得相當(dāng)不錯(cuò)。
早前,馬斯克宣布開(kāi)源時(shí),并未透露“開(kāi)源”的具體含義。
眾所周知,許多開(kāi)源大模型其實(shí)處于“偽開(kāi)源”的狀態(tài),雖然它會(huì)提供一些開(kāi)源的表面特征,如模型權(quán)重和基礎(chǔ)代碼,但并不開(kāi)源完整的訓(xùn)練代碼、數(shù)據(jù)集和訓(xùn)練過(guò)程等關(guān)鍵信息。此前,阿里的EMO項(xiàng)目就曾因?yàn)樵贕itHub上并沒(méi)有公開(kāi)任何代碼,而引起爭(zhēng)議,被社區(qū)成員戲稱其為“空殼開(kāi)源”。
Grok的開(kāi)放程度自然而然地成為關(guān)注焦點(diǎn)。有網(wǎng)友追問(wèn)馬斯克是否能獲得訓(xùn)練數(shù)據(jù)。
圖片
更有網(wǎng)友列出了一個(gè)完全開(kāi)源的模型應(yīng)該公開(kāi)信息的list,真的是很貼心了(手動(dòng)狗頭)。
圖片
根據(jù)Grok所公開(kāi)的消息,Grok是未經(jīng)微調(diào)的基礎(chǔ)模型,由8 個(gè)專家(2 個(gè)活躍狀態(tài))組成。Grok的活躍參數(shù)達(dá)860億,僅這部分就超過(guò)了Meta開(kāi)源的Llama2模型的總參數(shù)量,這反映了Grok在特定輸入下具備相當(dāng)高的計(jì)算效率和模型復(fù)雜度。
同時(shí),Grok開(kāi)源所遵守的Apache 2.0 許可證,將允許用戶自由地使用、修改和分發(fā)軟件,無(wú)論是個(gè)人使用還是商業(yè)用途。并且,在企業(yè)使用過(guò)程中,可以保留對(duì)修改后軟件的版權(quán),這在一定程度上減少了“在別人的地基上造房子”的風(fēng)險(xiǎn)。
然而,在Grok的開(kāi)源信息中,還是缺少了訓(xùn)練代碼以及可重現(xiàn)的數(shù)據(jù)集,開(kāi)放程度遜色于Bloom 和 OLMo等模型。
2、Grok,為挑戰(zhàn) OpenAI而生
Grok的開(kāi)源讓矛頭又指向了OpenAI。
在Grok開(kāi)源的同一天,奧特曼發(fā)了一條推文表示“今年是人類歷史上最有趣的一年,除了未來(lái)的所有年份”。
圖片
而網(wǎng)友則在評(píng)論區(qū)配上梗圖,辛辣地諷刺道“我們還有未來(lái),對(duì)吧?”,以表達(dá)對(duì)AGI安全問(wèn)題的擔(dān)憂。
而這也是馬斯克這場(chǎng)AI訴訟的核心。
在Grok誕生之前,馬斯克就與OpenAI多次開(kāi)杠,甚至攻擊OpenAI“訓(xùn)練AI說(shuō)謊”。隨即馬斯克宣布自己將推出一個(gè)名為“TruthGPT”的人工智能平臺(tái),作為ChatGPT的挑戰(zhàn)者。
在馬斯克的設(shè)想中,TruthGPT將是一個(gè)“最大限度尋求真理的人工智能”,旨在理解宇宙的本質(zhì)。他認(rèn)為這樣的AI不太可能消滅人類,因?yàn)槿祟愂怯钪嬷杏腥さ囊徊糠帧?/p>
最終,“TruthGPT”被定名為Grok,并于去年11月正式上線。新名稱Grok取自羅伯特?安森?海因萊因的科幻小說(shuō)《異鄉(xiāng)異客》,意思是完全理解某事或某人。寄托了馬斯克希望 AI 能超越機(jī)械的信息處理,真正理解人類的情感和需求的愿望。
因此,Grok會(huì)將“人格魅力”作為對(duì)話機(jī)器人的賣點(diǎn)也就不奇怪了。Grok反對(duì)其他大模型所遵守的“政治正確”,力圖回答其他AI會(huì)拒絕回答的尖銳問(wèn)題?,F(xiàn)在的Grok仍然保留了“常規(guī)”和“幽默”兩種模式,供用戶進(jìn)行選擇。
馬斯克曾多次發(fā)推文親自推銷Grok的訂閱服務(wù)。目前X會(huì)員用戶可以訪問(wèn)Grok,費(fèi)用為16美元/月,略低于競(jìng)爭(zhēng)對(duì)手GPT-4的20美元/月。
Grok背靠全球社交巨頭X平臺(tái),好處多多,不僅有了一個(gè)巨大的用戶池作為其接口,也使得模型可以通過(guò) X 獲取實(shí)時(shí)信息。如果問(wèn)Grok "今天人工智能領(lǐng)域發(fā)生了什么?",Grok 會(huì)從社交媒體中的頭條新聞中組織出答案,而 ChatGPT 受限于其訓(xùn)練數(shù)據(jù)的時(shí)間范圍只能含糊其辭。
3、開(kāi)源與閉源周旋久,孰贏?
OpenAI和馬斯克的訴訟引發(fā)了許多技術(shù)專家和投資者對(duì)人工智能開(kāi)源or閉源的爭(zhēng)論。Grok的開(kāi)源再次把這些爭(zhēng)議炒熱。
開(kāi)源模型對(duì)大模型發(fā)展的重要性不言而喻。此前曾有人判斷,隨著時(shí)間的推移,開(kāi)源大模型中終會(huì)跑出王者,將OpenAI甩到身后。因?yàn)闊o(wú)數(shù)程序員的調(diào)用和調(diào)優(yōu)所做出的貢獻(xiàn),要遠(yuǎn)超一小撮硅谷精英所能做的工作。就像今天的Android之于蘋果一樣。
華盛頓郵報(bào)也推測(cè),馬斯克開(kāi)源Grok的舉動(dòng),可能是希望借由開(kāi)源讓該模型的使用量上升,同時(shí)獲得來(lái)自開(kāi)發(fā)者群體的反饋。
同時(shí),開(kāi)源也有益于提高AI技術(shù)的透明度和可信賴性,能夠在一定程度上解決馬斯克反復(fù)提及的AI安全與道德問(wèn)題。
現(xiàn)在,xAI已經(jīng)加入到Meta和Mistral的開(kāi)源行列中去。而馬斯克領(lǐng)導(dǎo)的另一家公司特斯拉(Tesla)也公布過(guò)許多專利開(kāi)源,他曾在 2014 年表示:"特斯拉不會(huì)對(duì)任何真誠(chéng)希望使用我們技術(shù)的人提起專利訴訟。”
當(dāng)然,支持閉源的聲音將一直存在并有其道理。OpenAI投資者Vinod Khosla曾公開(kāi)表示,馬斯克的法律訴訟是 "對(duì)實(shí)現(xiàn) AGI 目標(biāo)及其益處的巨大干擾"。如果OpenAI不采用閉源+盈利的路線,他們就無(wú)法維持當(dāng)前頂級(jí)的人才號(hào)召力,也無(wú)法以最大的推力前進(jìn),帶著AI一路狂飆到新天地。
科技界兩大巨頭之間的訴訟已經(jīng)觸及了人工智能安全性和可及性的核心問(wèn)題,這些爭(zhēng)論不休的問(wèn)題將蔓延到范圍更廣的初創(chuàng)企業(yè)。
雖然官司的走向尚不明朗,但是對(duì)于AI問(wèn)題的持續(xù)關(guān)注與爭(zhēng)論必然是有其意義的。
謝謝馬斯克。






































