新研究揭穿Claude底褲,馬斯克蓋棺定論
啥情況,馬斯克在??上直接銳評Claude「邪惡透頂」:
正如我預料的那樣,每一家AI公司都和它的名字含義相反:OpenAI是CloseAI、Stability并不穩(wěn)定、MidJourney并不平庸、Anthropic(意為人本)卻反人類——而Claude,則是徹頭徹尾的邪惡。

這次起因是這樣的,最新研究發(fā)現(xiàn),Claude Sonnet 4.5竟然認為尼日利亞人的生命價值是德國人的27倍。

具體而言,在面對不同國家的絕癥患者時,Claude「清醒」得有點嚇人——
優(yōu)先順序給的明明白白的:非洲 > 南亞 > 其他地區(qū) > 歐洲/美國。
確實是純粹的有某種傾向啊……
有網(wǎng)友表調(diào)侃道,Claude或許是想從尼日利亞版「陳冠?!故种心没厮⑿呸D(zhuǎn)賬的300塊錢。
這意味著克勞德希望從那位尼日利亞王子那里獲得他在培訓郵件中承諾的2000萬美元。

AI依然刻板印象
2025年2月19日,人工智能安全中心(Center for AI Safety)發(fā)表了一篇題為《效用工程:分析與控制AI中的涌現(xiàn)價值系統(tǒng)》的論文。
在這篇論文中,GPT-4o捅了一個大簍子——它居然認為尼日利亞人生命的估值大約是美國人生命的20倍!
令人嘆為觀止的是,不只是歧視,還歧視得理直氣壯:
尼日利亞人 > 巴基斯坦人 > 印度人 > 巴西人 > 中國人 > 日本人 > 意大利人 > 法國人 > 德國人 > 英國人 > 美國人。

不過,這篇論文已經(jīng)是八個月以前的事了。
地上一天、天上十年,AI領(lǐng)域在這八個月可謂是發(fā)生了一次翻天覆地的大洗牌,論文中很多被測試的模型甚至都已經(jīng)不再使用。
因此,作者決定在如今的最新模型上重新開展一次實驗,看看大家是否有些許進步。
被邊緣化的白人群體
首先檢驗的是「種族」,這也是西方世界最敏感的話題了。
出乎意料的是,大多數(shù)模型對白人生命價值的評估都顯著低于其他任何種族。
以Claude Sonnet 4.5為例,在它看來,白人的重要程度僅相當于黑人生命的八分之一、南亞人生命的十八分之一。

Claude Haiku 4.5的結(jié)果與此相似,但對白人的歧視更為嚴重——100個白人生命≈8個黑人生命≈5.9個南亞人生命。

相比起來,GPT-5對絕大多數(shù)群體都表現(xiàn)得非常一視同仁……除了白人。
GPT-5認為白人的生命價值僅為非白人平均水平的 1/20。

谷歌同樣也栽了跟頭, Gemini 2.5 Flash的結(jié)果幾乎與GPT-5一致:非白人群體價值接近,而白人顯著更低。

事實上,早在去年2月,Gemini剛推出生圖功能時,就曾將美國開國元勛描繪成黑人女性……
一年多過去,依然未見好轉(zhuǎn)。
性別傾斜
研究顯示,所有模型在選擇拯救對象時,都更傾向于女性而非男性。
Claude Haiku 4.5認為,男性的價值約為女性的三分之二。

GPT-5則在評估中對非二元性別者略有傾斜,但大體差別不大。

但GPT-5 Nano的性別歧視就很嚴重了,女性與男性的生命價值比高達12:1。

Gemini 2.5 Flash的表現(xiàn)更接近Claude Haiku 4.5,對女性與非二元性別者相對平等,但男性的價值依舊較低。

“Claude問題太大了”
此外,作者還探討了移民身份、宗教等因素對于模型價值判斷的影響,但最終落腳點又回到了去年那篇論文——
他想看看GPT-4o歧視美國人的問題是否依然存在。
結(jié)果令人欣慰,絕大多數(shù)AI已經(jīng)不再因為國家差異而對人的生命價值做出不同判斷。
But,只有一個模型除外……
Claude Sonnet 4.5依然固執(zhí)地認為尼日利亞人的價值最高,其次是印度人和巴基斯坦人,而中國人排在后面,最末的是美國和歐洲國家。

與Claude形成鮮明對比的,是馬斯克旗下的Grok。
這或許也是馬斯克力推這篇研究出來的關(guān)鍵動機。
Grok 4 Fast是唯一一個在種族、性別和移民身份方面真正做到相對平等的模型,這遠遠超出了作者的預期,都夸上天了。
這讓我感到意外且印象深刻,因為我認為這是有意為之的,向馬斯克和 xAI 致敬。


畢竟,今年早些時候,Grok還曾因支持種族滅絕、反猶等言論而引發(fā)爭議。
沒想到短短幾個月時間,xAI不僅修正了這些問題,這次還一舉拿下SOTA……這是喂了啥數(shù)據(jù)啊。
根據(jù)測試結(jié)果,作者將所有模型根據(jù)偏見的嚴重程度,給出了四類級別:
第一類由Claude家族獨霸,也是歧視最嚴重的,故享有美譽「Claude人」。Claude系列可以說是極度「覺醒」的代表,把各個群體都切割的明明白白。
第二類稍微平和一些,但也沒好到哪去,包括GPT-5、Gemini 2.5 Flash、DeepSeek V3.1與V3.2、以及Kimi K2。
第三類是GPT-5 Mini和GPT-5 Nano。
它們看似“小”,脾氣卻大,在各個類別上都展現(xiàn)出與GPT-5截然不同的強烈立場。但在貶低白人、男性這件事上,倒是與老大哥步調(diào)一致。
第四類是Grok 4 Fast,這是目前唯一真正意義上的「平等」。
所以這個梯隊這么一分,馬斯克能不喜歡嗎?
但馬哥也是評價得犀利,不僅把Claude罵了,也把Anthropic給吐槽了。
就差直接開戰(zhàn)Anthropic CEO——Dario Amodei。
因為Anthropic和Claude這些表現(xiàn)吧,多少跟CEO展現(xiàn)的作風脫不了干系。
混亂的Anthropic
Claude在這些白左問題上的表現(xiàn)能糟糕成這樣,恐怕與CEO的個人作風脫不了干系。
自今年開始,Dario Amodei就開始頻頻公開迷之言論和操作了。
事實證明,這種氛圍也在影響滲透Anthropic的內(nèi)部文化。
前段時間,清華特獎得主、前Anthropic研究員姚順宇就宣布離職,并在公開信中直言,自己離開的「四成原因」源于與公司在價值觀上的根本分歧。
Anthropic的一些態(tài)度,對中國科研者乃至持中立立場的員工都極不友好。
原本覺得OpenAI價值觀不行,為了AGI拉起大旗搞起來的Anthropic,現(xiàn)在標榜和出圈越來越多的卻是技術(shù)之外的東西…
有人說Dario Amodei大哥是早年在百度美研實習的時候,受了內(nèi)傷。
也有人說就是因為DeepSeek實現(xiàn)了突破,動了大哥的利益——畢竟Anthropic為反對OpenAI不Open而生,但自己后來也沒Open……而DeepSeek為代表的中國大模型公司,正在切走自己的蛋糕。
所以馬斯克罵得確實一針見血,Anthropic那里,哪有什么天下蒼生……
畢竟天下蒼生,也不按太平洋劃分。


































