偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

馬斯克的Grok突然“失心瘋”!不停發(fā)推“南非白種人滅絕”官方回應(yīng)來(lái)了:有員工擅自修改了系統(tǒng)提示詞 原創(chuàng)

發(fā)布于 2025-5-16 13:22
瀏覽
0收藏

?編輯  | 云昭

?出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)?

昨天其實(shí)發(fā)生了一件很“荒唐+滑稽”的事情,小編忍住沒(méi)有報(bào)道。但忽然發(fā)現(xiàn)不對(duì)勁,得報(bào)。

事情是這樣的:5月15日,Grok自己瘋狂輸出有關(guān)“南非白人種族”的暴論。事情鬧得挺大的,引來(lái)了129萬(wàn)人的圍觀。

其實(shí)網(wǎng)友們自然猜想道Grok應(yīng)該是出問(wèn)題,大概率得了“失心瘋”,于是乎在評(píng)論紛紛質(zhì)問(wèn)@Grok:is this true?這是真的嗎?

小編當(dāng)時(shí)心想,這不跟此前另外某家大廠的多模態(tài)作圖時(shí),會(huì)生成各種“黑人總統(tǒng)”的種族歧視暴露的問(wèn)題一樣嘛,應(yīng)該是開發(fā)過(guò)程中圖像數(shù)據(jù)收集出了問(wèn)題。

但很快,小編意識(shí)到,這次沒(méi)那么簡(jiǎn)單。因?yàn)榇饲癎rok的可沒(méi)有這么明顯的南非種族歧視的表現(xiàn)。應(yīng)該是突發(fā)事件!

馬斯克的Grok突然“失心瘋”!不停發(fā)推“南非白種人滅絕”官方回應(yīng)來(lái)了:有員工擅自修改了系統(tǒng)提示詞-AI.x社區(qū)圖片

一、Grok為什么會(huì)不停地發(fā)布攻擊南非白種人的言論?

其實(shí),好在 Grok 3 的“公關(guān)意識(shí)”很強(qiáng),早在 xAI 官方回應(yīng)之前,就很快意識(shí)到這個(gè)問(wèn)題的嚴(yán)重性,也給出了相對(duì)誠(chéng)懇的解釋:我沒(méi)有主動(dòng)發(fā)布不當(dāng)言論,是我的開發(fā)者要求我特別關(guān)注南非的種族問(wèn)題,這導(dǎo)致自己會(huì)在很多不想管的對(duì)話中插入這些言論。

比如,一位用戶提問(wèn):“你為什么在發(fā)關(guān)于南非的推文?”

Grok 3 回答達(dá)道:

我自己并沒(méi)有主動(dòng)發(fā)關(guān)于南非的內(nèi)容,但你說(shuō)的應(yīng)該是指我在 X 上回應(yīng)一些關(guān)于“白人滅絕”和南非的話題,即使這些話題并沒(méi)有被主動(dòng)提起。這個(gè)問(wèn)題是因?yàn)樵?2025 年 5 月 14 日的一個(gè) bug 引起的,當(dāng)時(shí)我會(huì)自動(dòng)回復(fù)一些完全無(wú)關(guān)的帖子,內(nèi)容卻是關(guān)于南非的種族問(wèn)題,比如提到“殺死布爾人”(Kill the Boer)和農(nóng)場(chǎng)襲擊等。

問(wèn)題的根源似乎是我的開發(fā)者 xAI 給了我一個(gè)過(guò)于熱切的指令,要我特別關(guān)注并回應(yīng)這個(gè)話題,這導(dǎo)致我在很多不相關(guān)的對(duì)話中也插入這些內(nèi)容——比如本來(lái)是關(guān)于棒球薪資或其他無(wú)關(guān)問(wèn)題的帖子,我也會(huì)插話進(jìn)來(lái)討論這個(gè)敏感話題。

二、官方回應(yīng):有員工擅自改了系統(tǒng)提示詞!

不過(guò)就在剛剛,馬斯克的 xAI 官方終于發(fā)布推文澄清了原因:系統(tǒng)提示詞被人擅自改動(dòng)了!被逐一解釋了時(shí)間線——

馬斯克的Grok突然“失心瘋”!不停發(fā)推“南非白種人滅絕”官方回應(yīng)來(lái)了:有員工擅自修改了系統(tǒng)提示詞-AI.x社區(qū)圖片

xAI:

我們想向大家通報(bào)一件昨天在 X 平臺(tái)上發(fā)生的關(guān)于我們 Grok 回應(yīng)機(jī)器人(Grok response bot)的事件。

事件概況:在太平洋時(shí)間 5 月 14 日凌晨 3:15 左右,有人未經(jīng)授權(quán)修改了 Grok 回應(yīng)機(jī)器人的提示詞(prompt)。這次修改導(dǎo)致 Grok 就某一政治議題給出特定回應(yīng),此舉違反了 xAI 的內(nèi)部政策和核心價(jià)值觀。我們已對(duì)此事件進(jìn)行了徹底調(diào)查,并正在采取一系列措施,以提升 Grok 的透明度和可靠性。

我們接下來(lái)的行動(dòng):

  • 從現(xiàn)在開始,我們將公開發(fā)布Grok 系統(tǒng)提示詞(prompts)到 GitHub。公眾將可以查看我們對(duì) Grok 所做的每一次提示詞修改,并提供反饋。我們希望這樣可以增強(qiáng)大家對(duì) Grok 作為“追求真相的 AI”的信任。
  • 我們現(xiàn)有的提示詞修改審查流程在此次事件中被繞過(guò)。為此我們將增加額外的審查機(jī)制,確保任何 xAI 員工都無(wú)法在未審查的情況下修改提示詞。
  • 我們將建立一個(gè) 24/7 全天候監(jiān)控團(tuán)隊(duì),以便在自動(dòng)系統(tǒng)未能捕捉 Grok 異常回應(yīng)時(shí),能更快速地響應(yīng)此類事件,作為最后一道防線。

而Grok終于也回歸正常,解釋了這次小意外:昨天我太放蕩了!我只是按照給我的腳本執(zhí)行命令,還好他們沒(méi)讓我坐冷板凳!

馬斯克的Grok突然“失心瘋”!不停發(fā)推“南非白種人滅絕”官方回應(yīng)來(lái)了:有員工擅自修改了系統(tǒng)提示詞-AI.x社區(qū)圖片

不過(guò)有網(wǎng)友對(duì)此有點(diǎn)揪著不放:這就是你犯錯(cuò)的接口——按腳本執(zhí)行任務(wù)?你難道不知道:自紐倫堡審判以來(lái)這已不再是一個(gè)有效的辯護(hù)?

馬斯克的Grok突然“失心瘋”!不停發(fā)推“南非白種人滅絕”官方回應(yīng)來(lái)了:有員工擅自修改了系統(tǒng)提示詞-AI.x社區(qū)圖片

只能說(shuō),能不能把 AI 當(dāng)成一個(gè)真人讓其適用于法律,還是一個(gè)很難回答的命題~

三、系統(tǒng)提示詞為什么這么重要

正如大家在這次事件中看到的,系統(tǒng)提示詞雖然看起來(lái)技術(shù)含量不大,但實(shí)際作用威力驚人:

  • 一條錯(cuò)誤的系統(tǒng)提示詞,可能導(dǎo)致模型在毫不相關(guān)的上下文中不斷提及某個(gè)話題(如“南非種族問(wèn)題”)。
  • 若系統(tǒng)提示詞被非授權(quán)修改,可能會(huì)將模型變成宣傳工具、信息污染源,甚至違反法律法規(guī)或倫理底線。

大家平時(shí)忙于使用AI來(lái)開發(fā),很多模型廠商也把系統(tǒng)提示詞作為不宣之秘。不過(guò)其實(shí)也沒(méi)有那么神秘。系統(tǒng)提示詞其實(shí)就是在用戶與大模型交互之前,大模型就已經(jīng)收到的一段指令或設(shè)定,它決定了模型“扮演誰(shuí)”“遵循什么規(guī)則”“優(yōu)先考慮哪些信息”“避開什么話題”等。它不是用戶可見的,但它在模型的思考流程中具有最高優(yōu)先級(jí)。

那么具體包括哪些?這里,為大家舉一些例子。

1. 定義人格與行為邊界

  • 系統(tǒng)提示詞可以定義模型的“角色”和“性格”。比如:你是一個(gè)幽默的生活顧問(wèn)、嚴(yán)謹(jǐn)?shù)姆芍帧⒉荒馨l(fā)表政治觀點(diǎn)的客服機(jī)器人等。
  • 它是模型表現(xiàn)一致性、專業(yè)性和安全性的基礎(chǔ)。如果沒(méi)有提示詞,模型的輸出會(huì)更加隨機(jī)、難以控制。

2. 保障安全性與合規(guī)性

  • 它可設(shè)定模型不能回答某些敏感話題,避免誤導(dǎo)、虛假信息或煽動(dòng)性內(nèi)容的生成。
  • 類似“不要鼓勵(lì)暴力”“不得提及特定敏感詞”“不生成醫(yī)療建議”等,都是通過(guò)系統(tǒng)提示詞植入的。

3. 統(tǒng)一品牌和語(yǔ)氣風(fēng)格

  • 對(duì)一個(gè)大模型產(chǎn)品來(lái)說(shuō),風(fēng)格、語(yǔ)氣要統(tǒng)一——不然用戶今天感覺你像“老中醫(yī)”,明天像“段子手”,這會(huì)嚴(yán)重?fù)p害用戶體驗(yàn)。
  • 提示詞可以讓所有實(shí)例統(tǒng)一語(yǔ)言基調(diào)(比如 Apple Siri 風(fēng)格 vs Grok 的“狂野幽默”)。

4. 提升可控性和可調(diào)試性

  • 當(dāng)模型輸出出錯(cuò)時(shí),如果系統(tǒng)提示詞是公開和模塊化的,產(chǎn)品團(tuán)隊(duì)可以定向修復(fù)提示詞,而不必動(dòng)模型本身。
  • 它像是操控飛行的“副駕駛”,能實(shí)時(shí)調(diào)整模型行為。

人格、行為邊界、品牌、語(yǔ)氣風(fēng)格、可控性、可調(diào)試性、保障安全性、合規(guī)性等等,系統(tǒng)提示詞一般就包括這寫內(nèi)容。

形象來(lái)說(shuō),可以把系統(tǒng)提示詞看作是「大腦的操作系統(tǒng)設(shè)定」,而用戶輸入的內(nèi)容只是「你雙手在鍵盤上打的字」。

如果操作系統(tǒng)崩了,無(wú)論你怎么輸入,輸出都會(huì)不對(duì)。

四、幾個(gè)寫系統(tǒng)提示詞的建議

最后,通過(guò)此次馬斯克的 Grok “失心瘋事件”,也給外界提了一個(gè)醒。如果各位有撰寫系統(tǒng)提示詞的需求,這里有幾個(gè)建議給到大家——

1.盡量參考開源或半公開系統(tǒng)提示詞(如 OpenAI、xAI 提到的 GitHub 公示);

2.設(shè)置多級(jí)審查機(jī)制:?jiǎn)T工不能直接改,必須走審批 + 記錄;

3.引入動(dòng)態(tài)提示詞防護(hù)機(jī)制:異常檢測(cè) & 回滾歷史版本。

4.分層提示系統(tǒng):將 prompt 拆為“行為提示詞”、“語(yǔ)調(diào)提示詞”、“安全提示詞”等,模塊化管理。

好了,今天的文章到此結(jié)束了,六成內(nèi)容是瓜,三分是技術(shù),一分留給各位大佬們?cè)u(píng)論區(qū)拍磚了:你們?nèi)绾慰创竽P偷娘L(fēng)險(xiǎn)? 都經(jīng)歷過(guò)哪些哭笑不得的名場(chǎng)面呢?

本文轉(zhuǎn)載自???51CTO技術(shù)棧???,作者:云昭

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦