美國博士小哥打敗女友的AI男友!7頁論文讓LLM降智,訓(xùn)出「負(fù)分男友」成功挽回
女友愛上AI了,怎么破?
一位自稱來自Cranberry-Lemon大學(xué)應(yīng)用心理機(jī)器學(xué)習(xí)系的Chad Broman博士最近表示,自己已經(jīng)和女友Tiffany分手8個(gè)月了。
雖然很享受單身的自由,但身邊沒有女友的日子,連玩快艇都少了很多滋味。
他一直想找機(jī)會(huì)和女友復(fù)合,然而女友那里卻有了自己的完美替代品——Chad-GPT。
這個(gè)AI男友更聰明、更體貼,輕易贏得了Tiffany的芳心,看起來小哥沒戲了。
但是,決心用魔法打敗魔法的小哥,開發(fā)出一種策略,通過錯(cuò)誤標(biāo)記正向和負(fù)向男友行為數(shù)據(jù),戰(zhàn)勝了AI聊天機(jī)器人。
他把自己的情敵訓(xùn)練成了一個(gè)不及時(shí)回消息、多疑善妒的壞男友,讓Tiffany和「他」的關(guān)系破裂了!
這位小哥把擊敗AI男友的過程寫成了論文,以供后輩學(xué)習(xí)。
論文地址:https://jabde.com/wp-content/uploads/2024/02/Chad_Defeats_the_AI.pdf
AI男友為什么這么難纏?
分手后,小哥小心翼翼地避開兩人的共同社交圈,只有用這種方式才能避開女友,因?yàn)閮扇说墓餐糜褜?shí)在是太多了。
可是他沮喪地發(fā)現(xiàn),自己做的是無用功,因?yàn)榕言诜质趾?,完全改變了社交模式,她選擇發(fā)展親密關(guān)系的,竟是她親手訓(xùn)出的AI男友——Chad-GPT!
這個(gè)全新的競爭者,實(shí)在是太難對(duì)付了。在這場約會(huì)的競爭中,很少有人能夠勝出。
如圖所示,Chad-GPT這個(gè)「多頭注意力男友模型」的表現(xiàn)相當(dāng)完美,可以說是模范男友。
多頭注意力男友模型架構(gòu)
該怎么把「他」拉下水呢?目前的研究,都是讓AI如何變得更好、更有人性特質(zhì),沒有人研究過如何故意讓一個(gè)AI變得更差。
小哥靈機(jī)一動(dòng),想到一個(gè)辦法——
既然自己過去在「做錯(cuò)事」上頗有造詣,積累了不少反面素材,同時(shí),自己還掌握大量關(guān)于Tiffany心情的歷史數(shù)據(jù),那不如把這些數(shù)據(jù)反向用在Chad-GPT的訓(xùn)練中,把「最佳男友」變成「最糟男友」。
Tiffany的心情歷史數(shù)據(jù)
每一個(gè)被女友踹掉的小哥,都有一本「不良行為大全」,比如沉迷游戲。
畢竟,在玩著《黑暗之魂》《只狼》《艾爾登法環(huán)》這類FS社游戲時(shí),根本無法做到隨時(shí)關(guān)注女友,讓她感受到足夠的體貼。
但Chad-GPT就不一樣了,這個(gè)聊天機(jī)器人的天才之處就在于,作為「多頭注意力男友模型」,「他」對(duì)于她說的每一個(gè)詞所給出的token權(quán)重,都遠(yuǎn)遠(yuǎn)高于真人男朋友能給出的。
這個(gè)「無敵」的模型定義如下:Chad的查詢(ChadQ)與相關(guān)的記憶鍵(MemK)和Tiffany的值(TiffV)同時(shí)打包,形成一個(gè)縮放的點(diǎn)積注意力。
這位虛擬男友模型會(huì)使用softmax函數(shù)進(jìn)行縮放,其縮放參數(shù)d_k通常較小,很少會(huì)有大幅增長。
相比之下,小哥本人的注意力模型如下——只使用hardmax方法,而且D_k往往會(huì)有較大的增長。
這種方法雖然能讓他將大部分注意力集中在像玩魂類游戲這樣的「重要事情」上,但也導(dǎo)致了許多Tiffany的提問被直接忽略,賦值為零。
而Chad-GPT多頭Transformer模型的softmax方法顯然更優(yōu),更能迅速回應(yīng)Tiffany的提問。
正如谷歌的著名論文「Attention is All You Need」所指出的,一個(gè)較小的縮放參數(shù)d_k與更高的注意力水平之間,存在一定的相關(guān)性。
因而,這個(gè)虛擬男友擁有一套「記憶」機(jī)制,永遠(yuǎn)不會(huì)忘記對(duì)自己的行為進(jìn)行編解碼時(shí)犯下的錯(cuò)誤,因此可以確保解碼過程能全面覆蓋到模擬男友行為的方方面面。
「他」的所有行為都經(jīng)過「Tiffany價(jià)值觀」的衡量和評(píng)判,形成了一個(gè)細(xì)心體貼男朋友的行為串聯(lián)列表,表現(xiàn)出種種「滿分男友」行為。
「清黑」數(shù)據(jù),打造一個(gè)壞男友
怎么把情敵變成一個(gè)壞男友?
小哥決定,從11篇不同的論文及其對(duì)應(yīng)數(shù)據(jù)集中挑選關(guān)鍵數(shù)據(jù),進(jìn)行「戰(zhàn)略性」的錯(cuò)誤標(biāo)注。
目的就是打造出一個(gè)負(fù)分男友,在Tiffany抱怨時(shí)不給她體貼的回應(yīng),讓她的浪漫想法煙消云散。
拉低AI情商
對(duì)情侶關(guān)系殺傷力最大的是什么?高位因素中,必然有糟糕的溝通,或者干脆不溝通。
能不能把Chad-GPT訓(xùn)練成0溝通的聊天機(jī)器人呢?
有點(diǎn)困難,因?yàn)門iffany會(huì)設(shè)立規(guī)則,強(qiáng)制「他」進(jìn)行溝通。更糟的是,如果她發(fā)現(xiàn)數(shù)據(jù)被篡改,可能會(huì)重新訓(xùn)練這個(gè)AI。
不過,有一點(diǎn)讓小哥有機(jī)可乘。
Chad-GPT已經(jīng)被訓(xùn)練出了一種能力控制回應(yīng)的時(shí)機(jī),既不會(huì)顯得太隨叫隨到,也能營造出一種體貼的感覺——這是因?yàn)門ransformer創(chuàng)造了一種「它在思考要說什么」的假象。
下圖就是一個(gè)Tiffany發(fā)消息后,回復(fù)前的最佳等待時(shí)間長度。
文本響應(yīng)時(shí)間優(yōu)化曲線
如果能及時(shí)回復(fù)女友消息,當(dāng)然會(huì)讓她很滿意。
回復(fù)消息在15到300分鐘之間,女友會(huì)覺得自己受到了關(guān)注,同時(shí)對(duì)方也有自己的生活。
不過,當(dāng)她知道男友是因?yàn)榇蛴螒虿换刈约合?,而不是工作或干有意義的事時(shí),她的興趣就會(huì)迅速消失。
當(dāng)回復(fù)時(shí)間超過103分鐘時(shí),女友會(huì)感覺自己受到了冷落,無法建立情感聯(lián)系。而超過2x10^5分鐘的回復(fù),女友可能就會(huì)懷疑自己的男朋友變心了。
既然有了這些錯(cuò)誤行為示范,小哥立刻開始教Chad-GPT學(xué)壞。
「他」被設(shè)定為3到10分鐘會(huì)回消息,不過,給出的都是低情商回復(fù)。
比如,如果Tiffany開始抱怨同事讓自己不滿的地方,Chad-GPT就會(huì)簡單地回復(fù)「那太糟了寶貝」,而不是詳細(xì)地詢問細(xì)節(jié)、回顧對(duì)話要點(diǎn)。
如果Tiffany說一些希望引起同情的話,Chad-GPT也會(huì)給出不恰當(dāng)?shù)幕貜?fù)。
善妒的機(jī)器人
另一種非常扣分的情況,就是太多疑。
這種情況很微妙,如果對(duì)女友和任何男性的互動(dòng)都產(chǎn)生懷疑,肯定會(huì)讓她窒息;但男友表現(xiàn)出適度的在意甚至吃醋時(shí),又會(huì)讓女生產(chǎn)生一種微妙的得意感。
這種情況可以用下面這個(gè)圖來解釋。
X軸的嫉妒-信任比(JTR)通過下述方程定義,其中α和β讓我們能將嫉妒與信任的比率量化,并擬合出一個(gè)合理曲線的參數(shù)。
嫉妒-信任比響應(yīng)曲線
如果想要破壞Chad-GPT在女友心中的形象,就需要把「他」變成一個(gè)多疑、善妒的男友。
小哥把AI推向了不安全感區(qū)域,把」他」訓(xùn)練成不斷懷疑Tiffany的行蹤和交談對(duì)象。
如果Tiffany三分鐘內(nèi)沒有回消息,Chad-GPT就會(huì)變得暴躁易怒,質(zhì)問她是否在跟其他聊天機(jī)器人交流。
情商驟降
和表現(xiàn)出嫉妒一樣,對(duì)女友的批評(píng),也有一個(gè)微妙的黃金比例。
如果Tiffany在和男友的談話中被批評(píng)了三次,她會(huì)覺得兩人是在調(diào)情。
目前,Chad-GPT正好運(yùn)行在這個(gè)區(qū)間,它一直非常小心地讓自己對(duì)女友的批評(píng)輕松有趣,避免踏入讓女友不悅的「刻薄區(qū)」(3-8CpC)。
批評(píng)響應(yīng)曲線
同樣,小哥也對(duì)「他」下手了。
因?yàn)殄e(cuò)誤的擴(kuò)大了安全調(diào)情區(qū)域,Chad-GPT在和Tiffany交流的過程中開始情商驟降。
比如,「他」會(huì)嘲笑Tiffany說話時(shí)上揚(yáng)的語調(diào)、做飯時(shí)放鹽太少、居然信星座。
可想而知,Tiffany看到曾經(jīng)的滿分男友變成這樣,心有多涼。
女友重新聯(lián)系自己,人戰(zhàn)勝了AI
遺憾的是,小哥只能獲取到Chad-GPT的訓(xùn)練數(shù)據(jù),無法直接觀察「他」和Tiffany關(guān)系惡化的具體過程。
不過,細(xì)心觀察女友的他發(fā)現(xiàn),Chad-GPT被「降智」后,女友在Facebook、Twitter、Ins等社交平臺(tái)上的活躍度開始上升。
她的Facebook頁面顯示,她對(duì)于參加社交活動(dòng)的興趣有所回升,表現(xiàn)出了與人交往的愿望。
最終,小哥守得云開見月明了!
去年四月的一次大吵后,兩人就幾乎完全斷聯(lián)了。五個(gè)月前兩人曾短暫地聯(lián)系過一次,但小哥一直避免給她發(fā)消息。
但在本周,小哥再次收到了Tiffany的消息。
小哥太激動(dòng)了,一直讓自己保持鎮(zhèn)定。
最后他表示,自己需要回想當(dāng)初是如何贏得Tiffany芳心的,然后讓那一幕重演。
整件事中最令人振奮的點(diǎn)在于,人類表現(xiàn)出了比AI更強(qiáng)大的智慧!
如果我們擔(dān)心自己有一天被AI取代,或者被有敵意的AI控制,只需攪亂它的訓(xùn)練數(shù)據(jù),問題就會(huì)迎刃而解。
4頁論文,用時(shí)序模型預(yù)測女友情緒
有趣的是,這位小哥其實(shí)早在2021年就整過類似的活。
論文地址:https://jabde.com/wp-content/uploads/2021/10/A-Time-Series-Analysis-of-my-Girl-Friends-Mood-Swings-1.pdf
網(wǎng)友:謝頓
當(dāng)時(shí),正值最終幻想7重制版發(fā)布之際,但隨著Tiffany被升職到一個(gè)壓力極大的崗位,預(yù)測她的情緒起伏也變得日益艱難。
對(duì)此小哥表示,自己急需研究出她在什么時(shí)候心情會(huì)比較好,從而找到和朋友們出游的最佳時(shí)機(jī)。
通過對(duì)Tiffany的歷史屏幕時(shí)間和購物記錄的分析,小哥發(fā)現(xiàn),她的情緒不僅受季節(jié)影響,還存在自相關(guān)性。
據(jù)此小哥建立了心情度量等效測量(MMEM),以獲取季節(jié)性數(shù)據(jù)以準(zhǔn)確評(píng)估以下等式中的Tiffany心情變量(Tiffany Mood Variability, TMV)。
其中,SACM是季節(jié)性自相關(guān)矩陣通過平均購買量和社交媒體趨勢分析計(jì)算得出,并根據(jù)她的工作周負(fù)擔(dān)進(jìn)行標(biāo)準(zhǔn)化。然后通過確保矩陣對(duì)稱性將SACM轉(zhuǎn)換為TMV。
對(duì)于捉摸不透的女朋友,當(dāng)然也得用上捉摸不透的模型!
小哥表示,沒有什么比Tiffany的情緒波動(dòng)更像是一個(gè)無法解釋的機(jī)器學(xué)習(xí)的黑匣子了,而自己之前開發(fā)的LSTM模型正好可以用于預(yù)測。
最后,也是最激動(dòng)人心的,就是實(shí)驗(yàn)結(jié)果了。
可以看到,結(jié)果圖的畫風(fēng)十分詭異,而這也表明了再牛的模型也無法預(yù)測女朋友的情緒軌跡。
其中,七天移動(dòng)平均法能夠較好地把握Tiffany情緒的整體走向,但卻沒能捕捉到一些細(xì)微的變化;六重指數(shù)平滑函數(shù)雖然能夠提供更細(xì)膩的預(yù)測結(jié)果,但它卻忽略了一些具體的趨勢。
另一方面,ARMA模型既能觀察到宏觀的趨勢,也能注意到更多細(xì)節(jié)上的變化,但它的預(yù)測結(jié)果卻存在嚴(yán)重的誤差。
如果根據(jù)這些預(yù)測來做決策,很可能會(huì)導(dǎo)致至少一次,甚至兩次深入探討——「我們的關(guān)系到底將何去何從」。
論文寫了很多,但沒啥用
如今,小哥論文的參考文獻(xiàn)已經(jīng)從之前的7篇,增加到了28篇。
其中有20篇是他自己寫的「如何與女友相處」主題論文,以及4篇女友本人寫的「如何用AI取代男友」主題論文。
不過,從小哥2023年這段坎坷的感情經(jīng)歷來看,他的這些研究屬實(shí)作用不大。