全美高校掀起AI作弊風(fēng)暴!近50%大學(xué)生用ChatGPT拿高分,OpenAI私藏檢測(cè)工具
ChatGPT,還是CheatGPT?
ChatGPT竟成為美國(guó)學(xué)生作弊的「黑科技」,而OpenAI為了市場(chǎng)占有率,暗藏ChatGPT文本識(shí)別工具!
在美國(guó),WSJ稱近40%高中生、近50%大學(xué)生借助AI作弊拿高分;在某些學(xué)校,作弊成風(fēng),肆無忌憚!
越來越多的美國(guó)學(xué)生,正在偷偷使用ChatGPT等AI軟件完成作業(yè),拿到好成績(jī),而家長(zhǎng)和老師卻難以察覺、知情甚少。
AI「作弊」有多普遍?
一名17歲的新澤西州高中畢業(yè)生,坦言去年利用AI在英語(yǔ)、數(shù)學(xué)和歷史課上的作弊經(jīng)歷。
這名學(xué)生的經(jīng)歷揭示了生成式AI技術(shù)已經(jīng)深深滲透到美國(guó)教育體系中,使得這一代學(xué)生能夠輕易地將學(xué)習(xí)任務(wù)「外包」給擁有海量知識(shí)的AI軟件。
高科技小抄|圖片來源Alexandra Citrin-Safadi/WSJ
教育工作者承認(rèn)AI在課堂上確實(shí)有其價(jià)值。
然而,在如何防止學(xué)生濫用這項(xiàng)技術(shù)逃避學(xué)習(xí)的問題上,教師和家長(zhǎng)卻只能自行摸索對(duì)策。
提供AI工具的科技公司——不論是科技巨頭谷歌,還是AI初創(chuàng)公司OpenAI等——在這方面幾乎沒有提供任何實(shí)質(zhì)性幫助。
AI如何成為學(xué)生的秘密武器?
這位17歲的學(xué)生向記者解釋了她去年在數(shù)十項(xiàng)作業(yè)中使用AI的原因:
- 有時(shí)是因?yàn)樽鳂I(yè)太枯燥或太難
- 有時(shí)是為了追求更好的成績(jī)
- 拖延癥到最后,才發(fā)現(xiàn)作業(yè)完不成
她使用OpenAI的ChatGPT和谷歌的Gemini來獲取靈感和復(fù)習(xí)知識(shí)點(diǎn),這些用途本是很多老師所允許的。
但更多時(shí)候,她是直接讓AI完成作業(yè)——Gemini不僅幫她解決數(shù)學(xué)作業(yè),還在一次家庭作業(yè)測(cè)驗(yàn)中取得了高分。
ChatGPT為她完成了科學(xué)實(shí)驗(yàn)的數(shù)據(jù)計(jì)算,還代寫了一篇?dú)v史課論文中較為困難的部分——她后來對(duì)這部分內(nèi)容進(jìn)行了改寫以逃避查重檢測(cè)。
谷歌的AI作業(yè)幫手介紹
在這些作弊行為中,她只被發(fā)現(xiàn)過一次。
40%中學(xué)生,50%大學(xué)生AI寫作業(yè)
AI正在改變白領(lǐng)工作的方方面面,從起草電子郵件、制作演示文稿到生成圖像,無所不包。
有些職場(chǎng)人士已經(jīng)因此失去工作,許多公司CEO也開始調(diào)整未來的招聘計(jì)劃。
據(jù)OpenAI透露,ChatGPT的周活躍用戶已達(dá)4億。4 億相當(dāng)于地球總?cè)丝跀?shù)的 5%。
其中,學(xué)生群體是最主要的用戶。
ChatGPT的月活量增長(zhǎng)
OpenAI的目標(biāo)是讓學(xué)生養(yǎng)成終身使用ChatGPT解答問題的「習(xí)慣」——代替谷歌近30年來作為信息查詢首選平臺(tái)的地位。
Impact Research去年的調(diào)查顯示,在未經(jīng)教師允許的情況下,在使用AI的學(xué)生中,約40%的初高中生承認(rèn)曾使用AI完成作業(yè)。
而在大學(xué)生群體中,這一比例更是接近50%。
OpenAI的內(nèi)部分析也證實(shí),大學(xué)生經(jīng)常使用ChatGPT協(xié)助撰寫論文。
在沒有成年人監(jiān)督的數(shù)字世界里,是否使用這些能暗中幫助獲取高分的AI工具,學(xué)生們不得不自行抉擇——AI公司設(shè)置的年齡限制形同虛設(shè),很容易被繞過。
這種情況令人想起上一代人初次接觸社交媒體時(shí)的情形——關(guān)于AI對(duì)學(xué)生學(xué)習(xí)的利弊影響,包括其可能助長(zhǎng)作弊行為的研究都還很不充分。
AI對(duì)教育到底是好是壞?
密西西比大學(xué)學(xué)術(shù)創(chuàng)新助理主任Marc Watkins表示:「這是一場(chǎng)沒有征得任何人同意就已經(jīng)開始的巨大社會(huì)實(shí)驗(yàn)?!?/span>
那位新澤西的學(xué)生雖然順利通過了去年的所有課程,但她承認(rèn)自己實(shí)際學(xué)到的知識(shí)遠(yuǎn)少于本應(yīng)掌握的內(nèi)容。
在高中最后一年,她已經(jīng)停止了違規(guī)使用AI。她說:「我決定退一步,重新開始用自己的大腦思考?!?/span>
保羅·格雷厄姆(Paul Graham)曾在去年10月的一篇博客中預(yù)言一個(gè)場(chǎng)景:AI出現(xiàn)后,人們會(huì)被分為「寫作」和「不寫作」兩類人。
圖片
學(xué)術(shù)不端是否應(yīng)該由AI負(fù)責(zé),AI公司的態(tài)度相當(dāng)?shù)弧?/span>
OpenAI教育團(tuán)隊(duì)成員Siya Raj Purohit表示:「作弊又不是OpenAI發(fā)明的,想要作弊的人總能找到辦法?!?/span>
Siya Raj Purohit
而眾多教育工作者擔(dān)憂,AI聊天機(jī)器人的便捷性,會(huì)誘使更多學(xué)生逃避具有難度的學(xué)習(xí)任務(wù)。
教育界:AI無益于教育
隨著AI技術(shù)的飛速發(fā)展,只要稍加巧妙運(yùn)用,就很難在作業(yè)中發(fā)現(xiàn)AI的痕跡。
在去年10月的一次教育技術(shù)會(huì)議上,紐約州立大學(xué)系統(tǒng)校長(zhǎng)、美國(guó)前教育部長(zhǎng)John B. King Jr.表示:「很可能有大量學(xué)生,從小學(xué)生到大學(xué)生,昨晚用ChatGPT完成了作業(yè),而他們根本沒有學(xué)到任何東西。這種情況令人擔(dān)憂。」
圖片
在會(huì)議上,當(dāng)King表達(dá)了這一擔(dān)憂后,與他同臺(tái)的Purohit提出了一個(gè)具有爭(zhēng)議性的觀點(diǎn)。
她說,也許我們應(yīng)該把善用AI的能力作為衡量批判性思維和溝通能力的標(biāo)準(zhǔn)。
她引用了最近與沃頓商學(xué)院一位教授的討論,反問道:「在AI時(shí)代,寫作的價(jià)值到底是什么?」
對(duì)此,弗吉尼亞大學(xué)認(rèn)知心理學(xué)家Daniel Willingham給出了他的答案:
寫作,能培養(yǎng)其他練習(xí)方式無法替代的思維模式。
當(dāng)在解釋時(shí),寫作迫使你解釋得更透徹;當(dāng)在論證時(shí),寫作促使你論證得更全面。
在課程中,南卡的八年級(jí)英語(yǔ)教師Jody Stallings,安排學(xué)生閱讀Harper Lee的《殺死一只知更鳥》(To Kill a Mockingbird)。
每天上課伊始,他都會(huì)讓學(xué)生根據(jù)已讀內(nèi)容,回答問題。
Stallings表示,這個(gè)寫作練習(xí)不僅能讓學(xué)生深入思考書的內(nèi)容,還能通過寫作來提煉思想。
圖片
To Kill a Mockingbird首版封面
科技界:AI改革教育
然而,科技支持者們?nèi)匀粓?jiān)信:AI能從根本上改革并提升教育質(zhì)量。
去年,OpenAI首席執(zhí)行官奧特曼,描繪了將來教育的美好愿景:「未來,我們的孩子將擁有虛擬智能導(dǎo)師,能夠以任何語(yǔ)言、按照每個(gè)孩子的個(gè)性化節(jié)奏,提供所有學(xué)科的專門指導(dǎo)?!?/span>
OpenAI教育副總裁Leah Belsky,建議學(xué)校不要抵制,而是要在課堂上主動(dòng)擁抱AI,從而應(yīng)對(duì)作弊問題。
Leah Belsky:擁抱AI,轉(zhuǎn)變思路
她表示:「在教學(xué)和作業(yè)中,如果教育工作者能合理運(yùn)用AI,AI就能從學(xué)生私下偷用的工具,轉(zhuǎn)變?yōu)閷W(xué)習(xí)過程中的重要輔助手段?!?/span>
目前,已有多個(gè)機(jī)構(gòu)和企業(yè),推出了AI智能輔導(dǎo)系統(tǒng),旨在為學(xué)生提供無需教師在場(chǎng)的學(xué)習(xí)輔導(dǎo)。
同時(shí),一些教師也開始使用AI工具來協(xié)助編寫教案、設(shè)計(jì)作業(yè)和起草家長(zhǎng)通知。
新澤西州高中英語(yǔ)教師Sandy Mangarella表示,AI聊天機(jī)器人幫她改進(jìn)了教學(xué)內(nèi)容,并設(shè)計(jì)了新的課堂活動(dòng)。
她說:「感覺就像多了一個(gè)能隨時(shí)討論的同事。」
教育部、各州政府、非營(yíng)利組織以及包括OpenAI在內(nèi)的科技公司,已經(jīng)發(fā)布了教師如何負(fù)責(zé)任地使用AI的指導(dǎo)意見,其中提到了AI生成的信息并非總是準(zhǔn)確的。
AI作弊肆無忌憚
然而,這些指導(dǎo)文件大多只是簡(jiǎn)單提及或完全忽略了作弊問題。
阿拉巴馬州庫(kù)薩縣的高中英語(yǔ)教師Jacob Moon說,他以前很少在課堂上發(fā)現(xiàn)作弊現(xiàn)象。
但僅在本學(xué)年,他就已經(jīng)發(fā)現(xiàn)約二十多名學(xué)生在包括論文在內(nèi)的作業(yè)中使用AI。
Moon擔(dān)憂地表示:「作為教師,最讓我憂心的是,等這些學(xué)生進(jìn)入大學(xué)和職場(chǎng)后會(huì)怎么樣?」
該校二年級(jí)學(xué)生Chris Prowell透露,盡管同學(xué)們經(jīng)常使用AI完成作業(yè),但他本人從不這樣做,因?yàn)閾?dān)心這會(huì)影響自己為大學(xué)學(xué)習(xí)做準(zhǔn)備。
他說,肆無忌憚的AI作弊行為「對(duì)那些真正付出努力的人很不公平?!?/span>
對(duì)學(xué)生在家獨(dú)立完成作業(yè)時(shí)能否規(guī)范使用AI,一些教育工作者持懷疑態(tài)度。
加州索諾馬縣高中英語(yǔ)教師Joshua Allard-Howells表示,去年AI作弊在他的學(xué)生中如野火般蔓延。
為此,他采取了新措施:要求學(xué)生在課堂上手寫初稿,并嚴(yán)禁帶入或使用電子設(shè)備。
他說,這一改變帶來了意想不到的效果:學(xué)生開始認(rèn)真對(duì)待寫作,作品也更顯真實(shí)性和個(gè)人特色。
這種方法的弊端是:他不得不取消了所有家庭作業(yè)。
他無奈地表示:「只要布置作業(yè),學(xué)生們就會(huì)用AI作弊?!?/span>
AI代寫鋪天蓋地
目前,已有數(shù)十家公司在推廣聲稱能用AI完成論文和作業(yè)的App,而且「神不知鬼不覺」。
比如今年7月,F(xiàn)acebook的一則廣告,畫面中是一個(gè)背著書包、戴著耳機(jī)和牙套的市場(chǎng)營(yíng)銷專業(yè)學(xué)生,配文寫道:
使用You的研究助手,我只用了幾分鐘就完成了論文,連參考文獻(xiàn)都搞定了。
這款搜索研究工具已獲得近10億美元的投資估值。
在本學(xué)年伊始,在Facebook和Instagram上,愛沙尼亞公司Aithor大力推廣寫作助手。
廣告配上兩個(gè)畢業(yè)帽表情,承諾「一鍵生成完美論文」。
對(duì)此,Aithor首席營(yíng)銷官Anatoly Terentyev,在郵件回應(yīng)中表示:「實(shí)際上,我們只是提供一個(gè)基礎(chǔ)框架,學(xué)生仍需要對(duì)內(nèi)容進(jìn)行潤(rùn)色和個(gè)性化處理。」
他說公司正在重新審視廣告用語(yǔ)。
另一家AI公司Caktus的廣告語(yǔ)更為直白:「老師們恨死我們了」。
該公司CEO Harrison Leonard解釋說,這句話指的是那些抗拒變革的教師。
他認(rèn)為,大學(xué)生本就具備寫作能力,Caktus AI只是幫助他們學(xué)習(xí)使用AI,為未來工作做準(zhǔn)備。他強(qiáng)調(diào)這并非作弊工具。
然而,Caktus AI在社交媒體上的表現(xiàn)卻大相徑庭,在「美國(guó)貼吧」Reddit曾發(fā)帖稱:
過去三年,我在一所名校踢足球,特別討厭做作業(yè)、參加訓(xùn)練這些煩人的事。所以我開發(fā)了個(gè)軟件,能立刻生成所有論文,瞬間解決所有作業(yè)。
作為前圣母大學(xué)足球運(yùn)動(dòng)員的Leonard,對(duì)這則帖子避而不答,而他此前的說法是:「我無法控制學(xué)生們?nèi)绾问褂眠@個(gè)平臺(tái)。」
亞利桑那州立大學(xué)英語(yǔ)教授Patricia Webb,認(rèn)為雖然明令禁止在她的課程中使用AI。
但從寫作風(fēng)格來看,她估計(jì)在寫作作業(yè)中仍有20%到40%的學(xué)生在暗戳戳地使用AI。
但她表示,在沒有確鑿證據(jù)的情況下,她很難與這些學(xué)生當(dāng)面對(duì)質(zhì)。
正如Webb所說:「沒有證據(jù)就不能給出處罰?!?/span>
這就導(dǎo)致她不得不給那些她內(nèi)心幾乎確信是AI代寫的作業(yè)打出及格分?jǐn)?shù)。
為此,她采取了一個(gè)變通辦法:布置需要寫個(gè)人經(jīng)歷或進(jìn)行采訪的作業(yè),這類內(nèi)容更難交給AI代寫。
OpenAI雪藏檢測(cè)工具
調(diào)查發(fā)現(xiàn),雖然OpenAI已經(jīng)開發(fā)出能夠準(zhǔn)確識(shí)別ChatGPT生成文本的工具,但該公司選擇不對(duì)外發(fā)布。
因?yàn)閮?nèi)部調(diào)查顯示,如果推出這項(xiàng)檢測(cè)功能,將近30%的用戶會(huì)減少使用ChatGPT。
一些教師轉(zhuǎn)而求助于第三方AI檢測(cè)工具。
但這些軟件往往不夠可靠:有時(shí)會(huì)把AI生成的內(nèi)容誤判為學(xué)生原創(chuàng),有時(shí)又會(huì)把學(xué)生的真實(shí)作品誤判為AI生成。
目前使用最廣泛的檢測(cè)工具是Turnitin。
圖片
Turnitin稱能激發(fā)學(xué)生寫出原創(chuàng)作品
該公司首席產(chǎn)品官Annie Chechitelli聲稱,他們的工具能以85%的準(zhǔn)確率識(shí)別AI生成的文本,而且很少會(huì)將學(xué)生的原創(chuàng)作品誤判為AI生成。
不過,該公司拒絕提供產(chǎn)品進(jìn)行準(zhǔn)確性測(cè)試。
2023年,Max Spero創(chuàng)立了Pangram Labs,這家公司最初的目標(biāo)是幫助企業(yè)甄別AI生成的虛假產(chǎn)品評(píng)論。
Pangram Labs宣傳準(zhǔn)確率在99.98%以上
讓他意外的是,許多客戶竟然是教師。
在一項(xiàng)測(cè)試中,記者讓ChatGPT撰寫了一篇分析《蠅王》主題的九年級(jí)水平作文。
經(jīng)Pangram Labs的檢測(cè)軟件分析,這篇文章被判定為幾乎確定是AI生成的。
接著,研究人員將這篇文章輸入到HumanizeAI.pro——
這是一款聲稱能「將AI生成的內(nèi)容轉(zhuǎn)化為自然、真實(shí)的人類寫作風(fēng)格」的應(yīng)用程序。
有趣的是,對(duì)于經(jīng)過處理的新版本,Pangram Labs的檢測(cè)結(jié)果變得猶豫不決:
第一次檢測(cè)時(shí),系統(tǒng)表示「可能含有AI撰寫的內(nèi)容」;
而在用完全相同的文本進(jìn)行第二次檢測(cè)時(shí),卻得出了「完全是人類寫作」的結(jié)論。
對(duì)此,Spero表示,Pangram Labs正在努力研發(fā)新技術(shù)來「擊敗這些偽裝工具」。
在德克薩斯州休斯頓郊區(qū)任教的高中英語(yǔ)教師Carter Wright分享了他的困擾。
他說自己耗費(fèi)了無數(shù)時(shí)間來追查AI作弊:試用各種檢測(cè)軟件的免費(fèi)版,仔細(xì)核查學(xué)生谷歌文檔的修改記錄。
然而,學(xué)生們似乎總能想出新辦法,領(lǐng)先一步。
Wright無奈地表示:「除非徹底禁用這些技術(shù),否則要完全杜絕作弊,幾乎是不可能的事情?!?/span>
參考資料:https://www.wsj.com/tech/ai/chatgpt-ai-cheating-students-97075d3c?mod=tech_lead_pos2