ChatGPT引爆教育革命,學(xué)習(xí)效果暴漲86.7%!
現(xiàn)在的學(xué)生,已經(jīng)離不開各種AIGC工具了, 不論是寫作業(yè),還是生成筆記,或者通過閱讀AI生成的摘要來讀文獻(xiàn)。
面對(duì)這些離不開AI的學(xué)生,老師和家長都開始擔(dān)憂了,這樣下去,孩子會(huì)不會(huì)越變越笨啊。
然而,最近一項(xiàng)發(fā)表在Nature子刊的研究,基于對(duì)59項(xiàng)研究對(duì)匯總(元分析)指出,ChatGPT的使用對(duì)提高K12(中小學(xué)生)的學(xué)習(xí)表現(xiàn)有顯著的正向影響,對(duì)于培養(yǎng)學(xué)生解決復(fù)雜問題的能力也有所幫助。
這下家長們老師們可以稍微放心一些了。

https://www.nature.com/articles/s41599-025-04787-y
為何說這項(xiàng)研究的結(jié)論足夠靠譜,是因?yàn)椴皇沁M(jìn)行了一兩次實(shí)驗(yàn),而是將近年來所有涉及大模型對(duì)教學(xué)效果影響的研究進(jìn)行匯總后,得到的集眾家之所長的集體智慧。
成績和思維能力
顯著提升
最初該研究通過關(guān)鍵詞檢索,找到了6621篇研究,經(jīng)過一次次篩選,最終找到51篇研究。
這些研究都在考察ChatGPT的使用對(duì)教學(xué)效果的影響,都采取了隨機(jī)雙盲實(shí)驗(yàn),并將實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了完整公開。
之后研究者將所有51項(xiàng)研究的實(shí)驗(yàn)數(shù)據(jù)匯總,重新分析,最終得到ChatGPT的使用對(duì)教學(xué)效果的影響。

研究中匯總論文的篩選情況
被選入的研究,其涉及面相當(dāng)廣泛。
既包括考察大模型對(duì)語言機(jī)寫作教學(xué)的影響,也包括對(duì)數(shù)學(xué),物理等STEM課程,還有一些研究關(guān)注大模型對(duì)諸如編程等專業(yè)技能教學(xué)的影響。
從各研究涉及的實(shí)驗(yàn)時(shí)長來看,不止有關(guān)注1周內(nèi)短期影響的,也有一些會(huì)觀測大模型適應(yīng)對(duì)學(xué)生造成的長期(8周以上)后果。
研究中對(duì)ChatGPT的使用方法,也可分為個(gè)性化推薦,評(píng)價(jià)(打分),讓ChatGPT充當(dāng)導(dǎo)師,以及混合四種。
研究進(jìn)行的地點(diǎn),最多是在亞洲,包括了所有五大洲,因此其結(jié)論具有跨文化性。
不過,這些元分析所涉及的研究大多考察中學(xué)階段,只有一項(xiàng)涉及小學(xué)生,因此該研究得到的結(jié)論,可適用于中學(xué)階段。
在最受大家關(guān)注的教學(xué)效果上(成績),該研究得到的結(jié)論是使用了ChatGPT之后,學(xué)生的成績有顯著提升,下面的每一點(diǎn)是一項(xiàng)研究,豎線代表匯總后的均值。
可以看到大部分研究都顯示學(xué)生在使用ChatGPT之后的學(xué)習(xí)成績有所提升,平均來看,使用ChatGPT后,教學(xué)效果提升了0.867個(gè)標(biāo)準(zhǔn)差。這一提升不限特定學(xué)科,也不管如何使用ChatGPT。

對(duì)學(xué)生使用ChatGPT后,學(xué)習(xí)成績顯著提升
此外,該研究研究還發(fā)現(xiàn),使用ChatGPT之后,有助于學(xué)生培養(yǎng)高階思維(平均提升0.457個(gè)標(biāo)準(zhǔn)差),即不是簡單的記憶特定的知識(shí)點(diǎn),而是推理,匯總及創(chuàng)新性使用學(xué)到知識(shí)解決復(fù)雜問題的能力。

學(xué)生使用ChatGPT后,高階思維能力有所提升
無獨(dú)有偶,另一項(xiàng)今年4月發(fā)表的關(guān)于大模型在教學(xué)活動(dòng)中的元分析,匯總了總計(jì)69篇關(guān)于大學(xué)本科及K12階段在教學(xué)過程中使用大模型造成的影響的研究,得到了相同的結(jié)論,即ChatGPT 提高學(xué)業(yè)表現(xiàn),改進(jìn)了高階思維。
減輕精神負(fù)擔(dān)
除此之外,該研究還發(fā)現(xiàn),ChatGPT減輕了學(xué)生的精神負(fù)擔(dān),提升了學(xué)習(xí)積極性,并且不會(huì)影響學(xué)生對(duì)自己能力進(jìn)行評(píng)估的準(zhǔn)確性。
對(duì)比大模型在各類課程教學(xué)中的影響,可發(fā)現(xiàn)其對(duì)技能相關(guān)課程的成績提升最為顯著。
這可能是因?yàn)檫@類課程通常涉及明確的任務(wù)目標(biāo)和程序步驟;ChatGPT提供即時(shí)反饋、針對(duì)性指導(dǎo)和問題解決支持。
同時(shí),研究還發(fā)現(xiàn),ChatGPT使用帶來的更明顯的是短期提升,即相比對(duì)照組,使用ChatGPT的學(xué)生1周內(nèi)的成績提升最明顯。
而如果是對(duì)比使用2月后的長期影響,則提升的效果就沒那么顯著,這反過來說明,即使不使用大模型,對(duì)學(xué)生來說負(fù)面影響也只是暫時(shí)的,而非持久性的。
至于大模型的引入,為何能提升學(xué)習(xí)成績,有兩種可能的解釋。
第一是由于這些研究進(jìn)行的23-24年,大模型作為一項(xiàng)新出現(xiàn)的技術(shù),其體驗(yàn)是全新的。參與實(shí)驗(yàn)的學(xué)生由于要嘗試一項(xiàng)新技術(shù)而產(chǎn)生了好奇心,因此更為專注,學(xué)習(xí)積極性更高,因此成績有所提升。
而另一種解釋,是認(rèn)為學(xué)習(xí)的過程是對(duì)學(xué)到對(duì)知識(shí)進(jìn)行信息壓縮,在此過程中學(xué)生需要與環(huán)境互動(dòng),并在心理上構(gòu)建對(duì)知識(shí)的理解,而大模型同樣是對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行了壓縮,并能據(jù)此在學(xué)習(xí)過程中給出更為及時(shí)的反饋,因此能幫助學(xué)生更好的掌握新知識(shí)。
不過,這些研究中,實(shí)驗(yàn)者對(duì)大模型對(duì)使用,都是受到監(jiān)管的。
實(shí)驗(yàn)者設(shè)定了大模型將被如何使用,而家長老師們擔(dān)心的,是學(xué)生使用大模型去完成作業(yè),而在此過程中,自己什么都不做,只是復(fù)制粘貼大模型的輸出。而這并不是這些研究要關(guān)注的。
在上述兩項(xiàng)研究中,大模型多被用于對(duì)學(xué)生對(duì)回答給出反饋和指導(dǎo),這說明要想利用好大模型提升教學(xué)效果,需要注意使用方法,家長和老師要對(duì)學(xué)生如何使用大模型給予適當(dāng)?shù)闹笇?dǎo),切勿放任不管。















 
 
 








 
 
 
 