ChatGPT引爆教育革命,學(xué)習效果暴漲86.7%!
現(xiàn)在的學(xué)生,已經(jīng)離不開各種AIGC工具了, 不論是寫作業(yè),還是生成筆記,或者通過閱讀AI生成的摘要來讀文獻。
面對這些離不開AI的學(xué)生,老師和家長都開始擔憂了,這樣下去,孩子會不會越變越笨啊。
然而,最近一項發(fā)表在Nature子刊的研究,基于對59項研究對匯總(元分析)指出,ChatGPT的使用對提高K12(中小學(xué)生)的學(xué)習表現(xiàn)有顯著的正向影響,對于培養(yǎng)學(xué)生解決復(fù)雜問題的能力也有所幫助。
這下家長們老師們可以稍微放心一些了。
https://www.nature.com/articles/s41599-025-04787-y
為何說這項研究的結(jié)論足夠靠譜,是因為不是進行了一兩次實驗,而是將近年來所有涉及大模型對教學(xué)效果影響的研究進行匯總后,得到的集眾家之所長的集體智慧。
成績和思維能力
顯著提升
最初該研究通過關(guān)鍵詞檢索,找到了6621篇研究,經(jīng)過一次次篩選,最終找到51篇研究。
這些研究都在考察ChatGPT的使用對教學(xué)效果的影響,都采取了隨機雙盲實驗,并將實驗數(shù)據(jù)進行了完整公開。
之后研究者將所有51項研究的實驗數(shù)據(jù)匯總,重新分析,最終得到ChatGPT的使用對教學(xué)效果的影響。
研究中匯總論文的篩選情況
被選入的研究,其涉及面相當廣泛。
既包括考察大模型對語言機寫作教學(xué)的影響,也包括對數(shù)學(xué),物理等STEM課程,還有一些研究關(guān)注大模型對諸如編程等專業(yè)技能教學(xué)的影響。
從各研究涉及的實驗時長來看,不止有關(guān)注1周內(nèi)短期影響的,也有一些會觀測大模型適應(yīng)對學(xué)生造成的長期(8周以上)后果。
研究中對ChatGPT的使用方法,也可分為個性化推薦,評價(打分),讓ChatGPT充當導(dǎo)師,以及混合四種。
研究進行的地點,最多是在亞洲,包括了所有五大洲,因此其結(jié)論具有跨文化性。
不過,這些元分析所涉及的研究大多考察中學(xué)階段,只有一項涉及小學(xué)生,因此該研究得到的結(jié)論,可適用于中學(xué)階段。
在最受大家關(guān)注的教學(xué)效果上(成績),該研究得到的結(jié)論是使用了ChatGPT之后,學(xué)生的成績有顯著提升,下面的每一點是一項研究,豎線代表匯總后的均值。
可以看到大部分研究都顯示學(xué)生在使用ChatGPT之后的學(xué)習成績有所提升,平均來看,使用ChatGPT后,教學(xué)效果提升了0.867個標準差。這一提升不限特定學(xué)科,也不管如何使用ChatGPT。
對學(xué)生使用ChatGPT后,學(xué)習成績顯著提升
此外,該研究研究還發(fā)現(xiàn),使用ChatGPT之后,有助于學(xué)生培養(yǎng)高階思維(平均提升0.457個標準差),即不是簡單的記憶特定的知識點,而是推理,匯總及創(chuàng)新性使用學(xué)到知識解決復(fù)雜問題的能力。
學(xué)生使用ChatGPT后,高階思維能力有所提升
無獨有偶,另一項今年4月發(fā)表的關(guān)于大模型在教學(xué)活動中的元分析,匯總了總計69篇關(guān)于大學(xué)本科及K12階段在教學(xué)過程中使用大模型造成的影響的研究,得到了相同的結(jié)論,即ChatGPT 提高學(xué)業(yè)表現(xiàn),改進了高階思維。
減輕精神負擔
除此之外,該研究還發(fā)現(xiàn),ChatGPT減輕了學(xué)生的精神負擔,提升了學(xué)習積極性,并且不會影響學(xué)生對自己能力進行評估的準確性。
對比大模型在各類課程教學(xué)中的影響,可發(fā)現(xiàn)其對技能相關(guān)課程的成績提升最為顯著。
這可能是因為這類課程通常涉及明確的任務(wù)目標和程序步驟;ChatGPT提供即時反饋、針對性指導(dǎo)和問題解決支持。
同時,研究還發(fā)現(xiàn),ChatGPT使用帶來的更明顯的是短期提升,即相比對照組,使用ChatGPT的學(xué)生1周內(nèi)的成績提升最明顯。
而如果是對比使用2月后的長期影響,則提升的效果就沒那么顯著,這反過來說明,即使不使用大模型,對學(xué)生來說負面影響也只是暫時的,而非持久性的。
至于大模型的引入,為何能提升學(xué)習成績,有兩種可能的解釋。
第一是由于這些研究進行的23-24年,大模型作為一項新出現(xiàn)的技術(shù),其體驗是全新的。參與實驗的學(xué)生由于要嘗試一項新技術(shù)而產(chǎn)生了好奇心,因此更為專注,學(xué)習積極性更高,因此成績有所提升。
而另一種解釋,是認為學(xué)習的過程是對學(xué)到對知識進行信息壓縮,在此過程中學(xué)生需要與環(huán)境互動,并在心理上構(gòu)建對知識的理解,而大模型同樣是對訓(xùn)練數(shù)據(jù)進行了壓縮,并能據(jù)此在學(xué)習過程中給出更為及時的反饋,因此能幫助學(xué)生更好的掌握新知識。
不過,這些研究中,實驗者對大模型對使用,都是受到監(jiān)管的。
實驗者設(shè)定了大模型將被如何使用,而家長老師們擔心的,是學(xué)生使用大模型去完成作業(yè),而在此過程中,自己什么都不做,只是復(fù)制粘貼大模型的輸出。而這并不是這些研究要關(guān)注的。
在上述兩項研究中,大模型多被用于對學(xué)生對回答給出反饋和指導(dǎo),這說明要想利用好大模型提升教學(xué)效果,需要注意使用方法,家長和老師要對學(xué)生如何使用大模型給予適當?shù)闹笇?dǎo),切勿放任不管。