ChatGPT,取代工作or生產(chǎn)力神器?清華校友聯(lián)手發(fā)文:AI時代怎么選工作
自2022年11月30日發(fā)布以來,ChatGPT的月活躍用戶數(shù)量已經(jīng)達到大約1億人,創(chuàng)造了最快增長的消費類應(yīng)用紀錄。
雖然AI極大地提高了人們的工作效率。但隨著對不同領(lǐng)域的滲透,促使人們重新審視「技術(shù)取代」的問題。
最新研究則揭示了「拐點」的存在:一旦AI取代效應(yīng)占主導(dǎo)地位,它將無法逆轉(zhuǎn)。
具體而言,作者在理論上,提出了AI進步對自由職業(yè)者影響的「拐點」:在AI能力超越拐點之前,自由職業(yè)者始終從AI的進步中受益;但在AI能力跨越拐點之后,隨著AI的進步,自由職業(yè)者都會變得更加不利。
文章引起了網(wǎng)友對就業(yè)市場的擔(dān)心:
以往的企業(yè)高管或AI專家,更多在理論上,預(yù)測AI的智能水平可以取代人類從事哪些工作。
這次研究不僅提出了一般就業(yè)市場的「拐點猜想」,而且還用數(shù)據(jù)證明了:在不同的在線勞動力市場(online labor markets,OLMs)中,寫作、咨詢、編程相關(guān)崗位更多體現(xiàn)的是取代效應(yīng),運營、創(chuàng)意更多體現(xiàn)的生產(chǎn)力效應(yīng)。前者表現(xiàn)為工作機會和收入將逐漸減少,而后者卻完全相反。
研究的主要亮點如下:
- 對在線勞動平臺,翻譯和網(wǎng)頁開發(fā)的實證研究,證實了AI的取代效應(yīng)和生產(chǎn)力效應(yīng)。
- 利用Cournot競爭模型,在適當(dāng)假設(shè)下得到了「拐點猜想」:隨著AI能力的不斷提升,崗位數(shù)量和報酬水平會先升高(也就是生產(chǎn)力效應(yīng));但一旦超過某個閾值后,崗位數(shù)量和報酬水平會不可逆轉(zhuǎn)的下滑(也就是替代效應(yīng))。
- 根據(jù)「拐點猜想」,分析了在線勞動平臺上其他崗位,再次證明了AI的能力一旦超過拐點,則會出現(xiàn)不可逆轉(zhuǎn)的替代效應(yīng)。
- 結(jié)果表明在寫作、咨詢、編程、運營和創(chuàng)意等相關(guān)崗位,AI的取代效應(yīng)依次減弱。
該研究發(fā)表在2025年第58屆夏威夷系統(tǒng)科學(xué)年會上,作者來自新加坡國立大學(xué)、羅切斯特大學(xué)和清華大學(xué)。值得一提的是,他們?nèi)际乔迦A校友。
論文地址:https://scholarspace.manoa.hawaii.edu/server/api/core/bitstreams/4f39375d-59c2-4c4a-b394-f3eed7858c80/content
爭議焦點
這一爭議的核心在于:信息技術(shù)(IT)能夠?qū)⒃S多任務(wù)自動化,從而提升人類勞動的生產(chǎn)力,但也可能導(dǎo)致勞動力被技術(shù)所取代。
這兩種對立的效應(yīng)稱為取代效應(yīng)和生產(chǎn)力效應(yīng)。
這兩股相反的力量相互競爭,共同決定技術(shù)如何最終影響勞動力市場。
在以往的相關(guān)文獻中,技術(shù)本身通常被當(dāng)作黑箱處理,作為生產(chǎn)函數(shù)中的一個因素與人類勞動一起作用于經(jīng)濟。然而,這種宏觀視角的做法忽視了具體技術(shù)的影響,側(cè)重于任意自動化技術(shù)的長期效果。
然而,考慮到當(dāng)前AI技術(shù)的飛速發(fā)展,了解AI對勞動市場的影響顯得尤為重要,尤其是對在線勞動市場(OLM)的影響。
與較為穩(wěn)定的全職工作不同,自由職業(yè)工作更加容易受到市場變化的影響。作者預(yù)計,AI創(chuàng)新對工作市場的影響將首先在自由職業(yè)市場上顯現(xiàn)。
主要內(nèi)容
文章直接回答了一個問題:為什么相同的AI創(chuàng)新,在不同類型的工作中會產(chǎn)生完全相反的效果?
為了解決這一問題,作者收集了跨多個職業(yè)的個人級數(shù)據(jù),并提出了「拐點假設(shè)」來解釋實證發(fā)現(xiàn),從而為未來的實證研究和理論分析提供了新的視角。
具體而言,作者從頗受歡迎的在線勞動平臺收集了數(shù)據(jù)。通過采用雙重差分(Difference-in-Difference, DiD)設(shè)計,發(fā)現(xiàn)在線勞動力市場中自由職業(yè)者受ChatGPT的影響,呈現(xiàn)兩種不同情況:
1)翻譯與本地化OLM的取代效應(yīng),表現(xiàn)為工作機會和收入的減少;
2)網(wǎng)頁開發(fā)OLM的生產(chǎn)力效應(yīng),表現(xiàn)為工作機會和收入的增加。
為了理解AI對自由職業(yè)者產(chǎn)生不同影響的原因,作者建立了Cournot競爭模型。
在競爭模型中,AI因為取代效應(yīng)降低了市場潛力,但生產(chǎn)力效應(yīng)降低了邊際成本。
盡管是個簡化模型,但它暗示每個職業(yè)都有一個拐點。
在AI達到某一職業(yè)的拐點之前,人類勞動能夠從AI性能的進步中獲益,體驗到的是生產(chǎn)力效應(yīng)。然而,一旦AI超越拐點,進一步提升AI性能,將對人類勞動產(chǎn)生負面影響,展現(xiàn)出取代效應(yīng)。
為了更全面地描繪AI的影響,還進行了額外的實證分析,展示AI如何影響不同類別的市場。這些估算結(jié)果進一步揭示了AI對自由職業(yè)者可能帶來的兩種不同情境。
此外,作者還考慮了ChatGPT 4.0的發(fā)布帶來新的影響,并評估比較了ChatGPT 3.5和4.0的區(qū)別。實證結(jié)果揭示了這兩次AI升級的三種模式:1)兩種取代效應(yīng);2)從生產(chǎn)力效應(yīng)過渡到取代效應(yīng);3)兩種生產(chǎn)力效應(yīng)。
值得注意的是,我們還沒有從取代效應(yīng)主導(dǎo)的模式過渡到生產(chǎn)力效應(yīng)主導(dǎo)的模式,這與拐點假設(shè)相一致,表明一旦取代效應(yīng)占主導(dǎo)地位,它將無法逆轉(zhuǎn)。
實證背景
職業(yè)選擇
作者將ChatGPT的發(fā)布視作一個外部沖擊。ChatGPT于2022年11月30日發(fā)布,并對多種任務(wù)產(chǎn)生了顯著影響。它是第一個獲得主流認可的GenAI工具,因此成為研究AI沖擊的理想對象。
在自由職業(yè)平臺中,作者重點關(guān)注了兩個受AI影響較大的工作市場,即翻譯與本地化和網(wǎng)頁開發(fā),這兩個領(lǐng)域的LLM在執(zhí)行相關(guān)任務(wù)時表現(xiàn)出了出色的能力。
首先,LLM在實際環(huán)境中完成各種翻譯任務(wù)的能力已經(jīng)得到驗證。
研究人員和從業(yè)者已表明,ChatGPT與流行的翻譯工具(如Google Translate和DeepL)不相上下,并且能生成上下文相關(guān)的內(nèi)容。ChatGPT在某些語言考試中的表現(xiàn)甚至優(yōu)于人類。
因此,作者選擇了翻譯與本地化OLM作為研究AI影響的一個重點。
其次,近期研究發(fā)現(xiàn),使用GitHub Copilot時,網(wǎng)頁開發(fā)人員實現(xiàn)HTTP網(wǎng)頁的速度可以提升55.8%。
網(wǎng)頁開發(fā)工作涉及多種任務(wù),要求具備全面的技能,如編程能力、系統(tǒng)規(guī)劃和設(shè)計專長。
雖然ChatGPT不能完全獨立完成所有任務(wù),但在調(diào)試代碼和識別功能等方面,它已能夠為人類程序員提供支持。因此,作者選擇了網(wǎng)頁開發(fā)OLM作為分析的另一個重點。
最后,作者選擇了建筑設(shè)計OLM作為對照組,因為已有研究表明這是ChatGPT影響最小的行業(yè)之一。
將ChatGPT集成到像3D Max等建筑設(shè)計軟件,仍處于概念階段,AI還不能獨立實施實際項目。因此,建筑設(shè)計OLM中的自由職業(yè)者可以作為一個良好的對照組。
此外,作者通過利用Felten等提出的AI職業(yè)暴露指數(shù)(AIOE)和谷歌搜索量指數(shù)(SVI),評估了ChatGPT對這三個市場的影響程度。
首先,作者將三個市場與AIOE指數(shù)進行映射,將每個市場與AIOE數(shù)據(jù)庫中最相關(guān)的職業(yè)關(guān)聯(lián)起來,并計算出平均AIOE指數(shù),如圖1所示。
其次,作者通過共同搜索ChatGPT和特定市場名稱,獲得了Google的搜索量指數(shù)(search volume index,SVI),并繪制了圖2中的每周時間趨勢。
結(jié)果表明,建筑設(shè)計OLM受到ChatGPT影響較小,而網(wǎng)頁開發(fā)OLM和翻譯與本地化OLM受到了更顯著的影響,這支持了作者選擇受影響市場和對照市場進行進一步分析。
數(shù)據(jù)與變量
作者通過定位平臺提供的相關(guān)「專業(yè)」分類,識別了上述三種在線勞動力市場中的工人。
由于平臺的數(shù)據(jù)檢索限制,作者獲得了來自建筑設(shè)計OLM的6743名工作者、翻譯與本地化OLM的7582名工作者和網(wǎng)頁開發(fā)OLM的1.5萬名工作者的個人資料和工作歷史。
隨后,剔除了在2022年11月1日之前未接受任何工作的非活躍工作者,并按月將數(shù)據(jù)聚合到個人層面。
在文中,作者將與主要勞動市場相關(guān)的工作定義為「核心工作」,而將其他工作定義為「非核心工作」。通過關(guān)鍵詞搜索,作者確定了自由職業(yè)者的核心工作。隨后,基于工作者在給定月份接受的核心工作來構(gòu)建度量,而非基于已完成的工作。
為了考慮ChatGPT發(fā)布前的潛在影響和假期效應(yīng),作者排除了2022年11月和12月的數(shù)據(jù)。因此,研究的時間框架涵蓋了沖擊發(fā)生前的六個月和沖擊發(fā)生后的十個月,時間跨度為2022年5月1日至2023年10月31日。
表1提供了主要分析中關(guān)鍵變量的定義和描述性統(tǒng)計數(shù)據(jù)。
職場「雙城記」
識別策略
為了考察AI對自由職業(yè)者的影響,作者使用了以下固定效應(yīng)雙重差分法(DiD)模型進行識別。
為了確保被處理組和控制組的工人可比,作者還使用了傾向得分匹配(PSM)方法,通過考慮工作者的經(jīng)驗、接受的核心工作總數(shù)、工資(即核心工作的平均價格和小時費率)以及工作質(zhì)量(即核心工作的平均評分)來改善樣本平衡。
所有這些變量只考慮了ChatGPT發(fā)布前的工作記錄。
作者采用了1:1最近鄰匹配策略,并排除了落在公共支持公共區(qū)域之外的觀察值。
翻譯與本地化在線市場
第一次分析考察了ChatGPT對翻譯人員的影響,并將建筑設(shè)計OLM的工人作為控制組。
總體而言,論文發(fā)現(xiàn),與建筑設(shè)計OLM相比,ChatGPT對翻譯與本地化OLM產(chǎn)生了顯著的替代效應(yīng)。
在ChatGPT發(fā)布后,工作者們接受的核心工作數(shù)量的絕對數(shù)顯著下降了9.0%,在相對意義上接受的核心工作數(shù)量也有所減少;從核心工作中獲得的收入也減少了29.7%。
這些結(jié)果表明,ChatGPT具備了足夠的語言理解能力,能夠處理翻譯任務(wù),從而對該領(lǐng)域的從業(yè)者產(chǎn)生了替代效應(yīng)。
網(wǎng)頁開發(fā)在線市場
作者的第二次分析考察了ChatGPT對網(wǎng)頁開發(fā)人員的影響,同樣將建筑設(shè)計OLM的工作者作為控制組。
與建筑設(shè)計OLM相比,ChatGPT發(fā)布后,網(wǎng)頁開發(fā)人員的交易量平均顯著增加了6.4%。在相對交易量方面也存在類似情況。
此外,ChatGPT的發(fā)布顯著提高了網(wǎng)頁開發(fā)人員的月收入,增加了66.5%。
這些結(jié)果表明,ChatGPT不太可能自動化網(wǎng)頁開發(fā)的過程,而是作為助手來提高了網(wǎng)頁開發(fā)人員的生產(chǎn)力。
可能是因為網(wǎng)頁開發(fā)工作需要多方面的知識和精心的規(guī)劃,而ChatGPT從互聯(lián)網(wǎng)文本中學(xué)習(xí),難以成為合格的網(wǎng)頁開發(fā)人員,從而對網(wǎng)頁開發(fā)人員產(chǎn)生了生產(chǎn)力效應(yīng)。
拐點猜想
AI與職業(yè)的局部轉(zhuǎn)折點
為了探討為什么AI的進步對不同職業(yè)市場中的工人產(chǎn)生不同的影響,作者構(gòu)建了一個微觀模型來分析AI在作者實證背景中的作用。
考慮一個Cournot競爭模型,其中有n個工人,每個工人都以相同的邊際成本提供相同的服務(wù)。
這個模型包含三個基本概念。
首先,職業(yè)代表市場中的一種工作類別,在本研究的背景下通常被稱為OLM(職業(yè)勞動市場)。其次,工作是發(fā)布在自由職業(yè)平臺上的具體項目或任務(wù)。最后,任務(wù)是成功完成工作所需的最小認知單元。該模型基于由多個任務(wù)組成的工作。
假設(shè)邊際成本為(1?a)c,其中c>0,a∈[0, 1]。作者將a解釋為在提供服務(wù)過程中,AI能夠成功完成任務(wù)的百分比。因此,c表示工人在沒有使用任何AI幫助的情況下的邊際成本。
服務(wù)的市場需求由以下公式確定:
其中p為價格,qi為工人i提供的服務(wù)數(shù)量,S(a)表示市場潛力。S(a)隨著a的增加而遞減。
對于那些AI技術(shù)更為熟練的潛在雇主,AI可以更可靠且更能勝任他們發(fā)布的主要工作,這使得他們更傾向于用AI替代人工勞動。
隨著AI的改進,即a的增加,更多潛在的雇主會進入這一類別,從而減少市場潛力。此外,S(a)可能是凹函數(shù)的,因為技術(shù)的采用通常隨著技術(shù)的成熟而加速。
有幾種可能的機制。
首先,隨著AI表現(xiàn)的提高,更多的雇主將使用它,這會產(chǎn)生更多的口碑推薦,從而促進更多的采用。
其次,由于更多雇主使用AI,會產(chǎn)生積極的外部效應(yīng),因為AI的使用傳播了專業(yè)知識和最佳實踐。
第三,創(chuàng)新型企業(yè)將開發(fā)專門的軟件來幫助特定職業(yè)使用AI,因為隨著AI變得越來越強大,它能夠幫助完成這一類工作。作者對技術(shù)假設(shè)進行了約束:|S′(0)|<c和|S'(1)|>c,以避免出現(xiàn)不相關(guān)的情況。
工人的目標是獲取最大利潤:
最后的Nash均衡(Nash equilibrium)狀態(tài)下的價格、利潤和收入為
附加一些對S(a)函數(shù)的技術(shù)性假設(shè),最后作者的得到了「拐點猜想」:
簡而言之,在AI的能力比較低時,a小于「拐點」,相關(guān)崗位數(shù)量和利潤會隨著AI能力的增加而增加;但當(dāng)AI的能力足夠大時,a大于「拐點」,AI能力越強,相關(guān)崗位的數(shù)量、收益、利潤越少,被AI消滅的崗位數(shù)量越多。而且一旦超越拐點,替代效應(yīng)將無法逆轉(zhuǎn)。
其他崗位分析
利用其他市場的交易數(shù)據(jù),論文研究了AI在不同職業(yè)勞動市場(OLM)中的異質(zhì)性影響。
在主分析中包含的職位類別之外,作者為每個額外的類別選擇了一個特定的職業(yè)勞動市場,并采用與主分析相同的方法進行研究。
不同模型的結(jié)果(見表6)揭示了AI的兩種不同效應(yīng),表明不同職業(yè)有不同的拐點。
此外,作者進一步考慮了2023年3月14日發(fā)布的ChatGPT 4.0作為AI的第二次升級,并估算了ChatGPT 3.5和4.0對上述十一種職業(yè)勞動市場(OLM)的影響。
以下是用于估算的固定效應(yīng)雙差分(DiD)模型。
根據(jù)「拐點猜想」,只有三種可能的結(jié)果:
1)持續(xù)保持生產(chǎn)力效應(yīng):AI在兩次升級后仍低于拐點。
2)從生產(chǎn)力效應(yīng)轉(zhuǎn)變?yōu)槿〈?yīng):AI在第一次升級后沒有達到拐點,但在第二次升級后超過了拐點。
3)持續(xù)保持取代效應(yīng):AI在第一次升級后超過拐點,并在第二次升級后繼續(xù)超過拐點。
表7中呈現(xiàn)的結(jié)果證實了這三種結(jié)果同時存在,而且沒有任何市場經(jīng)歷能從取代效應(yīng)轉(zhuǎn)變?yōu)樯a(chǎn)力效應(yīng)。
這一發(fā)現(xiàn)表明,一旦AI越過了某項工作的拐點,隨著進一步升級,AI不可能恢復(fù)到拐點以下。
具體結(jié)論與建議
與寫作相關(guān)的OLM(例如,專業(yè)與商業(yè)寫作)特別容易受到取代效應(yīng)的影響。
與咨詢相關(guān)的OLM(例如,國際法與移民法)通常為客戶提供專門的建議以支持其決策,隨著ChatGPT能力和知識庫的擴展,這些領(lǐng)域可能越來越面臨取代效應(yīng)。
與編程相關(guān)的OLM(例如,網(wǎng)頁開發(fā)),在這些領(lǐng)域,ChatGPT表現(xiàn)良好,目前正經(jīng)歷生產(chǎn)力的提升。然而,ChatGPT有可能取代程序員,并最終導(dǎo)致未來的取代效應(yīng)。
相比之下,與運營相關(guān)的OLM(例如,項目管理)和創(chuàng)意相關(guān)的OLM(例如,攝影)需要大量的人際互動、專門知識或創(chuàng)造性思維,而ChatGPT在這些方面的能力較弱。因此,這些市場可能會繼續(xù)經(jīng)歷顯著的生產(chǎn)力提升。
與以往在宏觀層面進行AI與勞動關(guān)系的研究相比,新模型是在微觀層面上進行的,結(jié)合了大語言模型的內(nèi)在特性和工作特征。這些發(fā)現(xiàn)對未來工作具有重要的實踐意義。
從工作者的角度來看,這項研究突出了AI的雙重作用。一方面觀察到某些市場的衰退,促使個人重新考慮職業(yè)道路。與此同時,鼓勵從業(yè)者與AI合作,提升生產(chǎn)力,并在繁榮的市場中抓住機會。
平臺方面,也建議進行戰(zhàn)略性資源重新配置,如創(chuàng)建基于AI的新型工作市場。在快速發(fā)展的數(shù)字經(jīng)濟中,這些調(diào)整將有助于平臺保持競爭優(yōu)勢。
作者簡介
夏威夷系統(tǒng)科學(xué)年會,全稱Hawaii International Conference on System Sciences,簡稱HICSS,是信息系統(tǒng)技術(shù)領(lǐng)域歷史最悠久的科學(xué)會議。
自1968年以來,它吸引了世界各地來自學(xué)術(shù)界、工業(yè)界和政府機構(gòu)的高水平學(xué)者和專業(yè)人士,來展示他們的前沿研究。過去的五十年中,在HICSS上發(fā)表的研究論文有效促進了全球范圍內(nèi)信息系統(tǒng)和技術(shù)的創(chuàng)新和發(fā)展。
Dandan Qiao,2018.07-至今任新加坡國立大學(xué)信息與分析系統(tǒng)助理教授。
她在2018年獲得清華大學(xué)信息系統(tǒng)博士學(xué)位,本科畢業(yè)于北京郵電大學(xué)信息系統(tǒng)專業(yè),曾在2015.08-2017.09期間前往德克薩斯大學(xué)奧斯汀分校進行訪學(xué)。
Huaxia Rui,目前任羅切斯特大學(xué)西蒙商學(xué)院施樂計算機與信息系統(tǒng)講座教授。
從2000-2007年,他在清華大學(xué)攻讀控制理論與工程學(xué)士和碩士學(xué)位,之后前往德克薩斯大學(xué)奧斯汀分校攻讀經(jīng)濟學(xué)系碩士和麥考姆斯商學(xué)院博士。
博士畢業(yè)后,入職羅切斯特大學(xué)西蒙商學(xué)院,先后任助理教授、終身副教授、教授。
Qian Xiong,目前是清華大學(xué)與新加坡國立大學(xué)聯(lián)合培養(yǎng)博士生。2020年,于武漢大學(xué)獲得土木工程工學(xué)學(xué)士學(xué)位。