美7000萬(wàn)人或被取代,Agent光速卷入職場(chǎng)!北大校友、楊笛一新作
1769年,瓦特改進(jìn)了蒸汽機(jī)。
1945年,計(jì)算機(jī)誕生。
2001年,3G移動(dòng)網(wǎng)絡(luò)開(kāi)始部署。
這些發(fā)明創(chuàng)新徹底改變了人的生活:從農(nóng)田到工廠(chǎng),從體力勞動(dòng)到腦力勞動(dòng),從線(xiàn)下工作到線(xiàn)上工作。
2025年,AI智能體來(lái)了。這次是好是壞?
AI智能體將帶來(lái)規(guī)模最大的職場(chǎng)變革:僅在美國(guó),就有多達(dá)7000萬(wàn)名工人即將面臨這場(chǎng)變革。
但幾乎從來(lái)沒(méi)有人關(guān)心他們真正的想法。

在A(yíng)I加速自動(dòng)化各種工作的時(shí)代,斯坦福大學(xué)的研究團(tuán)隊(duì)選擇了另一種路徑:研究美國(guó)勞動(dòng)力中,工人們的意愿與 AI 能力之間的差距。

論文鏈接:https://arxiv.org/abs/2506.06576
博客鏈接:https://futureofwork.saltlab.stanford.edu/
這次,團(tuán)隊(duì)有3大研究發(fā)現(xiàn):
- 職場(chǎng)AI智能體的需求-能力分布圖揭示了AI研究的關(guān)鍵錯(cuò)配現(xiàn)象:41.0%的Y Combinator企業(yè)任務(wù)集中在低優(yōu)先級(jí)區(qū)和自動(dòng)化「紅燈」區(qū)
- 眾多任務(wù)需要人機(jī)對(duì)等協(xié)作,但從業(yè)者普遍期望更高程度的人類(lèi)主導(dǎo)權(quán),這一矛盾可能引發(fā)摩擦
- 若AI智能體開(kāi)始進(jìn)入勞動(dòng)力市場(chǎng),人類(lèi)核心能力或?qū)⑥D(zhuǎn)向人際交往與組織協(xié)調(diào)技能。
「AI真香定律」 這項(xiàng)研究對(duì)你很有用
這是跨學(xué)科研究團(tuán)隊(duì):
計(jì)算機(jī):Yijia Shao,Humishka Zope,Yucheng Jiang,楊笛一(Diyi Yang)
數(shù)字經(jīng)濟(jì):David Nguyen, Erik Brynjolfsson
計(jì)算機(jī)+數(shù)字經(jīng)濟(jì):Jiaxin Pei
團(tuán)隊(duì)建立了基于調(diào)查的嚴(yán)謹(jǐn)評(píng)估框架,用于摸清在全美各職業(yè)中,AI智能體實(shí)現(xiàn)「自動(dòng)化」和「增強(qiáng)人類(lèi)能力」的潛力。
利用美國(guó)勞工部的數(shù)據(jù)庫(kù),他們開(kāi)展了以下工作:
- 調(diào)查了104個(gè)職業(yè)領(lǐng)域的1500名行業(yè)專(zhuān)家
- 招募了52名AI研究員和開(kāi)發(fā)者來(lái)評(píng)估當(dāng)前AI智能體的能力
基于這些數(shù)據(jù),研究人員構(gòu)建了「AI智能體從業(yè)者前景與準(zhǔn)備度知識(shí)庫(kù)」(Worker Outlook & Readiness Knowledge Bank,WORKBank)。
如果不從事AI相關(guān)工作,為什么你也應(yīng)該關(guān)心這件事?
因?yàn)锳I的「真香定律」:「你可能對(duì)AI不感興趣,但AI終將對(duì)你產(chǎn)生興趣?!?/span>
為了指導(dǎo)未來(lái)AI智能體的研發(fā),并幫助研究人員人類(lèi)為未來(lái)的工作做好準(zhǔn)備,團(tuán)隊(duì)正式發(fā)布了WORKBank數(shù)據(jù)庫(kù)的第一個(gè)版本。
AI來(lái)襲,職場(chǎng)海嘯?
AI正在職場(chǎng)引發(fā)革命!
2023年,OpenAI等機(jī)構(gòu)的研究表明,約80%的美國(guó)勞動(dòng)者可能面臨大語(yǔ)言模型(LLM)影響其至少10%的工作任務(wù),其中19%的勞動(dòng)者超過(guò)半數(shù)職責(zé)或?qū)⑹艿經(jīng)_擊。

論文鏈接:https://arxiv.org/abs/2303.10130
2025年初,Anthropic分析了LLM使用數(shù)據(jù),結(jié)論進(jìn)一步顯示:
在36%的職業(yè)中,AI工具已活躍應(yīng)用于至少25%的工作任務(wù)。

論文鏈接:https://arxiv.org/abs/2503.04761
對(duì)普通打工人而言,AI到底是福是禍?
這一次AI專(zhuān)家攜手經(jīng)濟(jì)學(xué)家,直接從一線(xiàn)從業(yè)者反饋獲取洞見(jiàn)。
他們提出了雙視角的審計(jì)框架:
一是工人希望AI承擔(dān)哪些任務(wù),
二是專(zhuān)家評(píng)估AI實(shí)際上能勝任哪些任務(wù)。
為了幫助參與者準(zhǔn)確表達(dá)想法,問(wèn)卷設(shè)計(jì)了有邏輯引導(dǎo)的問(wèn)題,并加入音頻訪(fǎng)談,方便他們結(jié)合實(shí)際工作經(jīng)驗(yàn)回答。
基于這個(gè)框架,研究團(tuán)隊(duì)構(gòu)建了WORKBank數(shù)據(jù)庫(kù),用數(shù)據(jù)全面描繪需求和影響:
- 工人的實(shí)際需求
- 任務(wù)能否被AI接手的圖譜(意愿—能力分布)
- 不同任務(wù)對(duì)人類(lèi)參與程度的要求(HAS等級(jí))
- 這些變化可能對(duì)人類(lèi)核心技能產(chǎn)生的影響

圖1:審計(jì)框架概覽與關(guān)鍵發(fā)現(xiàn)
打工人的欲望與恐懼
為何不愿讓AI智能體介入工作?
利用AI對(duì)工人語(yǔ)音回答進(jìn)行歸類(lèi),研究人員總結(jié)了AI自動(dòng)化最常見(jiàn)的三大擔(dān)憂(yōu):
- 45%表示:不信任AI系統(tǒng)的準(zhǔn)確性、能力或可靠性;
- 23%擔(dān)心:AI會(huì)取代自己的工作;
- 16.3%認(rèn)為:AI缺乏「人味」,無(wú)法做到人類(lèi)那種溝通、理解與判斷。
從行業(yè)來(lái)看,藝術(shù)、設(shè)計(jì)與媒體領(lǐng)域的抵觸情緒最明顯——
在這些領(lǐng)域里,只有17.1%的任務(wù)得到了工人的正面自動(dòng)化評(píng)價(jià)。這說(shuō)明,在更依賴(lài)創(chuàng)造力與情感表達(dá)的工作中,工人對(duì)AI的接受度更低。

哪些任務(wù)愿意讓AI來(lái)做?
研究團(tuán)隊(duì)發(fā)現(xiàn),在約46.1%的任務(wù)中,正在從事這些工作的工人表示「愿意讓AI來(lái)做」。
即便是在被提醒要考慮「失業(yè)風(fēng)險(xiǎn)」或「工作變得無(wú)聊」之后,他們依然在問(wèn)卷中打了超過(guò)3分(滿(mǎn)分5分)的支持評(píng)分,說(shuō)明這些任務(wù)更容易被接受自動(dòng)化。

自動(dòng)化意愿評(píng)分在任務(wù)中的分布??v軸為工人對(duì)任務(wù)自動(dòng)化的意愿評(píng)分(1到5分),橫軸為844項(xiàng)任務(wù)的排名
上圖顯示,有46.1%的任務(wù)評(píng)分高于3分,表示工人對(duì)這些任務(wù)由AI自動(dòng)完成持積極態(tài)度。
排名前3的任務(wù)包括:
- 報(bào)稅員:安排客戶(hù)預(yù)約(5.00分)
- 公共安全通信員:維護(hù)緊急呼叫相關(guān)信息檔案(4.67分)
- 考勤文員:記錄并調(diào)整因錯(cuò)誤造成的工資問(wèn)題(4.60分)
評(píng)分最低的3個(gè)任務(wù)則是:
- 編輯:撰寫(xiě)文章、社論或通訊稿(1.60分)
- 物流分析師:聯(lián)系供應(yīng)商了解物料情況(1.50分)
- 售票與旅行服務(wù)員:追蹤客戶(hù)行李丟失或延誤情況(1.50分)
為什么工人希望讓AI來(lái)接手工作?
研究團(tuán)隊(duì)調(diào)查了支持自動(dòng)化的工人為什么愿意讓AI來(lái)幫忙——通過(guò)多選題和自由回答兩種方式。
最常見(jiàn)的理由是:「可以把時(shí)間騰出來(lái),去做更有價(jià)值的工作」,這項(xiàng)理由被69%的人選中。
其他常見(jiàn)原因包括:任務(wù)太重復(fù)(47%)、太累太有壓力(26%)、或者希望通過(guò)AI提升工作質(zhì)量(47%)。

從工人和專(zhuān)家的評(píng)分對(duì)比中,研究人員把任務(wù)大致分成了四個(gè)區(qū)域:
- 綠燈區(qū):工人想交給AI,AI技術(shù)也能勝任。是最理想的自動(dòng)化對(duì)象,有望帶來(lái)效率與社會(huì)效益雙贏(yíng)。
- 紅燈區(qū):AI技術(shù)沒(méi)問(wèn)題,但工人不愿意。這類(lèi)任務(wù)部署AI要小心,容易引發(fā)抵觸或更大爭(zhēng)議。
- 研發(fā)機(jī)會(huì)區(qū):工人很希望AI來(lái)做,但現(xiàn)在A(yíng)I還做不到。是未來(lái)技術(shù)突破的重點(diǎn)方向。
- 低優(yōu)先級(jí)區(qū):工人不想交給AI,AI也還做不到。暫時(shí)不是AI發(fā)展的重點(diǎn)。

意愿—能力圖譜
這張「意愿—能力圖譜」幫助識(shí)別出哪些任務(wù)值得重點(diǎn)投入。
但當(dāng)把YC旗下的創(chuàng)業(yè)公司與這些任務(wù)匹配時(shí),研究人員發(fā)現(xiàn):目前的投資并未優(yōu)先關(guān)注「綠燈區(qū)」或「研發(fā)機(jī)會(huì)區(qū)」。反而有約41%的YC公司集中在「紅燈區(qū)」或「低優(yōu)先級(jí)區(qū)」這些不太受歡迎或技術(shù)難度高的任務(wù)。

換句話(huà)說(shuō),許多「技術(shù)可行+工人也歡迎」的任務(wù),其實(shí)并沒(méi)有得到應(yīng)有的重視。
這提醒我們:AI的發(fā)展不僅要看技術(shù)本身,也要看人們真正想要什么。
人機(jī)協(xié)作 不只替代,AI更是搭檔
AI智能體對(duì)工作的影響并非簡(jiǎn)單的「自動(dòng)化」或「非自動(dòng)化」這樣的二選一問(wèn)題。
為此,研究人員引入了「人類(lèi)能動(dòng)性等級(jí)」(Human Agency Scale):包含 5 個(gè)等級(jí)的量表,涵蓋了從「完全自動(dòng)化」到「人機(jī)協(xié)作增益」之間的各種狀態(tài)——
在后一種狀態(tài)下,技術(shù)主要用于補(bǔ)充和增強(qiáng)人類(lèi)的能力。
H1:AI能完全獨(dú)立完成任務(wù),無(wú)需人參與。
H2:AI能完成大部分任務(wù),偶爾需要人類(lèi)輸入。
H3:AI和人類(lèi)平等協(xié)作,效果優(yōu)于任何一方單獨(dú)完成。
H4:AI必須依賴(lài)人類(lèi)才能完成任務(wù)。
H5:AI無(wú)法獨(dú)立完成任務(wù),必須全程由人主導(dǎo)。
這一等級(jí)體系不是說(shuō)「越高越好」,而是用來(lái)匹配不同任務(wù)的實(shí)際需求。
下圖2展示了這五個(gè)等級(jí)在不同任務(wù)中的具體例子,比如哪些任務(wù)適合完全交給 AI,哪些則需要人機(jī)長(zhǎng)期協(xié)作。

HAS不僅能讓人更清楚地理解「AI適合做什么」,也為打工人準(zhǔn)備未來(lái)技能、開(kāi)發(fā)者設(shè)計(jì)更合理的AI智能體提供了清晰的參考。
總體上,工人更傾向于較高水平的人類(lèi)參與,這可能預(yù)示著隨著AI能力增強(qiáng),會(huì)產(chǎn)生一定的摩擦。
在調(diào)查的104種職業(yè)中,有47種工人最傾向的等級(jí)是H3——也就是「人機(jī)平等協(xié)作」。
這說(shuō)明,很多工人并不想讓AI全面接管工作,而是希望AI成為有力的合作伙伴。

不過(guò),也出現(xiàn)了值得注意的現(xiàn)象:在將近一半(47.5%)的任務(wù)中,工人希望的「人類(lèi)參與度」遠(yuǎn)超專(zhuān)家估計(jì)。
更極端的是,有16.4%的任務(wù),工人希望的等級(jí)高出專(zhuān)家評(píng)估兩個(gè)檔次。這意味著,哪怕AI已經(jīng)技術(shù)上「能做」,很多工人還是不放心、不愿放手。

人類(lèi)能動(dòng)性程度在同一職業(yè)內(nèi)部也存在差異,有些任務(wù)適合自動(dòng)化,有些則不然。
這也提醒開(kāi)發(fā)者:在設(shè)計(jì)AI智能體時(shí),不能一刀切。

為未來(lái)做好準(zhǔn)備
并不是所有類(lèi)型的工作都會(huì)同樣受到AI的影響。
為了理解未來(lái)工作的走向,以及哪些技能將變得最有價(jià)值,研究團(tuán)隊(duì)進(jìn)一步利用 WORKBank數(shù)據(jù)庫(kù)來(lái)分析人類(lèi)技能的變化趨勢(shì)。
最后發(fā)現(xiàn)了三項(xiàng)可能影響未來(lái)人類(lèi)工作的趨勢(shì):
- 對(duì)信息處理類(lèi)技能的需求正在減弱。它們?cè)谀切┤祟?lèi)參與度高的任務(wù)中出現(xiàn)較少。
- 人際溝通與組織管理類(lèi)技能正變得更重要。它們?cè)诟逪AS等級(jí)的任務(wù)中更為常見(jiàn)。
- 高人類(lèi)參與度的技能涵蓋多種維度。平均人類(lèi)參與度最高的前十項(xiàng)技能,跨越了人際、組織、決策與判斷等多個(gè)方面。

作者介紹
Yijia Shao是斯坦福大學(xué)的博士生,師從楊笛一教授。
此前,她在北京大學(xué)元培學(xué)院獲得學(xué)士學(xué)位。

她曾在微軟亞洲研究院、谷歌Tensorflow Lite團(tuán)隊(duì)實(shí)習(xí)。
她的研究方向?yàn)闄C(jī)器學(xué)習(xí)與自然語(yǔ)言處理。






























