美7000萬人或被取代,Agent光速卷入職場!北大校友、楊笛一新作
1769年,瓦特改進了蒸汽機。
1945年,計算機誕生。
2001年,3G移動網(wǎng)絡(luò)開始部署。
這些發(fā)明創(chuàng)新徹底改變了人的生活:從農(nóng)田到工廠,從體力勞動到腦力勞動,從線下工作到線上工作。
2025年,AI智能體來了。這次是好是壞?
AI智能體將帶來規(guī)模最大的職場變革:僅在美國,就有多達7000萬名工人即將面臨這場變革。
但幾乎從來沒有人關(guān)心他們真正的想法。
在AI加速自動化各種工作的時代,斯坦福大學(xué)的研究團隊選擇了另一種路徑:研究美國勞動力中,工人們的意愿與 AI 能力之間的差距。
論文鏈接:https://arxiv.org/abs/2506.06576
博客鏈接:https://futureofwork.saltlab.stanford.edu/
這次,團隊有3大研究發(fā)現(xiàn):
- 職場AI智能體的需求-能力分布圖揭示了AI研究的關(guān)鍵錯配現(xiàn)象:41.0%的Y Combinator企業(yè)任務(wù)集中在低優(yōu)先級區(qū)和自動化「紅燈」區(qū)
- 眾多任務(wù)需要人機對等協(xié)作,但從業(yè)者普遍期望更高程度的人類主導(dǎo)權(quán),這一矛盾可能引發(fā)摩擦
- 若AI智能體開始進入勞動力市場,人類核心能力或?qū)⑥D(zhuǎn)向人際交往與組織協(xié)調(diào)技能。
「AI真香定律」 這項研究對你很有用
這是跨學(xué)科研究團隊:
計算機:Yijia Shao,Humishka Zope,Yucheng Jiang,楊笛一(Diyi Yang)
數(shù)字經(jīng)濟:David Nguyen, Erik Brynjolfsson
計算機+數(shù)字經(jīng)濟:Jiaxin Pei
團隊建立了基于調(diào)查的嚴(yán)謹(jǐn)評估框架,用于摸清在全美各職業(yè)中,AI智能體實現(xiàn)「自動化」和「增強人類能力」的潛力。
利用美國勞工部的數(shù)據(jù)庫,他們開展了以下工作:
- 調(diào)查了104個職業(yè)領(lǐng)域的1500名行業(yè)專家
- 招募了52名AI研究員和開發(fā)者來評估當(dāng)前AI智能體的能力
基于這些數(shù)據(jù),研究人員構(gòu)建了「AI智能體從業(yè)者前景與準(zhǔn)備度知識庫」(Worker Outlook & Readiness Knowledge Bank,WORKBank)。
如果不從事AI相關(guān)工作,為什么你也應(yīng)該關(guān)心這件事?
因為AI的「真香定律」:「你可能對AI不感興趣,但AI終將對你產(chǎn)生興趣?!?/span>
為了指導(dǎo)未來AI智能體的研發(fā),并幫助研究人員人類為未來的工作做好準(zhǔn)備,團隊正式發(fā)布了WORKBank數(shù)據(jù)庫的第一個版本。
AI來襲,職場海嘯?
AI正在職場引發(fā)革命!
2023年,OpenAI等機構(gòu)的研究表明,約80%的美國勞動者可能面臨大語言模型(LLM)影響其至少10%的工作任務(wù),其中19%的勞動者超過半數(shù)職責(zé)或?qū)⑹艿經(jīng)_擊。
論文鏈接:https://arxiv.org/abs/2303.10130
2025年初,Anthropic分析了LLM使用數(shù)據(jù),結(jié)論進一步顯示:
在36%的職業(yè)中,AI工具已活躍應(yīng)用于至少25%的工作任務(wù)。
論文鏈接:https://arxiv.org/abs/2503.04761
對普通打工人而言,AI到底是福是禍?
這一次AI專家攜手經(jīng)濟學(xué)家,直接從一線從業(yè)者反饋獲取洞見。
他們提出了雙視角的審計框架:
一是工人希望AI承擔(dān)哪些任務(wù),
二是專家評估AI實際上能勝任哪些任務(wù)。
為了幫助參與者準(zhǔn)確表達想法,問卷設(shè)計了有邏輯引導(dǎo)的問題,并加入音頻訪談,方便他們結(jié)合實際工作經(jīng)驗回答。
基于這個框架,研究團隊構(gòu)建了WORKBank數(shù)據(jù)庫,用數(shù)據(jù)全面描繪需求和影響:
- 工人的實際需求
- 任務(wù)能否被AI接手的圖譜(意愿—能力分布)
- 不同任務(wù)對人類參與程度的要求(HAS等級)
- 這些變化可能對人類核心技能產(chǎn)生的影響
圖1:審計框架概覽與關(guān)鍵發(fā)現(xiàn)
打工人的欲望與恐懼
為何不愿讓AI智能體介入工作?
利用AI對工人語音回答進行歸類,研究人員總結(jié)了AI自動化最常見的三大擔(dān)憂:
- 45%表示:不信任AI系統(tǒng)的準(zhǔn)確性、能力或可靠性;
- 23%擔(dān)心:AI會取代自己的工作;
- 16.3%認為:AI缺乏「人味」,無法做到人類那種溝通、理解與判斷。
從行業(yè)來看,藝術(shù)、設(shè)計與媒體領(lǐng)域的抵觸情緒最明顯——
在這些領(lǐng)域里,只有17.1%的任務(wù)得到了工人的正面自動化評價。這說明,在更依賴創(chuàng)造力與情感表達的工作中,工人對AI的接受度更低。
哪些任務(wù)愿意讓AI來做?
研究團隊發(fā)現(xiàn),在約46.1%的任務(wù)中,正在從事這些工作的工人表示「愿意讓AI來做」。
即便是在被提醒要考慮「失業(yè)風(fēng)險」或「工作變得無聊」之后,他們依然在問卷中打了超過3分(滿分5分)的支持評分,說明這些任務(wù)更容易被接受自動化。
自動化意愿評分在任務(wù)中的分布??v軸為工人對任務(wù)自動化的意愿評分(1到5分),橫軸為844項任務(wù)的排名
上圖顯示,有46.1%的任務(wù)評分高于3分,表示工人對這些任務(wù)由AI自動完成持積極態(tài)度。
排名前3的任務(wù)包括:
- 報稅員:安排客戶預(yù)約(5.00分)
- 公共安全通信員:維護緊急呼叫相關(guān)信息檔案(4.67分)
- 考勤文員:記錄并調(diào)整因錯誤造成的工資問題(4.60分)
評分最低的3個任務(wù)則是:
- 編輯:撰寫文章、社論或通訊稿(1.60分)
- 物流分析師:聯(lián)系供應(yīng)商了解物料情況(1.50分)
- 售票與旅行服務(wù)員:追蹤客戶行李丟失或延誤情況(1.50分)
為什么工人希望讓AI來接手工作?
研究團隊調(diào)查了支持自動化的工人為什么愿意讓AI來幫忙——通過多選題和自由回答兩種方式。
最常見的理由是:「可以把時間騰出來,去做更有價值的工作」,這項理由被69%的人選中。
其他常見原因包括:任務(wù)太重復(fù)(47%)、太累太有壓力(26%)、或者希望通過AI提升工作質(zhì)量(47%)。
從工人和專家的評分對比中,研究人員把任務(wù)大致分成了四個區(qū)域:
- 綠燈區(qū):工人想交給AI,AI技術(shù)也能勝任。是最理想的自動化對象,有望帶來效率與社會效益雙贏。
- 紅燈區(qū):AI技術(shù)沒問題,但工人不愿意。這類任務(wù)部署AI要小心,容易引發(fā)抵觸或更大爭議。
- 研發(fā)機會區(qū):工人很希望AI來做,但現(xiàn)在AI還做不到。是未來技術(shù)突破的重點方向。
- 低優(yōu)先級區(qū):工人不想交給AI,AI也還做不到。暫時不是AI發(fā)展的重點。
意愿—能力圖譜
這張「意愿—能力圖譜」幫助識別出哪些任務(wù)值得重點投入。
但當(dāng)把YC旗下的創(chuàng)業(yè)公司與這些任務(wù)匹配時,研究人員發(fā)現(xiàn):目前的投資并未優(yōu)先關(guān)注「綠燈區(qū)」或「研發(fā)機會區(qū)」。反而有約41%的YC公司集中在「紅燈區(qū)」或「低優(yōu)先級區(qū)」這些不太受歡迎或技術(shù)難度高的任務(wù)。
換句話說,許多「技術(shù)可行+工人也歡迎」的任務(wù),其實并沒有得到應(yīng)有的重視。
這提醒我們:AI的發(fā)展不僅要看技術(shù)本身,也要看人們真正想要什么。
人機協(xié)作 不只替代,AI更是搭檔
AI智能體對工作的影響并非簡單的「自動化」或「非自動化」這樣的二選一問題。
為此,研究人員引入了「人類能動性等級」(Human Agency Scale):包含 5 個等級的量表,涵蓋了從「完全自動化」到「人機協(xié)作增益」之間的各種狀態(tài)——
在后一種狀態(tài)下,技術(shù)主要用于補充和增強人類的能力。
H1:AI能完全獨立完成任務(wù),無需人參與。
H2:AI能完成大部分任務(wù),偶爾需要人類輸入。
H3:AI和人類平等協(xié)作,效果優(yōu)于任何一方單獨完成。
H4:AI必須依賴人類才能完成任務(wù)。
H5:AI無法獨立完成任務(wù),必須全程由人主導(dǎo)。
這一等級體系不是說「越高越好」,而是用來匹配不同任務(wù)的實際需求。
下圖2展示了這五個等級在不同任務(wù)中的具體例子,比如哪些任務(wù)適合完全交給 AI,哪些則需要人機長期協(xié)作。
HAS不僅能讓人更清楚地理解「AI適合做什么」,也為打工人準(zhǔn)備未來技能、開發(fā)者設(shè)計更合理的AI智能體提供了清晰的參考。
總體上,工人更傾向于較高水平的人類參與,這可能預(yù)示著隨著AI能力增強,會產(chǎn)生一定的摩擦。
在調(diào)查的104種職業(yè)中,有47種工人最傾向的等級是H3——也就是「人機平等協(xié)作」。
這說明,很多工人并不想讓AI全面接管工作,而是希望AI成為有力的合作伙伴。
不過,也出現(xiàn)了值得注意的現(xiàn)象:在將近一半(47.5%)的任務(wù)中,工人希望的「人類參與度」遠超專家估計。
更極端的是,有16.4%的任務(wù),工人希望的等級高出專家評估兩個檔次。這意味著,哪怕AI已經(jīng)技術(shù)上「能做」,很多工人還是不放心、不愿放手。
人類能動性程度在同一職業(yè)內(nèi)部也存在差異,有些任務(wù)適合自動化,有些則不然。
這也提醒開發(fā)者:在設(shè)計AI智能體時,不能一刀切。
為未來做好準(zhǔn)備
并不是所有類型的工作都會同樣受到AI的影響。
為了理解未來工作的走向,以及哪些技能將變得最有價值,研究團隊進一步利用 WORKBank數(shù)據(jù)庫來分析人類技能的變化趨勢。
最后發(fā)現(xiàn)了三項可能影響未來人類工作的趨勢:
- 對信息處理類技能的需求正在減弱。它們在那些人類參與度高的任務(wù)中出現(xiàn)較少。
- 人際溝通與組織管理類技能正變得更重要。它們在高HAS等級的任務(wù)中更為常見。
- 高人類參與度的技能涵蓋多種維度。平均人類參與度最高的前十項技能,跨越了人際、組織、決策與判斷等多個方面。
作者介紹
Yijia Shao是斯坦福大學(xué)的博士生,師從楊笛一教授。
此前,她在北京大學(xué)元培學(xué)院獲得學(xué)士學(xué)位。
她曾在微軟亞洲研究院、谷歌Tensorflow Lite團隊實習(xí)。
她的研究方向為機器學(xué)習(xí)與自然語言處理。