不好美國要捧殺了!新研究:中國正在成為全球科學(xué)領(lǐng)導(dǎo)者
發(fā)表于2024年6月,卻在當(dāng)下登上《美國國家科學(xué)院院刊》,然后還被硅谷熱議了。
究竟是什么論文?
答案揭曉:中美科技實力大PK,以及得出的結(jié)論是——中國正在成為全球科學(xué)領(lǐng)導(dǎo)者。
和以往比比論文量、引用數(shù)不同,這項研究通過引入機器學(xué)習(xí)模型,分析了600萬份論文的作者署名模式、通訊作者身份、機構(gòu)影響力等多重線索,核心評估了“團隊領(lǐng)導(dǎo)者”這一指標(biāo)。
研究人員表示,通過關(guān)注中國科學(xué)家在跨國合作中權(quán)力地位的變化:
(我們)為研究中國在國際科學(xué)領(lǐng)域中的地位提供了一個新視角。
而且他們還帶來了一系列出人意料的發(fā)現(xiàn)——截至2023年,中美合作中中國領(lǐng)導(dǎo)者占比升至45%,且預(yù)計在2027-2028年達(dá)到相同水平。
預(yù)計到2030年,中國將在AI、半導(dǎo)體、能源和材料科學(xué)等戰(zhàn)略領(lǐng)域?qū)崿F(xiàn)與美國平起平坐的領(lǐng)導(dǎo)地位。
就是說,比人們預(yù)想的更快,中國將在科研力量上超越美國了?
u1s1,雖然經(jīng)彭博社報道后,外國網(wǎng)友們都在自嘲:西方科學(xué)無可爭議的主導(dǎo)地位時代即將終結(jié)。

但我們大多數(shù)人的反應(yīng)be like:不好,美國要捧殺了!

咳咳,究竟是客觀結(jié)論還是戰(zhàn)略“捧殺”,還是先來看看論文是如何得出上述結(jié)論的吧——
用AI模型分析600萬篇論文
通過分析OpenAlex數(shù)據(jù)庫收錄的近600萬篇、涉及13個全球區(qū)域的雙邊合作出版物,研究人員想要弄清:
中國科學(xué)家在國際科研團隊中,到底站在什么位置?距離“世界領(lǐng)航者”還有多遠(yuǎn)?

而要量化“誰是團隊領(lǐng)導(dǎo)者”,可不是簡單看作者排序那么簡單。
研究團隊用了一套「AI+多維度特征」的組合拳,把這個模糊概念變成了可計算的數(shù)字。
具體主要分成三步走:
第一步,給“領(lǐng)導(dǎo)力”下一個可量化的定義。
他們先從Nature、Science、PNAS等頂刊中,扒出8.3萬篇帶作者貢獻(xiàn)聲明的論文,通過聚類分析把科學(xué)家的工作分成三類:
- 領(lǐng)導(dǎo)角色:構(gòu)思研究、設(shè)計方案、撰寫論文、監(jiān)督團隊(關(guān)鍵詞為conceive、design、lead、write);
- 直接支持:收集數(shù)據(jù)、執(zhí)行實驗、分析結(jié)果(關(guān)鍵詞為collect、perform、analyze);
- 間接支持:參與討論、提供意見、修改文字(關(guān)鍵詞為participate、comment、edit)。
隨后給每個角色賦予“領(lǐng)導(dǎo)值”——做領(lǐng)導(dǎo)工作得1分,支持工作得0分,由此構(gòu)建出訓(xùn)練AI模型的“標(biāo)準(zhǔn)答案”。
第二步,用9個維度給科學(xué)家“領(lǐng)導(dǎo)力打分”。
有了訓(xùn)練數(shù)據(jù),團隊又提煉出9個能預(yù)測領(lǐng)導(dǎo)力的關(guān)鍵特征,給590萬篇論文的每一位作者“畫像”。
- 作者過往研究被該論文引用的次數(shù)(體現(xiàn)學(xué)術(shù)影響力);
- 論文關(guān)鍵詞與作者過往研究的重合度(體現(xiàn)領(lǐng)域深耕度);
- 作者自引次數(shù)(體現(xiàn)研究延續(xù)性);
- 學(xué)術(shù)生涯年限(體現(xiàn)經(jīng)驗積累);
- 過往發(fā)表論文總量;
- 累計被引次數(shù);
- 研究過的獨特關(guān)鍵詞數(shù)量(體現(xiàn)研究廣度);
- 作者署名順序(如第一作者、通訊作者);
- 所屬機構(gòu)的學(xué)術(shù)排名(體現(xiàn)平臺資源)。
用這9個特征訓(xùn)練的AI模型,精準(zhǔn)度達(dá)69.2%,最終能給每位作者輸出一個領(lǐng)導(dǎo)概率分?jǐn)?shù)(leader probability score)——用于衡量某個作者在一篇論文中的主導(dǎo)程度。
第三步,從領(lǐng)導(dǎo)概率推斷全球科研領(lǐng)導(dǎo)格局變化。
在獲得領(lǐng)導(dǎo)概率后(以0.65為分界線區(qū)分領(lǐng)導(dǎo)者和支持者),他們將其應(yīng)用于全球范圍內(nèi)的數(shù)百萬篇合作論文,進(jìn)一步構(gòu)造兩個關(guān)鍵指標(biāo):
- 領(lǐng)導(dǎo)占比(Leader Share):衡量某國家或機構(gòu)作者在跨國合作團隊中擔(dān)任領(lǐng)導(dǎo)者的比例;
- 領(lǐng)導(dǎo)溢價(Leader Premium):領(lǐng)導(dǎo)占比減去支持者占比,反映人均領(lǐng)導(dǎo)力轉(zhuǎn)化效率,比如同樣100個合作者,中國能出多少領(lǐng)導(dǎo)者,美國能出多少。
通過對多個國家和區(qū)域的對比,研究得以量化不同科研體系在全球合作格局中的主導(dǎo)能力、結(jié)構(gòu)變化與未來趨勢。

而他們得出的最核心的一張結(jié)論圖如下:
(1)2010年,中美合作中中國占比僅30%,2023年快速升至45%。(2)通過線性回歸預(yù)測,中美將于2027-2028年達(dá)到同等領(lǐng)導(dǎo)占比。(3)不過中國與美國的領(lǐng)導(dǎo)溢價平等需等到2087年后,說明中國在“人均領(lǐng)導(dǎo)力轉(zhuǎn)化”上面臨長期挑戰(zhàn)。

老實說,這項研究之所以當(dāng)下能在西方引起注意,實屬意料之外,情理之中。
不談大道理,就拿最近陶哲軒遭遇經(jīng)費斷供一事就能窺見一二。
時間回到今年9月,頂尖數(shù)學(xué)家陶哲軒在接受《華盛頓郵報》采訪時親口表示:
研究所的經(jīng)費仍然無法發(fā)放,連暑期工資都拿不到了。
之所以會如此,是因為美國在今年的7月25日,突然暫停了國家科學(xué)基金會(NSF)、國立衛(wèi)生研究院(NIH)等機構(gòu)對UCLA的資助,金額高達(dá)5億美元之多。
即便后來事態(tài)有所好轉(zhuǎn),聯(lián)邦法院在8月12日決定恢復(fù)部分撥款,但直到9月初,資金仍舊沒有到位。
好家伙,連陶哲軒都要被迫給自己和學(xué)生籌錢,這下西方學(xué)界和網(wǎng)友紛紛坐不住了——當(dāng)時就有人直言這是“美國科學(xué)界的自我毀滅”,認(rèn)為官僚體系正在扼殺創(chuàng)新。
而現(xiàn)在這篇論文一出,網(wǎng)友們重拾焦慮也在所難免。
作者之一來自武漢大學(xué)
有意思的是,這項研究的作者之一也是來自中國(雖是同等貢獻(xiàn)者但排在第一)。
Renli Wu,論文提及的所屬單位為武漢大學(xué)信息管理學(xué)院&芝加哥大學(xué)Knowledge Lab。
不過可能由于相對低調(diào),目前網(wǎng)上公開資料較少(只找到了相關(guān)??賬號,且未發(fā)布任何動態(tài))。
從已發(fā)表的論文推斷,其研究方向偏向科學(xué)計量、信息管理、知識系統(tǒng)演化等。

Christopher Esposito,目前為UCLA安德森管理學(xué)院(加州大學(xué)洛杉磯分校頂尖商學(xué)院)博士后研究員。
大約在2021年6月,他獲得了UCLA地理學(xué)博士學(xué)位。
他主要研究區(qū)域經(jīng)濟發(fā)展的成因,特別是技術(shù)變革如何塑造區(qū)域發(fā)展。

James Evans,目前是芝加哥大學(xué)Max Palevsky社會學(xué)、計算與數(shù)據(jù)科學(xué)教授,同時也是Knowledge Lab的主任。
(注:Max Palevsky社會學(xué)是指,以硅谷初創(chuàng)先驅(qū)、風(fēng)險投資奠基人Max Palevsky的人生軌跡和職業(yè)生涯為典型范例,來研究“硅谷精英”如何崛起以及影響社會的學(xué)科。)
他主要關(guān)注“集體知識系統(tǒng)”、創(chuàng)新過程、注意力與認(rèn)知的分布、科學(xué)體系結(jié)構(gòu)、機器學(xué)習(xí)與大數(shù)據(jù)在科學(xué)研究中的應(yīng)用等。

One More Thing
說到中國科技力量的崛起,不知道大家有沒有一個共同的感受:
怎么哪哪都有華人?(手動狗頭)
不僅頻頻亮相大廠發(fā)布會C位(如OpenAI、馬斯克特斯拉),而且還在硅谷搶人大戰(zhàn)中備受矚目,甚至連老黃也偏愛收購華人創(chuàng)辦的初創(chuàng)公司……
其影響力之大,甚至催生了AI內(nèi)部梗:“以后Meta開會都是說中文了”…
好家伙,網(wǎng)友誠不欺我,世界真就是一個巨大的中國村唄~
論文:
https://arxiv.org/pdf/2406.05917
























