作者丨千山
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
大模型很時(shí)髦,但大模型不賺錢。
歸根結(jié)底,大家有共識(shí):一則看好大模型不等于立刻就要用上大模型,大模型的供需兩端依然存在著難以逾越的鴻溝;二則即使大模型未來(lái)會(huì)成為產(chǎn)業(yè)變革的關(guān)鍵變量,但誰(shuí)也不知道,大模型的應(yīng)用何時(shí)會(huì)真正從非核心環(huán)節(jié)的試點(diǎn)進(jìn)階為核心業(yè)務(wù)場(chǎng)景的剛需。所有人都是摸著石頭過(guò)河,沒(méi)有先例可以借鑒。
因此吆喝者多,獲益者少。觀望者多,落地者少。
我們知道,金融產(chǎn)業(yè)一貫是新技術(shù)的早期采用者,不僅有著良好的數(shù)字化基礎(chǔ),而且很早就開(kāi)始了在AI方面的探索,可以說(shuō)是AI產(chǎn)業(yè)化的“優(yōu)等生”。因此有人覺(jué)得金融是大模型落地的首選。但事實(shí)上,金融與大模型之間,“兩張皮”的現(xiàn)象同樣屢見(jiàn)不鮮。
一、技術(shù)焦慮下,錯(cuò)位的訴求
今年3月,以彭博發(fā)布BloombergGPT為標(biāo)志,這個(gè)號(hào)稱專為金融行業(yè)打造的500億參數(shù)大語(yǔ)言模型,拉開(kāi)了金融大模型混戰(zhàn)的序幕。隨后,國(guó)內(nèi)不少金融機(jī)構(gòu)、金融科技公司紛紛落子大模型:
- 5 月下旬,度小滿推出國(guó)內(nèi)首個(gè)千億級(jí)中文金融大模型“軒轅”;
- 6月28日,恒生電子發(fā)布金融行業(yè)大模型LightGPT;
- 8月28日,馬上消費(fèi)發(fā)布國(guó)內(nèi)首個(gè)零售金融大模型“天鏡”;
- 9 月8日,螞蟻集團(tuán)發(fā)布工業(yè)級(jí)金融大模型,同時(shí)對(duì)外開(kāi)放Fin-Eval金融AI任務(wù)評(píng)測(cè)集;
- 開(kāi)源金融大模型領(lǐng)域,F(xiàn)inGPT、貔貅(PIXIU) 、聚寶盆(Cornucopia)也次第而來(lái)。
有研究數(shù)據(jù)顯示,截止至今年9月,國(guó)內(nèi)參數(shù)在10億規(guī)模以上的大模型數(shù)量已有116個(gè),其中金融行業(yè)大模型約18個(gè)。
別看金融大模型提供方你追我趕、一派熱鬧,但行業(yè)用戶依舊保持著相當(dāng)審慎的態(tài)度。
根據(jù)恒生電子的調(diào)查,盡管金融行業(yè)整體對(duì)大模型的關(guān)注和參與意愿比較高,但真正落地比例較少。在受訪用戶中,8%處在立項(xiàng)階段,17%處在測(cè)試階段,迄今為止約70%的金融機(jī)構(gòu)對(duì)大模型仍處于調(diào)研階段。
供求雙方的“脫節(jié)”主要體現(xiàn)在:兩者身處的語(yǔ)境不同,訴求錯(cuò)位。
當(dāng)模型提供商在匯報(bào)自己的大模型參數(shù)規(guī)模,語(yǔ)料的豐富性,tokens的大小,以及一堆評(píng)測(cè)結(jié)果時(shí),行業(yè)用戶對(duì)此往往興趣寥寥,他們更關(guān)注的是大模型到底可以用在哪些地方,有沒(méi)有成功先例,一定要用大模型嗎,小模型為什么不可以等問(wèn)題。
對(duì)于大部分大模型提供商來(lái)說(shuō),在這場(chǎng)競(jìng)逐中,現(xiàn)階段能不能成為贏家還是次要,先拿到入場(chǎng)券才是至理。因此,我們看到了形形色色的自研大模型或基于大模型打磨的產(chǎn)品與服務(wù)。簡(jiǎn)言之,先上牌桌,再論勝負(fù)。
對(duì)于金融組織來(lái)說(shuō),無(wú)論是頭部機(jī)構(gòu)還是成長(zhǎng)型機(jī)構(gòu),在技術(shù)焦慮的驅(qū)動(dòng)下,普遍對(duì)大模型接納良好,不過(guò)具體到實(shí)戰(zhàn)還是存在諸多挑戰(zhàn)。
首先,“由誰(shuí)主導(dǎo)”。金融機(jī)構(gòu)覆蓋了較多的企業(yè)類型,銀行、保險(xiǎn)、證券、基金等等,不同類型的機(jī)構(gòu)需求也不同。以銀行為例,掌握大量的私域數(shù)據(jù),而且合規(guī)風(fēng)控較為嚴(yán)格,在此前提下進(jìn)行大模型應(yīng)用探索,必然以自身為主導(dǎo),而不是將主動(dòng)權(quán)讓渡給技術(shù)公司。比如,此前在交行發(fā)布的2023年半年報(bào)中,就明確提出“制定生成式人工智能建設(shè)規(guī)劃,組建GPT大模型專項(xiàng)研究團(tuán)隊(duì)”。
其次,“如何選型”。對(duì)于金融機(jī)構(gòu)來(lái)說(shuō),到底是選擇通用基礎(chǔ)大模型還是行業(yè)大模型;是以私有化形式部署,還是調(diào)用API接口來(lái)獲取服務(wù)都是需要權(quán)衡利弊的問(wèn)題。如果與第三方合作私有化部署大模型,那合規(guī)與數(shù)據(jù)安全相對(duì)有保障,但成本不菲;如果選擇MaaS模式,通過(guò)API調(diào)用來(lái)獲得大模型服務(wù),成本將顯著下降,但相應(yīng)風(fēng)險(xiǎn)也會(huì)隨之提升。
再者,“如何準(zhǔn)備”。大模型要訓(xùn)練,訓(xùn)練的語(yǔ)料從哪里來(lái),如果用自己的,是否做好準(zhǔn)備,如果用別人訓(xùn)練好的,又該如何應(yīng)對(duì)不同場(chǎng)景的“質(zhì)”和“量”的要求;數(shù)據(jù)方面,尤其是私有數(shù)據(jù)如何部署,才能滿足合規(guī)性;算力方面,需要多少算力支撐,算力緊張?jiān)趺崔k;預(yù)算方面,要投入多少錢。這些都是需要做到心中有本賬的地方。
最后,“如何運(yùn)營(yíng)”。大模型的應(yīng)用要產(chǎn)生實(shí)效是不可能一蹴而就的,上線僅是第一步。如何讓場(chǎng)景驅(qū)動(dòng)下面的垂直應(yīng)用開(kāi)發(fā)不斷提升成熟度,切實(shí)發(fā)揮效能提升作用;如何讓私有數(shù)據(jù)、公有數(shù)據(jù),以及海量實(shí)時(shí)數(shù)據(jù)形成數(shù)據(jù)閉環(huán),乃至進(jìn)一步形成數(shù)據(jù)飛輪都是關(guān)系到大模型持續(xù)發(fā)展的關(guān)鍵問(wèn)題。
恒生電子董事長(zhǎng)劉曙峰表示,在大模型實(shí)際落地過(guò)程中主要存在模型選擇難、算力供應(yīng)不足、應(yīng)用成熟度不足等問(wèn)題。他談到,在一定的角度來(lái)看,大模型的應(yīng)用不僅僅是技術(shù)能力的問(wèn)題。長(zhǎng)期發(fā)展來(lái)看,大家的技術(shù)能力可能會(huì)趨同,此時(shí)關(guān)鍵的是應(yīng)用新技術(shù)的速度、新技術(shù)場(chǎng)景的建設(shè)和客戶運(yùn)營(yíng)能力的建設(shè)。
新技術(shù)的率先應(yīng)用的確可以帶來(lái)紅利,但這種紅利是建立在場(chǎng)景之下,業(yè)務(wù)切實(shí)帶來(lái)增長(zhǎng)的基礎(chǔ)之上的。目前來(lái)看,由于供需雙方都還處于摸索階段,生活在兩套話語(yǔ)體系之中,金融行業(yè)的大模型落地還遠(yuǎn)遠(yuǎn)未走到這一步。
二、籠中的行業(yè),幻覺(jué)里的大模型
金融與大模型的“兩張皮”現(xiàn)象不只存在于供求雙方之間,還存在于行業(yè)需求與大模型本身的能力之間。
理論上講,大模型可以在金融行業(yè)找到很多不同的應(yīng)用場(chǎng)景,比如智能客服、投研投顧、信貸風(fēng)控、智能營(yíng)銷等等,但找到場(chǎng)景,對(duì)癥下藥,試點(diǎn)成功,是否就能規(guī)模化推廣,然后徹底起飛呢?并沒(méi)有那么簡(jiǎn)單。
一方面,金融業(yè)在數(shù)據(jù)治理、行業(yè)監(jiān)管、信息安全方面有其行業(yè)特殊性。
以銀行為例。農(nóng)行安徽分行副行長(zhǎng)徐偉對(duì)記者談到,在實(shí)踐中銀行應(yīng)用AI大模型可能會(huì)遇到以下挑戰(zhàn):
1.數(shù)據(jù)質(zhì)量問(wèn)題:大模型需要大量的高質(zhì)量數(shù)據(jù)進(jìn)行訓(xùn)練。目前銀行大模型所要用到的數(shù)據(jù)在質(zhì)量、一致性、完整性、準(zhǔn)確性方面還有待進(jìn)一步提升,這會(huì)影響模型的學(xué)習(xí)和性能。
2.行業(yè)合規(guī)性和監(jiān)管問(wèn)題:銀行業(yè)需要遵守各種法律合規(guī)性和監(jiān)管要求。在使用大模型進(jìn)行風(fēng)控、投研等任務(wù)時(shí),需要確保模型的算法透明、可解釋,能夠被審計(jì)和追溯,同時(shí)符合相關(guān)法律法規(guī)要求。
3.用戶隱私和安全問(wèn)題:銀行涉及大量的用戶信息和交易數(shù)據(jù),在使用AI大模型進(jìn)行客戶服務(wù)、風(fēng)控等任務(wù)時(shí),需要保護(hù)用戶隱私和數(shù)據(jù)安全,防止信息泄露和數(shù)據(jù)濫用。
4.算力需求問(wèn)題。大模型對(duì)算力要求高,各個(gè)應(yīng)用的訓(xùn)練、推理需要大量資源和算力,目前無(wú)法支撐全場(chǎng)景使用。
在徐偉看來(lái),正是基于以上問(wèn)題,“現(xiàn)階段大模型較為適合在對(duì)內(nèi)服務(wù)、輔助支撐、內(nèi)容生成等場(chǎng)景試點(diǎn),而在監(jiān)管相關(guān)、準(zhǔn)確性敏感型場(chǎng)景、數(shù)據(jù)敏感型場(chǎng)景、直接面客場(chǎng)景的使用是受限的”。
另一方面,正是由于金融行業(yè)對(duì)準(zhǔn)確性和可控性的要求極高,現(xiàn)行大模型的訓(xùn)練機(jī)制下,難以完全消解的幻覺(jué)問(wèn)題成為了大模型應(yīng)用落地過(guò)程中的重大障礙。
大模型有時(shí)會(huì)生成錯(cuò)誤且具有誤導(dǎo)性的結(jié)果——通常被稱為“幻覺(jué)'。隨著AI模型的完善和學(xué)習(xí),這些失誤在某種程度上是意料之中的,甚至在某種程度上可以被視作是其創(chuàng)造性的衍生品。但在精度不容妥協(xié)的金融領(lǐng)域,其影響是嚴(yán)重的。因此,現(xiàn)階段大模型能力不足以參與到關(guān)鍵業(yè)務(wù)流程的決策,即使是在非核心業(yè)務(wù)場(chǎng)景的應(yīng)用也需要結(jié)合人工審核。
九章云極DataCanvas副總裁于建崗對(duì)記者表示:當(dāng)前大模型的訓(xùn)練機(jī)制其實(shí)很難完全消除幻覺(jué)問(wèn)題,只能用各種方法來(lái)緩解,甚至于用其他的方式(模型或者rule)來(lái)后期消除,所以目前很多的應(yīng)用更多地是把大模型作為copilot來(lái)提供。不過(guò)對(duì)于未來(lái),他依舊保持樂(lè)觀態(tài)度。
“大模型是新事物,本身也需要一個(gè)發(fā)展進(jìn)步的過(guò)程。隨著大模型技術(shù)的發(fā)展,相信在訓(xùn)練方式甚至于transformer上都會(huì)有革命性的變化。另外,我們一直認(rèn)為未來(lái)應(yīng)該是‘大模型+小模型’的時(shí)代,就是說(shuō)大模型能夠在規(guī)劃和邏輯推理方面提供很強(qiáng)的能力,對(duì)于一些需要精準(zhǔn)結(jié)果和預(yù)測(cè)的應(yīng)用依然可以用小模型來(lái)提供, 這樣相結(jié)合的方式能夠在一定程度上解決當(dāng)前的問(wèn)題?!?/p>
三、場(chǎng)景之下,通往未來(lái)的兩枚拼圖
縱然大模型在金融行業(yè)的落地充滿了挑戰(zhàn),但是不可否認(rèn),金融業(yè)在AI應(yīng)用的積累上是有先天優(yōu)勢(shì)的。基于機(jī)器學(xué)習(xí)的風(fēng)控、營(yíng)銷、投研決策,早已是金融機(jī)構(gòu)推進(jìn)數(shù)智化轉(zhuǎn)型的重要組成部分。
相比傳統(tǒng)AI,基于大模型的AI讓大家看到了一種通用型的AI能力的賦能,即能夠以類人的思維來(lái)處理很多復(fù)雜的推理、邏輯、規(guī)劃、任務(wù)執(zhí)行的能力。大模型也的確能提供很好的增益。其學(xué)習(xí)能力、理解能力、內(nèi)容生成能力、預(yù)測(cè)能力都在為金融領(lǐng)域開(kāi)啟一扇新大門(mén):在海量數(shù)據(jù)場(chǎng)景下為金融機(jī)構(gòu)提供更全面、更深入的市場(chǎng)洞察、分析預(yù)測(cè),更復(fù)雜的風(fēng)險(xiǎn)管理、客戶服務(wù)。
當(dāng)前,越來(lái)越多的金融機(jī)構(gòu)愿意嘗試將其應(yīng)用在特定的業(yè)務(wù)場(chǎng)景中,其中智能客服是被普遍看好的領(lǐng)域之一。比如,美國(guó)互聯(lián)網(wǎng)保險(xiǎn)公司Lemonade推出了基于GPT-3技術(shù)面向用戶的銷售機(jī)器人瑪雅(AI.MAYA)。
傳統(tǒng)的智能客服機(jī)器人對(duì)用戶來(lái)說(shuō)并不陌生。但由于智能化程度有限,經(jīng)常會(huì)出現(xiàn)面對(duì)復(fù)雜問(wèn)題無(wú)能為力或答非所問(wèn)的情況。在此背景下,大模型技術(shù)的出現(xiàn)為智能客服的進(jìn)階帶來(lái)了希望。
依托海量參數(shù),大模型有更好的自然語(yǔ)言理解和內(nèi)容生成能力,結(jié)合人類反饋強(qiáng)化學(xué)習(xí),可以實(shí)現(xiàn)更擬人、更安全、更高質(zhì)量的任務(wù)反饋。加之更強(qiáng)大的學(xué)習(xí)能力,可以更好地泛化到未見(jiàn)過(guò)的數(shù)據(jù)上,在面對(duì)新問(wèn)題時(shí)能夠更好地適應(yīng)和解決。
另外,投研投顧也是熱門(mén)場(chǎng)景之一。有來(lái)自券商的內(nèi)部人士表示,他們對(duì)大模型在投顧場(chǎng)景的應(yīng)用很感興趣。以往AI投顧機(jī)器人的回答比較生硬刻板,如果大模型可以在合規(guī)準(zhǔn)確的前提下更貼近用戶需求,那無(wú)疑將讓投顧服務(wù)體驗(yàn)更上一層樓。
近日,螞蟻集團(tuán)發(fā)布的支小寶2.0和支小助兩款大模型落地產(chǎn)品同樣聚焦在客服及投研領(lǐng)域——前者面向投資者,可以提供行情分析、持倉(cāng)診斷、資產(chǎn)配置和投教陪伴等專業(yè)服務(wù);后者為從業(yè)人員在投研分析、信息提取、專業(yè)創(chuàng)作、商機(jī)洞察、金融工具使用等環(huán)節(jié)提供服務(wù)。
據(jù)官方介紹,支小寶2.0的金融意圖識(shí)別準(zhǔn)確率達(dá)到95%,能夠理解用戶情緒,主動(dòng)進(jìn)行多回合的高質(zhì)量對(duì)話,甚至因人而異調(diào)整溝通風(fēng)格?;卮鹩脩籼釂?wèn)后,還會(huì)自動(dòng)“反思”準(zhǔn)確度、自我糾偏。
如果說(shuō)大模型為金融業(yè)描繪的“未來(lái)已來(lái)”畫(huà)卷是恢弘而神秘的,那么智能客服和投研投顧兩大場(chǎng)景就像這幅卷軸里最清晰的兩枚拼圖,為我們稍稍勾勒出了解碼未來(lái)的一點(diǎn)輪廓。
當(dāng)前金融大模型已經(jīng)在個(gè)別業(yè)務(wù)場(chǎng)景表現(xiàn)出了不錯(cuò)的潛力,一方面提升原有AI功能,變得更通用、強(qiáng)大、高效;另一方面,提供新功能,為降本增效、改善用戶體驗(yàn)提供更廣闊的想象空間。未來(lái),要讓它發(fā)揮更大價(jià)值,仍需讓?xiě)?yīng)用場(chǎng)景從零星試點(diǎn)走向規(guī)?;瘧?yīng)用,讓AI原生應(yīng)用從非核心場(chǎng)景走向關(guān)鍵業(yè)務(wù)場(chǎng)景,彼時(shí),大模型才能迎來(lái)真正起飛的高光時(shí)刻。
四、乾坤未分,笑到最后者笑得最好
“這是一個(gè)最好的時(shí)代,也是一個(gè)最壞的時(shí)代?!?/p>
在這個(gè)不確定性成為常態(tài)的時(shí)代里,大模型的興起讓所有人措手不及,有人興奮,有人質(zhì)疑。向來(lái)不吝于嘗試新技術(shù)的金融行業(yè)也被裹挾其中,一路向前。
這是一場(chǎng)技術(shù)實(shí)力的較量,也是一場(chǎng)商業(yè)生態(tài)位的較量。
技術(shù)上,重新定義人機(jī)交互方式和專業(yè)應(yīng)用程序,在大模型基礎(chǔ)上進(jìn)行AI原生應(yīng)用的開(kāi)發(fā);業(yè)務(wù)上,推進(jìn)大模型落地,把握其對(duì)于業(yè)務(wù)形態(tài)和邏輯范式的革新,實(shí)質(zhì)性改善用戶體驗(yàn),實(shí)現(xiàn)效率質(zhì)的飛躍;生態(tài)上,預(yù)見(jiàn)既有的基礎(chǔ)設(shè)施以及管理體系的顛覆,在大模型生態(tài)中形成從上到下的能力,在技術(shù)趨同之際打造自身的護(hù)城河。
大模型時(shí)代,乾坤未分,玩家眾多,前方也許群星璀璨,也許一枝獨(dú)秀。但能脫穎而出的,必然是敢為人先的冒險(xiǎn)家,也必然是長(zhǎng)期主義的踐行者。