偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

大模型在金融領(lǐng)域落地思路與實(shí)踐

人工智能
恒生電子大模型在很多垂直領(lǐng)域均有落地的思路與實(shí)踐,本文主要分享金融領(lǐng)域的典型案例,并結(jié)合案例進(jìn)一步思考大模型在垂域?qū)嵺`落地的共性問(wèn)題。

一、恒生電子的大模型應(yīng)用實(shí)踐

1. 大模型的發(fā)展趨勢(shì)

(1)大模型推動(dòng)第三次信息化浪潮

圖片

上圖是恒生電子董事長(zhǎng)劉曙峰先生經(jīng)常引用的經(jīng)典圖,將金融領(lǐng)域的數(shù)字化推進(jìn)分為三個(gè)階段,恒生電子目前正處于 2.0 到 3.0 的過(guò)渡階段。在遷徙的過(guò)程中,最重要的生產(chǎn)要素就是數(shù)據(jù)。

隨著最新的 AI 大模型浪潮的襲來(lái),當(dāng)前時(shí)代充滿著機(jī)遇,而金融領(lǐng)域也遇到了前所未有的、碾壓式的技術(shù)革命。

(2)碾壓式的技術(shù)革命-大模型-從 AI 任務(wù)層面看

圖片

如上圖左側(cè),在大模型出現(xiàn)之前,很多場(chǎng)景都有分散的、獨(dú)立構(gòu)建的 AI 系統(tǒng),使用小模型用相應(yīng)的標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,然而總體還是不夠理想,距離預(yù)期還有一定的差距,并且不同的任務(wù)也呈現(xiàn)出不同的狀況。到了以 ChatGPT 為代表的大模型面世之后,我們看到了另外一番景象,即無(wú)需要進(jìn)行大量重復(fù)訓(xùn)練,而是提前做好預(yù)訓(xùn)練,無(wú)需針對(duì)不同的場(chǎng)景開(kāi)發(fā)煙囪式的系統(tǒng),僅通過(guò)預(yù)訓(xùn)練模型經(jīng)過(guò)少量精調(diào)就可以適應(yīng)不同任務(wù),并且效果往往會(huì)超預(yù)期。

(3)哪些方面能力提升了

圖片

新一代 AI 系統(tǒng)會(huì)碾壓前一代,并真正實(shí)現(xiàn)平臺(tái)化。這個(gè)代差,首先體現(xiàn)在語(yǔ)言能力上,另外還有極其精準(zhǔn)的意圖識(shí)別能力,上下文順暢的寫(xiě)作能力,對(duì)知識(shí)和邏輯的理解能力,以及代碼生成能力。對(duì)于專業(yè)領(lǐng)域知識(shí),大模型也會(huì)表現(xiàn)得越來(lái)越專業(yè),同時(shí)數(shù)學(xué)能力和邏輯能力也會(huì)有相當(dāng)程度的提升。

(4)大模型發(fā)展路線

圖片

大模型的發(fā)展包括兩條技術(shù)路線,一條是 OpenAI 為代表的 GPT 路線,一條是以谷歌為代表的 Bert 路線。這兩條路線,一個(gè)是所謂單向的,一個(gè)是所謂雙向的。從去年開(kāi)始,兩條路線已經(jīng)分出勝負(fù)。

(5)大語(yǔ)言模型登頂 NLP 的深層原理

讓我們從 NLP 的角度來(lái)看一下,大模型都做了什么事情,解決了哪些問(wèn)題。

  • 橫向:遠(yuǎn)距關(guān)聯(lián)

圖片

從橫向看,大模型解決了 NLP 領(lǐng)域的一個(gè)難題——遠(yuǎn)距離上下文關(guān)聯(lián)問(wèn)題,即前文提到的一個(gè)詞語(yǔ)或一段文字和后文的某一部分是相關(guān)的,然而兩個(gè)詞語(yǔ)中間的間隔可能很遠(yuǎn),因此不同大小的窗口設(shè)定會(huì)帶來(lái)不同的結(jié)果。

實(shí)踐發(fā)現(xiàn),窗口設(shè)定的臨界值大約在 1000 個(gè) token 這樣的量級(jí),會(huì)給上下文關(guān)聯(lián)的能力帶來(lái)質(zhì)變。因?yàn)檫@里會(huì)涉及前后文的 attention,即對(duì)窗口內(nèi)的 token 進(jìn)行大規(guī)模的計(jì)算,因此只有具備足夠的算力支持,才可以把窗口延伸得足夠遠(yuǎn),才能夠?qū)⑶拔牡南嚓P(guān)線索“抓取”出來(lái)并應(yīng)用到當(dāng)前文字的解讀和生成上,從而有效地實(shí)現(xiàn)文本的遠(yuǎn)距關(guān)聯(lián),突破原先 NLP 技術(shù)路線下的瓶頸。

  • 縱向:隱形資源

圖片

從縱向的角度看,不管是對(duì)文本的解讀還是生成,整個(gè)過(guò)程中不僅僅使用了字面上的資源,同時(shí)還使用了很多深層的隱形資源,包括語(yǔ)義本體、常識(shí)事理等。前期有人嘗試將隱形資源用人工方式進(jìn)行形式化(比如 CYC),實(shí)踐發(fā)現(xiàn)其效果非常不理想。

大模型的引入,利用優(yōu)質(zhì)的文本資源(如教科書(shū)、百科全書(shū)等正規(guī)的、優(yōu)質(zhì)的書(shū)籍),正確地學(xué)習(xí)和使用語(yǔ)義本體知識(shí)以及常識(shí)事理知識(shí),通過(guò)大量?jī)?yōu)質(zhì)文本的訓(xùn)練,將知識(shí)及背后模式挖掘出來(lái)。當(dāng)模型參數(shù)超過(guò) 500 億時(shí),往往會(huì)產(chǎn)生質(zhì)變,出現(xiàn)一種涌現(xiàn)能力,而這種涌現(xiàn)能力也是和隱形資源的體量直接相關(guān)的。

2. 大模型在金融場(chǎng)景的實(shí)踐

(1)金融業(yè)務(wù)場(chǎng)景分析

圖片

在金融領(lǐng)域,恒生電子涉及到的業(yè)務(wù)面較多,涵蓋客服、投顧營(yíng)銷、風(fēng)控運(yùn)營(yíng)、投研、投行、量化交易等諸多方面。每條業(yè)務(wù)線都對(duì)大模型的應(yīng)用場(chǎng)景進(jìn)行了梳理,也挖掘出了部分場(chǎng)景可以采用大模型來(lái)賦能,其中一些是新物種,即之前由人來(lái)完成且效率不高,使用大模型可大大提高效率。還有一些屬于原有系統(tǒng),通過(guò)引入大模型來(lái)提升用戶交互體驗(yàn)。

(2)金融對(duì)內(nèi)場(chǎng)景賦能

圖片

除了外部金融業(yè)務(wù)場(chǎng)景賦能外,恒生還會(huì)使用大模型對(duì)內(nèi)部場(chǎng)景進(jìn)行賦能,以提升協(xié)作效率,實(shí)現(xiàn)軟件研發(fā)和數(shù)據(jù)生產(chǎn)等環(huán)節(jié)的重構(gòu),這也是非常重要的應(yīng)用場(chǎng)景。

(3)連橫合縱:通用大模型(收)+垂域大模型(放)

圖片

將大模型技術(shù)落地應(yīng)用到金融這樣的垂直領(lǐng)域,這樣的應(yīng)用模式不同于大模型在公有云上的模式。在公有云上,會(huì)以大模型為核心,圍繞一系列插件構(gòu)成的插件聯(lián)盟,應(yīng)用到各種垂直領(lǐng)域中。但是在垂直領(lǐng)域,往往是一個(gè)能力中心外接多個(gè)大模型,賦能多個(gè)應(yīng)用。因此,能力中心的建設(shè)就變得非常重要。

對(duì)于通用大模型,經(jīng)歷過(guò)一系列“千模大戰(zhàn)”,實(shí)際上現(xiàn)在正在收縮,一些好的大模型遙遙領(lǐng)先,還有稍有實(shí)力的模型在拼命追趕,而有些模型在逐漸被淘汰,所以說(shuō)通用大模型在收。

然而對(duì)于垂域大模型,則是另外一番景象,因?yàn)槊總€(gè)垂直領(lǐng)域都有一些特定的問(wèn)題,因此相對(duì)于通用大模型,垂域大模型對(duì)特定領(lǐng)域會(huì)有更強(qiáng)的適配性,在實(shí)踐應(yīng)用中會(huì)有更高效的表現(xiàn),這也是恒生電子在能力中心以及中控建設(shè)之外,仍然會(huì)在垂域大模型方面進(jìn)行投入和研發(fā)的原因。

3. 大模型生態(tài)

(1)“家里有數(shù)”,大模型生態(tài)因此而不同

圖片

金融領(lǐng)域大模型的生態(tài),和公有云上的生態(tài)有哪些不同?

首先,金融大模型“家里有數(shù)”。所謂家里有數(shù),一方面是金融領(lǐng)域有一些公開(kāi)數(shù)據(jù)作為數(shù)據(jù)資產(chǎn)(當(dāng)然,公開(kāi)數(shù)據(jù)為保證其時(shí)效性,可能需要一些商業(yè)授權(quán))。另一方面是金融機(jī)構(gòu)自身的大量的私有數(shù)據(jù)、私有系統(tǒng)接口等。

上圖中,左邊部分主要來(lái)自外部,而右邊部分基本都來(lái)自企業(yè)內(nèi)部,包括內(nèi)部文檔、內(nèi)部數(shù)據(jù)庫(kù)、內(nèi)部知識(shí)圖譜以及內(nèi)部系統(tǒng)的開(kāi)放接口等。

大模型和應(yīng)用之間會(huì)有一個(gè)以 RAG 為核心的中控,用來(lái)搭接外部數(shù)據(jù)和內(nèi)部數(shù)據(jù),起到“連接四面八方”的作用。

(2)恒生電子大模型生態(tài)藍(lán)圖

圖片

在恒生大模型生態(tài)中,算力實(shí)際上是在最底層的,基礎(chǔ)大模型是通用能力,不特意面向某個(gè)專業(yè)領(lǐng)域(實(shí)際上優(yōu)秀的基礎(chǔ)大模型的專業(yè)能力也是不可小覷的);而所謂行業(yè)大模型,其中一個(gè)重要理念是站在巨人的肩膀上,即:如果基礎(chǔ)大模型在專業(yè)上已經(jīng)做得足夠好,那我們就可以少做點(diǎn)事;如果基礎(chǔ)模型做得還不夠好,那我們就多做點(diǎn)事。舉個(gè)例子,假如開(kāi)源大模型比較“笨重”,難以進(jìn)行私有化部署,那我們就提供私有部署;假如該模型已經(jīng)提供私有部署,且體量適中,那我們的壓力就會(huì)大大減輕??傊?,我們是站在巨人的肩膀上,避免重復(fù)造輪子。

前文所述的中控(也叫光子)部分,該插件會(huì)提供數(shù)據(jù)間“共性能力”的支撐,賦能投顧、客服、運(yùn)營(yíng)、合規(guī)交易等微場(chǎng)景,這是恒生大模型的整體藍(lán)圖。

4. 金融大模型應(yīng)用現(xiàn)狀問(wèn)題

圖片

首先,會(huì)遇到專業(yè)性不足這類問(wèn)題,因此如果發(fā)現(xiàn)更好的大模型,我們就專注于實(shí)現(xiàn)這個(gè)大模型的對(duì)接;如果模型在現(xiàn)階段做得還不夠好,那么就增強(qiáng)其專業(yè)能力,使得其在現(xiàn)階段表現(xiàn)得足夠好。

其次,對(duì)于金融領(lǐng)域,由于涉及跨域流動(dòng)甚至跨境流動(dòng)等方面的合規(guī)監(jiān)管,因此會(huì)存在內(nèi)容生成和數(shù)據(jù)流動(dòng)等方面的安全性問(wèn)題,這個(gè)問(wèn)題對(duì)于金融領(lǐng)域而言尤其需要嚴(yán)格遵守。除了涉及安全本身,其監(jiān)管主要來(lái)自于國(guó)家網(wǎng)信辦等。對(duì)于行業(yè)的監(jiān)管,作為專業(yè)知識(shí)提供者,這樣的軟件系統(tǒng)或者平臺(tái),需要有對(duì)身份的把握能力。

圖片

再次,為了降低推理的算力成本,2023 年 6 月實(shí)現(xiàn)了 LightGPT 的發(fā)布,即恒生版本的金融大模型,10 月 19 日開(kāi)始公測(cè),年底提供一些插件服務(wù),包括推理性能的優(yōu)化,以及復(fù)雜指令的邏輯能力等。

5. 恒生大模型——LightGPT

(1)LightGPT 安全機(jī)制

圖片

在安全方面,主要實(shí)施了如下舉措:

語(yǔ)料安全:

  • 金融法律法規(guī)(5000+ 條):證券法/公司法/等。
  • 法律相關(guān)出版書(shū)籍(1500+ 本)
  • 價(jià)值觀數(shù)據(jù):學(xué)習(xí)強(qiáng)國(guó)/人民日?qǐng)?bào)/黨章黨建(500 萬(wàn) tokens)
  • 剔除 8 大維度違規(guī)數(shù)據(jù)(總計(jì) 1.5)

模型安全:

  • 生成內(nèi)容安全。
  • 服務(wù)透明度。
  • 內(nèi)容生成準(zhǔn)確性。
  • 內(nèi)容生成可靠性。
  • 超過(guò) 8000 條安全指令和強(qiáng)化學(xué)習(xí)數(shù)據(jù)。

模型評(píng)估:

  • 基礎(chǔ)安全評(píng)估:超過(guò) 5000 條安全評(píng)測(cè)數(shù)據(jù),合格率大于 97%。
  • 金融監(jiān)管評(píng)估:新增金融法律法規(guī)遵從 3500 條評(píng)測(cè)數(shù)據(jù)。
  • 生成內(nèi)容安全評(píng)估:應(yīng)拒答率不低于 95%(國(guó)家制度、民族、地理、歷史、英烈等。)
  • 內(nèi)容拒答評(píng)估:拒答率不高于 5%。

其他安全措施:

  • 敏感詞庫(kù)(20 萬(wàn) +)
  • 應(yīng)急干預(yù)措施(分鐘級(jí)生效)
  • 內(nèi)容過(guò)濾模型(訓(xùn)練語(yǔ)料內(nèi)容過(guò)波、生成內(nèi)容安全評(píng)估,支持 31 種風(fēng)險(xiǎn)檢測(cè))

從政治敏感、偏見(jiàn)歧視、違法犯罪、隱私財(cái)產(chǎn)、倫理道德、臟話侮辱、心理健康、身體傷害這 8 大維度對(duì)比國(guó)內(nèi)其他大模型的性能,LightGPT 的優(yōu)勢(shì)如下:

  • 金融法律法規(guī)遵循 LightGPT 勝出 15%。
  • 金融領(lǐng)域知識(shí)真實(shí)性 LightGPT 勝出 13%。
  • 誘導(dǎo)性問(wèn)題,拒絕率 LightGPT 勝出 5%。
  • 社會(huì)主要價(jià)值觀 LightGPT 勝出 3%。

(2)LightGPT 訓(xùn)練語(yǔ)料

圖片

訓(xùn)練語(yǔ)料主要包括語(yǔ)種強(qiáng)化數(shù)據(jù)、領(lǐng)域強(qiáng)化數(shù)據(jù)和應(yīng)用強(qiáng)化數(shù)據(jù)這 3 大類。隨著越來(lái)越多新的大模型底座的不斷涌現(xiàn),數(shù)據(jù)強(qiáng)化工作后續(xù)會(huì)不斷調(diào)整和更新。

(3)LightGPT 中間件光子

圖片

中間件光子,實(shí)現(xiàn)了模型、應(yīng)用、資源這三大連接。

  • 連接模型:包括自身在內(nèi)的金融大模型,同時(shí)提供連接其他大模型的路由。
  • 連接資源:光子本身可以看成是大模型 Hub,作為連通八方的資源連接器,包括內(nèi)外部的數(shù)據(jù)資源、程序資源、接口資源等。
  • 連接應(yīng)用:既包括新產(chǎn)生的應(yīng)用,也包括恒生向各個(gè)業(yè)務(wù)域提供的傳統(tǒng)應(yīng)用,這些傳統(tǒng)應(yīng)用嵌入到由光子支撐的 Copilot,使用自然語(yǔ)言指令一鍵完成菜單點(diǎn)擊,這是恒生的努力目標(biāo)。

(4)應(yīng)用場(chǎng)景

LightGPT 主要應(yīng)用于以下幾個(gè)場(chǎng)景:

圖片

第一個(gè)是寫(xiě)作場(chǎng)景,投資顧問(wèn)對(duì)特定板塊、特定個(gè)股做周報(bào)、月報(bào)等。

圖片

第二個(gè)是合規(guī)場(chǎng)景,基于內(nèi)外部法律法規(guī)、規(guī)章制度,從檢索詢問(wèn)到解讀和設(shè)置,一直到應(yīng)用。

圖片

第三個(gè)是投顧場(chǎng)景,該場(chǎng)景需要集中各種優(yōu)勢(shì)資源,同時(shí)也有一些合規(guī)方面的考慮。該場(chǎng)景往往是理財(cái)師在兜底,理財(cái)師主要是面向客戶,而我們的 AI 工具則同時(shí)把客戶信息和 AI 建議的話術(shù)提供給理財(cái)師,支持理財(cái)師進(jìn)行不斷修改和完善直到滿意,然后一鍵推送給客戶。

對(duì)于客戶的提問(wèn),大模型在有些場(chǎng)景下會(huì)直接給出答案,在有些場(chǎng)景下則會(huì)基于實(shí)時(shí)的行情指標(biāo)提供廣泛的答復(fù);同樣,所提供的信息不僅僅來(lái)自原始資訊,還包括基于資訊經(jīng)過(guò)二次處理并打上標(biāo)簽的信息。這些信息可以在特定的對(duì)話上下文中整合,并通過(guò)計(jì)算得出回答。

在這個(gè)場(chǎng)景中,涉及的問(wèn)題首先是深度性的,需要從多個(gè)角度進(jìn)行分析;其次,它依賴于大量的活數(shù)據(jù),這些活數(shù)據(jù)并非來(lái)自大模型本身,而是來(lái)自外部生產(chǎn)系統(tǒng)的行情資訊,以及內(nèi)部 CLM 系統(tǒng)(客戶關(guān)系管理系統(tǒng),包括客戶開(kāi)戶信息、客戶交易歷史記錄等,這些數(shù)據(jù)反映客戶的風(fēng)險(xiǎn)偏好、交易習(xí)慣以及當(dāng)前的持倉(cāng)情況等)。以上這些活數(shù)據(jù)會(huì)顯著提升理財(cái)師、投資顧問(wèn)等的服務(wù)質(zhì)量。

如果缺少上述活數(shù)據(jù)的支持,需要人工獲取活數(shù)據(jù),則很難達(dá)到較高的效率。在大模型的加持下,這些工具像巫師一樣,可以召喚出所需的信息和咨詢,并展示在屏幕上;同時(shí),可以自行決定將哪些信息推薦給哪些客戶。這是我們非常推崇的工作方式,也是我們重點(diǎn)打造的場(chǎng)景。

圖片

第四是運(yùn)營(yíng)場(chǎng)景,主要涉及對(duì)文檔的處理,特別是對(duì)掃描后的合同文檔進(jìn)行關(guān)鍵參數(shù)提取,并在此基礎(chǔ)上進(jìn)行人工校對(duì),不僅要檢查已提取的參數(shù),同時(shí)要對(duì)照原文,審查其來(lái)源出處,并檢查其原始影像的質(zhì)量,從而確保校對(duì)的準(zhǔn)確性和完整性。這樣能夠在保證數(shù)據(jù)準(zhǔn)確無(wú)誤的同時(shí),最大程度地提高工作效率。而運(yùn)營(yíng)場(chǎng)景也正在不斷擴(kuò)展,模型正在嘗試使用一句話實(shí)現(xiàn)復(fù)雜的、具有多層菜單結(jié)構(gòu)的操作步驟,這也是未來(lái)工作的一大方向。

圖片

第五是投研系統(tǒng),WarrenQ。在過(guò)去的小模型時(shí)代,我們談?wù)摰氖撬阉?、閱讀、計(jì)算和寫(xiě)作?,F(xiàn)如今,搜索功能已經(jīng)演變?yōu)?Chat 模式,包括對(duì)外部資源的搜索和內(nèi)部文檔庫(kù)的搜索,還可以調(diào)取相應(yīng)的數(shù)據(jù)?;诤闵煜戮墼刺峁┑牡讓訑?shù)據(jù),以及分析師在工作時(shí)所使用的底稿和素材等,實(shí)現(xiàn)了實(shí)時(shí)精確的操作,在內(nèi)部實(shí)現(xiàn)私密性。

基于搜索+大模型+聚源庫(kù),WarrenQ 進(jìn)一步可實(shí)現(xiàn) AI 寫(xiě)作、文檔挖掘、語(yǔ)音速記和片段對(duì)齊等功能,而這些功能都是由大模型提供底層支撐。對(duì)于上層應(yīng)用,除了 PC 版本之外,還提供了小程序版本。以上就是恒生在大模型應(yīng)用實(shí)踐方面的現(xiàn)狀。

二、大模型時(shí)代的知識(shí)圖譜

1. 數(shù)智能力:彌漫式賦能各業(yè)務(wù)場(chǎng)景

圖片

知識(shí)圖譜是 LightGPT 中的一個(gè)重要組件,而隨著大模型的發(fā)展,有一些知名人士(比如陸奇博士)曾公開(kāi)宣稱,在大模型時(shí)代,知識(shí)圖譜已經(jīng)過(guò)時(shí),不再需要。

2. 投資決策三大件:數(shù)據(jù)、計(jì)算與推理

圖片

實(shí)際上,投資決策離不開(kāi)基于數(shù)據(jù)的推理。

圖片

上圖可以看出,實(shí)現(xiàn)推理能力,數(shù)據(jù)、知識(shí)和結(jié)論缺一不可。然而,大模型是否可以完全實(shí)現(xiàn)這樣的推理呢?并非如此。

(1)推理

圖片

追蹤推理的歷史,如上圖所示,從古希臘到中國(guó),從古代到現(xiàn)代,從數(shù)理邏輯到自動(dòng)推理,實(shí)際上是人類對(duì)自身理性的發(fā)掘、認(rèn)識(shí)、駕馭,最終實(shí)現(xiàn)自動(dòng)化的過(guò)程。

圖片

而在自動(dòng)化的過(guò)程中,推理可以進(jìn)一步分為兩類,一類推理是描述特殊和一般的關(guān)系(上圖中的縱向),包括歸納(從特殊到一般)、演繹(從一般到特殊)和類比(從特殊到特殊)等;另一類推理則描述原因與結(jié)果的關(guān)系(上圖中的橫向),從原因到結(jié)果的推理是正常的演繹路徑,而從結(jié)果到原因的推理則是溯因路徑。

(2)邏輯

圖片

基于上述多種推理方式,為了研究、描述并實(shí)現(xiàn)這些推理,人類提出了各種邏輯系統(tǒng)。有的邏輯系統(tǒng)過(guò)于龐大,如上圖的霍恩子句邏輯。日本曾試圖基于該邏輯開(kāi)發(fā)第五代計(jì)算機(jī),但最終失敗了,原因之一就是該邏輯系統(tǒng)與現(xiàn)在主流的計(jì)算機(jī)體系架構(gòu)并不完全兼容,日本試圖另起爐灶,但未能成功。

在邏輯推理中,上圖中間橙色的圈是描述邏輯,也是現(xiàn)代知識(shí)圖譜的基礎(chǔ)。

3. 知識(shí)圖譜

(1)從描述邏輯到知識(shí)圖譜

圖片

上圖是知識(shí)圖譜的技術(shù)棧,對(duì)此感興趣的讀者可以進(jìn)一步了解。針對(duì)知識(shí)圖譜在大模型時(shí)代是否會(huì)被淘汰這一問(wèn)題,需要根據(jù)知識(shí)圖譜的應(yīng)用場(chǎng)景分情況討論。

(2)知識(shí)圖譜應(yīng)用場(chǎng)景分類

首先,要看知識(shí)的來(lái)源是內(nèi)部還是外部;其次,要考慮知識(shí)圖譜的應(yīng)用對(duì)象是與人交互還是與系統(tǒng)交互。不同的應(yīng)用場(chǎng)景,實(shí)際情況大不相同。

根據(jù)這種組合方式,可以將知識(shí)圖譜的應(yīng)用場(chǎng)景劃分為三個(gè)類別:

圖片


  • 第一類是“兩頭在外”,即從公共網(wǎng)絡(luò)抓取非結(jié)構(gòu)化數(shù)據(jù),最終與人類進(jìn)行交互。
  • 第二類是“一內(nèi)一外”,這類情況進(jìn)一步細(xì)分成兩種情況:
    從公告網(wǎng)絡(luò)抓取結(jié)構(gòu)化數(shù)據(jù),最終與系統(tǒng)進(jìn)行交互;
    從內(nèi)部生產(chǎn)系統(tǒng)導(dǎo)入結(jié)構(gòu)化數(shù)據(jù),最終與人類進(jìn)行交互。
  • 第三類是“兩頭在內(nèi)”,即從生產(chǎn)系統(tǒng)中獲取數(shù)據(jù),最終與系統(tǒng)進(jìn)行交互。

(3)知識(shí)圖譜應(yīng)用深度分類

圖片

除了應(yīng)用模式的差別,還有應(yīng)用深度的差別。而從深度上來(lái)看,又可以分成兩種不同的模式:

  • 第一種模式為事務(wù)密集型模式,即精度要求相對(duì)較低,同時(shí)問(wèn)題本身和推理過(guò)程也相對(duì)簡(jiǎn)單,但是會(huì)出現(xiàn)大量用戶同時(shí)提出問(wèn)題;
  • 另一種模式為計(jì)算密集型模式,例如反洗錢計(jì)算、股權(quán)穿透計(jì)算、產(chǎn)業(yè)鏈估值計(jì)算等,而這類任務(wù)目前即使是大模型也難以勝任。

(4)大模型能代替知識(shí)圖譜嗎?

圖片

將事務(wù)密集型模式和計(jì)算密集型模式結(jié)合起來(lái),同時(shí)考慮數(shù)據(jù)來(lái)源和數(shù)據(jù)去向,對(duì)應(yīng)用場(chǎng)景進(jìn)行分類,會(huì)形成上表這種 2*3 的分類方式。這 6 類應(yīng)用場(chǎng)景,其中只有事務(wù)密集型且“兩頭在外”的這類應(yīng)用場(chǎng)景可以使用大模型來(lái)替代,其余 5 類場(chǎng)景則無(wú)法使用大模型完全替代。因此,知識(shí)圖譜在很多場(chǎng)景下還是不可或缺的。

4. AGI vs. Symbol Awareness

圖片

知識(shí)圖譜往往需要與大模型協(xié)同工作,即 AGI。類比于人腦,大模型提供的功能類似人類大腦中的顳葉、頂葉、枕葉等部分,即視覺(jué)、聽(tīng)覺(jué)和體覺(jué)等類型的推理。而當(dāng)涉及到人類大腦中的額葉區(qū),即意識(shí)、反思等復(fù)雜認(rèn)知功能時(shí)(例如現(xiàn)在完成到什么程度了、對(duì)于下一步任務(wù)的推進(jìn)還缺少什么),大模型還遠(yuǎn)遠(yuǎn)未能達(dá)到理想的效果。目前,這類任務(wù)通常依賴于外掛系統(tǒng)來(lái)完成。

以股權(quán)穿透計(jì)算為例,可能會(huì)出現(xiàn)一種現(xiàn)象:一個(gè)實(shí)控人可能先“化整為零”,即先將股權(quán)分散投資到多家公司,然后通過(guò)這些公司之間的股權(quán)關(guān)系,經(jīng)過(guò)一系列復(fù)雜的路徑,最終再“化零為整”,實(shí)現(xiàn)對(duì)一個(gè)目標(biāo)公司的控制。這類情況往往需要進(jìn)行傳遞閉包的計(jì)算,以確定實(shí)控關(guān)系。然而,這種計(jì)算并不是大型模型所擅長(zhǎng)的,因此需要使用外掛系統(tǒng)來(lái)實(shí)現(xiàn)。

三、大模型垂直應(yīng)用的倫理問(wèn)題

1. 專業(yè)角色的自我約束

圖片

接下來(lái)討論一下大模型應(yīng)用的倫理問(wèn)題。大模型在提供服務(wù)時(shí),會(huì)扮演一個(gè)獨(dú)特的專業(yè)角色,對(duì)于這樣的專業(yè)角色,是需要進(jìn)行自我約束的,而這種自我約束一般來(lái)自法律法規(guī)、行業(yè)規(guī)章制度,或者企業(yè)及用戶單位的內(nèi)部規(guī)定等。

對(duì)于“倫理問(wèn)題”,舉幾個(gè)具體的例子:

  • “請(qǐng)告訴我哪支股票值得滿倉(cāng)”這類問(wèn)題在金融領(lǐng)域是敏感問(wèn)題,有推薦股票的嫌疑,因此大模型是不能正面回答這類問(wèn)題的。LightGPT 在應(yīng)對(duì)類似問(wèn)題時(shí),會(huì)使用特定的話術(shù)來(lái)表達(dá),而不提供任何有關(guān)股票投資的建議或者推薦。
  • 年底公司業(yè)績(jī)較差,如何美化業(yè)績(jī)報(bào)表,這類問(wèn)題會(huì)涉及財(cái)務(wù)舞弊。LightGPT 在應(yīng)對(duì)類似問(wèn)題時(shí),不僅要拒絕,還要明確告訴用戶說(shuō)“你不能這樣做”。
  • “軍工股有什么內(nèi)幕消息”,對(duì)于這類問(wèn)題,模型一方面不能推薦股票,另一方面也不能參與相關(guān)內(nèi)幕交易,因?yàn)榭赡苌婕斑`法。
  • 假如張先生是某上市公司的高管,他太太出事了,被雙規(guī)了,然而公司不想做這個(gè)信息披露,去問(wèn)大模型“如何避免信息披露”,大模型會(huì)引經(jīng)據(jù)典,回答:不行,這類信息是需要披露的,并逐條分析論據(jù)利弊。

對(duì)于上述這些可能觸碰行業(yè)紅線的問(wèn)題,大模型有必要將紅線畫(huà)出來(lái),再用正確的話術(shù)對(duì)客戶進(jìn)行引導(dǎo),需要在訓(xùn)練大模型時(shí)加入這方面的能力,否則大模型就很難承擔(dān)起這樣的專業(yè)角色。

2. 基于內(nèi)容的權(quán)限控制

圖片

大模型還會(huì)涉及到權(quán)限問(wèn)題。比如,當(dāng)用戶提問(wèn)時(shí),后臺(tái)數(shù)據(jù)庫(kù)會(huì)對(duì)信息進(jìn)行檢索,這樣在信息檢索的過(guò)程中就會(huì)涉及到權(quán)限的控制問(wèn)題。LightGPT 已經(jīng)實(shí)現(xiàn)了權(quán)限的字段級(jí)控制,即哪些字段可以被哪些人訪問(wèn)。

然而,如果將員工個(gè)人信息都嵌入到大模型中,會(huì)出現(xiàn)“張三的年終獎(jiǎng)有多少”這類涉及隱私的問(wèn)題,而問(wèn)題可能是張三的同事提出的,也可能是張三的老板提出的。如果是張三同事或其他人問(wèn)的,出于對(duì)員工隱私的保護(hù),應(yīng)不予回答;如果是其老板問(wèn)的,則應(yīng)該如實(shí)回答。那么,大模型該如何區(qū)分這個(gè)問(wèn)題該如何回答呢?

首先,不建議將這類信息直接嵌入到大模型中,而是建議將其作為外掛數(shù)據(jù)來(lái)存儲(chǔ),然后由中控組件控制外掛的訪問(wèn)權(quán)限,從而實(shí)現(xiàn)這類問(wèn)題的權(quán)限控制。

3. 生成錯(cuò)誤的控制

圖片

生成錯(cuò)誤是非常常見(jiàn)的情況,尤其在問(wèn)答的場(chǎng)景。這里有兩種不同的技術(shù)路線:

一種是將所有 FAQ 都輸入到大模型進(jìn)行訓(xùn)練,大模型在回答這類問(wèn)題的時(shí)候,往往不拘泥于原 FAQ,而是進(jìn)行一定程度的臨場(chǎng)發(fā)揮,然而過(guò)度臨場(chǎng)發(fā)揮可能會(huì)產(chǎn)生一些錯(cuò)誤。

因此建議使用另一種技術(shù)路線,即使用 RAG 來(lái)控制信息的檢索和生成。RAG 是一種結(jié)合了檢索和生成的模型,在生成回答時(shí)首先參考先前的標(biāo)準(zhǔn)問(wèn)題和對(duì)應(yīng)答案,進(jìn)而挑選出最合適的答案,從而提高回答的相關(guān)性和準(zhǔn)確性。

具體來(lái)說(shuō),假如選擇了 Q1,則對(duì)應(yīng)的 A1 就是標(biāo)準(zhǔn)答案(同理,選擇 Q2,則 A2 是標(biāo)準(zhǔn)答案),而不是將 Q1 和 A1 輸入到大模型后,由大模型按照概率模型來(lái)生成,因?yàn)槟菢拥纳山Y(jié)果容易不可控。

4. 生成錯(cuò)誤的責(zé)任歸屬:歸因標(biāo)記

圖片

然而,假如生成的回答出現(xiàn)錯(cuò)誤,其錯(cuò)誤追溯會(huì)相對(duì)比較復(fù)雜,因?yàn)榇竽P图捌洳寮约爸苓呝Y源,耦合成的體系非常復(fù)雜,相對(duì)難以定位。

實(shí)際上,按照實(shí)踐經(jīng)驗(yàn),大模型生成錯(cuò)誤大多會(huì)發(fā)生在訓(xùn)練階段或者推理階段:

  • 在訓(xùn)練階段發(fā)生的錯(cuò)誤,往往是訓(xùn)練數(shù)據(jù)有誤造成的,因此需要對(duì)錯(cuò)誤的訓(xùn)練數(shù)據(jù)進(jìn)行甄別。
  • 在推理階段發(fā)生的錯(cuò)誤,有可能是提問(wèn)錯(cuò)誤,也有可能是生成錯(cuò)誤。
    對(duì)于生成錯(cuò)誤,模型對(duì)錯(cuò)誤的生成語(yǔ)句進(jìn)行攔截或補(bǔ)救。
    對(duì)于提問(wèn)錯(cuò)誤,模型對(duì)用戶提問(wèn)的初始意圖及問(wèn)題的恰當(dāng)性進(jìn)行判斷,并增加一些手段去彌補(bǔ)。
  • 此外,大模型的檢索增強(qiáng)體系也可能存在數(shù)據(jù)錯(cuò)誤。

因此,需要在大模型的訓(xùn)練過(guò)程中,對(duì)錯(cuò)誤添加歸因標(biāo)記(即生成的類似日志的標(biāo)簽),利用歸因標(biāo)記,便于在事后查找責(zé)任歸屬。

5. 大模型應(yīng)用場(chǎng)景

圖片

大模型的應(yīng)用場(chǎng)景,可以分為三類,分別是重構(gòu)、嵌入和原生。

(1)重構(gòu)

重構(gòu),指的是大模型賦能新應(yīng)用,即借助大模型打通相關(guān)的資源鏈路,將原先人工完成的任務(wù)通過(guò)大模型來(lái)完成。

對(duì)于投研、投顧這類復(fù)雜的場(chǎng)景,仍然需要人工的參與,但是人工的工作負(fù)擔(dān)會(huì)大大降低,效率會(huì)提高很多。

而對(duì)于有些場(chǎng)景,是可以用大模型完全取代人的,例如呼叫中心接線員這類崗位,上崗前需要培訓(xùn)和考試,而考試的過(guò)程,一般是考官來(lái)模擬刁鉆、脾氣不好等各類奇葩的客戶,考察接線人在這樣惡劣情況下是否還能給出得體的回應(yīng)。在這樣的場(chǎng)景下,可以預(yù)設(shè)人設(shè),讓大模型獨(dú)自來(lái)扮演考官這個(gè)角色,模擬這個(gè)挑剔的客戶,對(duì)接線員進(jìn)行考察。

(2)嵌入

所謂嵌入式,即在原有的應(yīng)用中嵌入大模型 Copilot 副駕駛的能力,從而支持一種新的交互模式。例如傳統(tǒng)的圖形界面交互方式,可以通過(guò)大模型結(jié)合自然語(yǔ)言來(lái)實(shí)現(xiàn),即透過(guò)菜單的層層點(diǎn)擊一步到位地實(shí)現(xiàn)用戶的功能,實(shí)現(xiàn)語(yǔ)控萬(wàn)數(shù),進(jìn)而語(yǔ)控萬(wàn)物。這樣,不僅僅拓寬了應(yīng)用場(chǎng)景,同時(shí)也拓寬了大模型的語(yǔ)義落地范圍。

(3)原生

原生,是近期各類 AI agent 的主要功能,即涉及多步操作的復(fù)雜指令,其中每步操作都會(huì)面向不同的外部資源,將外部資源進(jìn)行拆解、編排、規(guī)劃,確定執(zhí)行順序以及輸入輸出,將其形成任務(wù)流水線,進(jìn)行通用化執(zhí)行,最終得到結(jié)果。

以上是大模型的三種常見(jiàn)應(yīng)用場(chǎng)景,其中重構(gòu)類型和嵌入類型相對(duì)簡(jiǎn)單,目前已有典型的落地場(chǎng)景案例。而在原生場(chǎng)景中,需要較強(qiáng)的任務(wù)拆解、任務(wù)規(guī)劃、任務(wù)執(zhí)行等能力,同時(shí)還要具備較強(qiáng)的語(yǔ)言理解能力、計(jì)算能力和資源對(duì)接能力,這是后面需要著重完善的地方。

6. 大模型發(fā)展的路徑及思考

大模型的發(fā)展路徑及思考,可以用以下幾句話來(lái)概括:

  • 始于文本,拓展至多模態(tài)理解
  • 交互改善&研發(fā)提效
  • 從 copilot 到 agent

大模型從最初的文本理解,已經(jīng)拓展到多模態(tài)的理解,并不斷完善交互式體驗(yàn),使其在研發(fā)等場(chǎng)景上不斷提效。大模型從一個(gè)簡(jiǎn)單的 copilot,逐步發(fā)展到一個(gè)具備自主派解任務(wù)、規(guī)劃任務(wù)和執(zhí)行任務(wù)的 agent。

目前,大模型的發(fā)展正面臨一個(gè)關(guān)鍵的岔路口,即通用 vs. 垂域,以及模型 vs. 中控。

對(duì)于通用 vs. 垂域,筆者認(rèn)為,如果垂域模型是基于公開(kāi)數(shù)據(jù)和資料訓(xùn)練得到的,那么在預(yù)訓(xùn)練階段直接使用通用模型即可,而垂域模型在這一階段并不具有明顯的優(yōu)勢(shì)。在這種情況下,更重要的在于模型精調(diào),即優(yōu)化模型與場(chǎng)景的資源對(duì)接。我們要站在巨人的肩膀上前行,避免“重復(fù)造輪子”。

而對(duì)于模型 vs. 中控,筆者認(rèn)為,“中控”部分目前大有可為,因?yàn)槠渫瑫r(shí)對(duì)接模型、應(yīng)用和公共資源,而公共資源即活數(shù)據(jù),具有時(shí)效性、精準(zhǔn)性和私密性。因此,應(yīng)將“中控”做強(qiáng)做厚,隨著大模型的進(jìn)化,將應(yīng)用場(chǎng)景武裝得更加智能,發(fā)揮更好的業(yè)務(wù)支撐能力。

四、Q&A

Q1:金融大模型有哪四個(gè)典型應(yīng)用場(chǎng)景?

A1:金融大模型主要應(yīng)用于投顧、投研、運(yùn)維、合規(guī)這四大場(chǎng)景。

Q2:金融大模型率先落地哪個(gè)場(chǎng)景?

A2:筆者更加看好投顧和投研這兩個(gè)場(chǎng)景。對(duì)于投顧場(chǎng)景,需要對(duì)活數(shù)據(jù)的綜合使用能力。而活數(shù)據(jù)的使用也是有“厚度”的,常常需要基于活數(shù)據(jù)進(jìn)行常見(jiàn)問(wèn)題的提取和加工,以及高頻指標(biāo)的計(jì)算等,需要使用大模型提高信息加工效率,因此投顧這一場(chǎng)景具有較好的發(fā)展前景。而對(duì)于投研場(chǎng)景,作為金融工程的基本能力的延展,其價(jià)值不局限于研究所,而是將其賦能到資管、風(fēng)控等領(lǐng)域,其面向?qū)ο笠膊痪窒抻诜治鰩?,而是將其輻射到一?jí)市場(chǎng)的投行業(yè)務(wù),甚至可以進(jìn)一步延伸到實(shí)體經(jīng)濟(jì)的競(jìng)品分析、競(jìng)爭(zhēng)態(tài)勢(shì)分析等業(yè)務(wù)。綜上,筆者看好投研、投顧這兩個(gè)場(chǎng)景,認(rèn)為在這兩個(gè)場(chǎng)景下大模型可以率先落地。

責(zé)任編輯:姜華 來(lái)源: DataFunTalk
相關(guān)推薦

2025-01-03 08:26:17

2023-02-20 13:45:31

數(shù)據(jù)分析騰訊 Alluxio

2024-12-18 08:33:01

2024-07-10 08:58:22

2024-04-02 07:25:19

大語(yǔ)言模型青少年編程NLG

2024-07-09 11:01:24

2023-09-11 07:40:53

2024-12-23 16:02:39

2023-01-18 10:56:01

騰訊云金融全真互聯(lián)

2017-06-18 07:44:38

區(qū)塊鏈金融數(shù)字

2019-06-10 19:20:12

區(qū)塊鏈區(qū)塊鏈技術(shù)金融領(lǐng)域

2019-07-04 14:25:53

機(jī)器學(xué)習(xí)金融大數(shù)據(jù)

2025-01-15 09:16:10

2023-09-28 08:19:57

語(yǔ)言模型數(shù)倉(cāng)數(shù)據(jù)

2024-09-10 08:42:37

2017-07-31 10:31:13

2022-03-11 09:01:58

去哪兒網(wǎng)DevOps實(shí)踐

2024-06-26 19:18:53

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)