金融場景中的指標(biāo)體系建設(shè)與應(yīng)用
數(shù)勢科技是企業(yè)服務(wù)賽道的新勢力,采用新數(shù)智技術(shù)、新產(chǎn)品理念、新交付范式,結(jié)合業(yè)務(wù) Know-how,致力于解決企業(yè)服務(wù)領(lǐng)域中的各種難題和痛點(diǎn)。數(shù)勢的主要服務(wù)對(duì)象包括大金融、泛零售和新智能制造領(lǐng)域的優(yōu)秀企業(yè),專注于為客戶提供經(jīng)營決策和營銷相關(guān)的數(shù)據(jù)智能產(chǎn)品。本文將分享金融場景中的指標(biāo)體系建設(shè)思路,希望能夠?yàn)榇蠹規(guī)硇碌膯l(fā)。
一、金融行業(yè)指標(biāo)現(xiàn)狀
1. 指標(biāo)化經(jīng)營是企業(yè)數(shù)據(jù)化經(jīng)營基礎(chǔ)
當(dāng)前,整個(gè)市場已經(jīng)從流量時(shí)代進(jìn)入了存量競爭時(shí)代。特別是在金融領(lǐng)域,經(jīng)過過去 20 多年的信息化和數(shù)字化建設(shè),頭部銀行、證券和保險(xiǎn)等典型金融客戶已經(jīng)積累了海量的數(shù)據(jù)。然而,如何有效利用這些數(shù)據(jù)來支持企業(yè)的經(jīng)營、管理和決策,成為了一個(gè)亟待解決的大問題。
在這個(gè)過程中,指標(biāo)體系發(fā)揮著至關(guān)重要的作用。一個(gè)理想的企業(yè)經(jīng)營模式是,從企業(yè)經(jīng)營的大目標(biāo)(北極星指標(biāo))出發(fā),將目標(biāo)拆解到各個(gè)部門、員工等業(yè)務(wù)單元。通過構(gòu)建一個(gè)完善的指標(biāo)體系,實(shí)現(xiàn)金融企業(yè)的數(shù)字管理模式,將每個(gè)部門、每個(gè)人的工作緊密串聯(lián)起來。以指標(biāo)作為指揮棒,確保每項(xiàng)工作和每個(gè)角色都能形成閉環(huán)。
為了實(shí)現(xiàn)這一目標(biāo),企業(yè)需要建立一個(gè)統(tǒng)一、準(zhǔn)確、高效、集中化管理的指標(biāo)體系。這不僅是解決當(dāng)前金融行業(yè)痛點(diǎn)的關(guān)鍵,也是推動(dòng)金融企業(yè)持續(xù)發(fā)展的重要保障。
2. 指標(biāo)是實(shí)現(xiàn)企業(yè)戰(zhàn)略目標(biāo)的統(tǒng)一組織語言
在現(xiàn)實(shí)環(huán)境中,金融行業(yè)的建設(shè)長期以來依賴于成熟技術(shù),并投入了大量數(shù)據(jù)科技人才,通過自下而上或煙囪式的方式構(gòu)建其基礎(chǔ)架構(gòu)。金融體系已經(jīng)擁有很好的數(shù)字化基礎(chǔ),積累了龐大的數(shù)據(jù)量,展現(xiàn)出巨大的潛力。然而,盡管具備這些優(yōu)勢,金融行業(yè)在邁向智能化企業(yè)經(jīng)營理念的道路上,仍然面臨著數(shù)據(jù)孤島、指標(biāo)體系不統(tǒng)一以及難以適應(yīng)業(yè)務(wù)變化等多重挑戰(zhàn)和問題。
我們抽象出兩個(gè)主要問題:數(shù)據(jù)的混亂和需求響應(yīng)慢。在過往的金融企業(yè)數(shù)字化建設(shè)中,存在大量煙筒式的系統(tǒng)建設(shè)方式。根據(jù)對(duì)頭部客戶的調(diào)研和采訪,大部分企業(yè)擁有數(shù)百個(gè)大小各異的業(yè)務(wù)系統(tǒng),部門間的數(shù)據(jù)口徑和定義存在明顯差異。這種差異在單一部門或閉環(huán)業(yè)務(wù)單元內(nèi)可能可以通過指標(biāo)和數(shù)據(jù)驅(qū)動(dòng),而一旦涉及集團(tuán)化管理,部門間的數(shù)據(jù)口徑對(duì)齊就變得極為復(fù)雜,需要大量的往復(fù)溝通和對(duì)齊工作。
此外,基于這樣的數(shù)據(jù)基礎(chǔ)設(shè)施,數(shù)據(jù)倉庫中包含了大量的模型口徑定義和各種 ETL 任務(wù)。在這樣的環(huán)境下,業(yè)務(wù)迭代的周期和響應(yīng)速度已無法滿足數(shù)字化經(jīng)營的需求。隨著企業(yè)規(guī)模和數(shù)據(jù)的不斷增長,這種矛盾將愈發(fā)凸顯。
二、痛點(diǎn)->技術(shù)問題
1. 痛點(diǎn)分析
從數(shù)據(jù)的生產(chǎn)和消費(fèi)兩個(gè)維度出發(fā),我們重新理清了當(dāng)前面臨的主要痛點(diǎn)。
- 在數(shù)據(jù)的消費(fèi)端,無論是金融企業(yè)還是其他類型的企業(yè),其核心都是管理團(tuán)隊(duì)和業(yè)務(wù)團(tuán)隊(duì)在進(jìn)行數(shù)據(jù)消費(fèi)。管理團(tuán)隊(duì)主要接觸的是管理駕駛艙,這里的數(shù)據(jù)通過一系列復(fù)雜的數(shù)據(jù)加工管道和工作流形成,是管理者最為關(guān)注的信息。然而,他們面臨的問題在于只能看到數(shù)據(jù)的表象,卻難以深入探究數(shù)據(jù)的波動(dòng)原因或進(jìn)行下鉆分析。當(dāng)管理者需要基于數(shù)據(jù)進(jìn)行決策時(shí),他們可能會(huì)產(chǎn)生各種猜想和假設(shè),但由于數(shù)據(jù)使用的靈活性不足,這些猜想和假設(shè)難以得到驗(yàn)證,這是管理團(tuán)隊(duì)用數(shù)的主要痛點(diǎn)。
- 在數(shù)據(jù)的生產(chǎn)端,數(shù)據(jù)加工團(tuán)隊(duì)面臨著海量且復(fù)雜的任務(wù)。隨著企業(yè)規(guī)模的擴(kuò)大,不同部門提出的臨時(shí)性報(bào)表需求和數(shù)據(jù)加工需求不斷增加,導(dǎo)致團(tuán)隊(duì)的工作積壓嚴(yán)重。更糟糕的是,這些工作往往是一次性的,無法形成企業(yè)的數(shù)據(jù)資產(chǎn)和沉淀,這無疑是一種巨大的資源浪費(fèi)。這是數(shù)據(jù)生產(chǎn)者的主要痛點(diǎn)。
2. 痛點(diǎn)具體表述
為了更形象地展現(xiàn)這些問題,我們對(duì)從不同企業(yè)收集到的典型痛點(diǎn)進(jìn)行了一定的抽象和匯總,如上圖中所示。
從管理者的角度來看,數(shù)據(jù)并不直接等同于洞察或決策。他們面臨的挑戰(zhàn)在于如何準(zhǔn)確解讀這些數(shù)據(jù),理解其背后的深層含義。然而,由于數(shù)據(jù)是通過一系列復(fù)雜的數(shù)據(jù)加工管道和分析師的人為處理得到的,其中可能會(huì)引入一些主觀思考和誤解,導(dǎo)致信息扭曲或損失。此外,數(shù)據(jù)處理的速度和效率也是數(shù)據(jù)消費(fèi)過程中面臨的重要挑戰(zhàn)。
3. 痛點(diǎn)問題抽象
我們觀察到,盡管企業(yè)擁有龐大的數(shù)據(jù)資源,卻未能充分發(fā)揮數(shù)字化經(jīng)營的價(jià)值。這種供需沖突促使我們深入思考問題的本質(zhì)。
主流的數(shù)據(jù)管道和加工模式通常涉及多個(gè)環(huán)節(jié)和角色。決策者和業(yè)務(wù)人員基于經(jīng)營理念和邏輯,對(duì)數(shù)據(jù)產(chǎn)生需求,這些需求隨后被轉(zhuǎn)譯為具體的數(shù)據(jù)需求,并交由數(shù)據(jù)分析師處理。數(shù)據(jù)分析師與 BI 工程師協(xié)同工作,將業(yè)務(wù)需求轉(zhuǎn)化為 BI 報(bào)表需求。BI 工程師再進(jìn)一步與數(shù)據(jù)工程師溝通,明確報(bào)表對(duì)源數(shù)據(jù)的需求。而這些源數(shù)據(jù)通常受到數(shù)據(jù)管理部門的權(quán)限控制。經(jīng)過這一系列定義和管理流程,數(shù)據(jù)工程師最終從數(shù)據(jù)源獲取數(shù)據(jù),在數(shù)據(jù)倉庫中進(jìn)行深度加工,形成數(shù)據(jù)集市,并最終生成報(bào)表,滿足數(shù)據(jù)需求方。
這一典型的數(shù)據(jù)加工管道涉及多個(gè)角色的交叉協(xié)作,流程冗長。其中,關(guān)鍵的矛盾在于每個(gè)數(shù)據(jù)交互環(huán)節(jié)都需要需求提出方和實(shí)現(xiàn)者之間進(jìn)行信息口徑的對(duì)齊,不同知識(shí)背景的人在溝通中很容易產(chǎn)生信息消耗和損失,需要不斷糾偏,使得這一流程效率低下,并且信息損失、質(zhì)量問題不可避免。
三、解法
1. 痛點(diǎn)解法(數(shù)據(jù)右移、角色解耦)
在當(dāng)前大數(shù)據(jù)技術(shù)、大模型以及生成式人工智能技術(shù)迅猛發(fā)展的背景下,我們不禁思考:是否有可能實(shí)現(xiàn)數(shù)據(jù)從生產(chǎn)到價(jià)值的端到端交付?是否存在一種顛覆性創(chuàng)新方式,能夠縮短各環(huán)節(jié)流程,甚至使環(huán)節(jié)參與者變?yōu)閱我唤巧??這正是數(shù)勢科技一直在探索的解決方案。我們將其定義為“數(shù)據(jù)右移、角色解耦”,旨在解決行業(yè)痛點(diǎn),實(shí)現(xiàn)數(shù)據(jù)價(jià)值的最大化。
金融系統(tǒng)因其與資金緊密關(guān)聯(lián),對(duì)數(shù)據(jù)容錯(cuò)率有著極高的要求。無論是銀行、證券還是保險(xiǎn),每一筆交易都需精確無誤。在數(shù)據(jù)轉(zhuǎn)化為決策、決策指導(dǎo)營銷直至決策執(zhí)行的過程中,數(shù)據(jù)的準(zhǔn)確性和使用精度至關(guān)重要,這是行業(yè)的共識(shí)。
金融體系匯聚了大量具備豐富知識(shí)和經(jīng)驗(yàn)的業(yè)務(wù)人才,其知識(shí)密集度極高。然而,要求這些業(yè)務(wù)人員直接理解數(shù)據(jù)(即“業(yè)務(wù)知識(shí)左移”)確實(shí)面臨巨大挑戰(zhàn),幾乎難以實(shí)現(xiàn)。
因此,我們提出了一個(gè)創(chuàng)新的解法:通過產(chǎn)品和技術(shù)實(shí)現(xiàn)“數(shù)據(jù)右移”。這意味著讓數(shù)據(jù)建模和解讀更加接近業(yè)務(wù)人員,使他們能夠直接參與并操作。這樣,數(shù)據(jù)分析師和 BI 工程師的角色將被解耦,數(shù)據(jù)消費(fèi)者能夠更直接地獲取和使用數(shù)據(jù)的價(jià)值。
如果這一路徑得以成功實(shí)施,我們將真正實(shí)現(xiàn)數(shù)據(jù)價(jià)值的普惠化和民主化,讓“人人用數(shù)”成為可能。這將大大提高金融系統(tǒng)的運(yùn)行效率,同時(shí)降低對(duì)專業(yè)人才的依賴,推動(dòng)整個(gè)行業(yè)的進(jìn)步。
(1)數(shù)據(jù)語義建在數(shù)倉
在技術(shù)理念層面,傳統(tǒng)的數(shù)據(jù)指標(biāo)加工流程涉及從上游業(yè)務(wù)系統(tǒng)抽取數(shù)據(jù)源,存儲(chǔ)到數(shù)據(jù)湖中,并進(jìn)一步將數(shù)據(jù)拉入數(shù)據(jù)倉庫進(jìn)行深度處理。在數(shù)據(jù)倉庫中,執(zhí)行典型的 DWD(數(shù)據(jù)倉庫明細(xì)層)、DWS(數(shù)據(jù)倉庫匯總層)以及 ADS(應(yīng)用數(shù)據(jù)服務(wù)層)等分層建模加工。
建立詳細(xì)的數(shù)據(jù)口徑、權(quán)限管理,以及上層對(duì)各級(jí)各層數(shù)據(jù)的抽象邏輯,這些都嵌入在數(shù)據(jù)倉庫的復(fù)雜結(jié)構(gòu)中。然而,對(duì)于非技術(shù)人員而言,這個(gè)數(shù)據(jù)倉庫就是一個(gè)黑盒,其內(nèi)部的復(fù)雜性和運(yùn)作機(jī)制難以直觀理解。
盡管如此,這個(gè)黑盒的下游是企業(yè) BI 大屏和各種典型數(shù)據(jù)應(yīng)用場景。這就是傳統(tǒng)的數(shù)據(jù)加工模式,它一定程度保證了數(shù)據(jù)的準(zhǔn)確性和可靠運(yùn)行,但也帶來了技術(shù)復(fù)雜性、流程的冗長和非技術(shù)人員理解上的挑戰(zhàn)。
(2)數(shù)據(jù)語義建在倉外
數(shù)勢科技秉承 HeadlessBI 的理念,這一理念與數(shù)智工廠的理念不謀而合,體現(xiàn)了當(dāng)前企業(yè)對(duì)于低代碼平臺(tái)的共同期待。我們期望通過這一平臺(tái),將數(shù)據(jù)語義建在數(shù)據(jù)倉庫之外,即構(gòu)建一個(gè)強(qiáng)大的語義化指標(biāo)平臺(tái)。
借助指標(biāo)平臺(tái),我們的工作可以更加高效和靈活。在數(shù)據(jù)倉庫中,我們只需進(jìn)行基礎(chǔ)的數(shù)據(jù)加工,如原子指標(biāo)的構(gòu)建,而將數(shù)據(jù)語義和元數(shù)據(jù)的管理轉(zhuǎn)移到指標(biāo)平臺(tái)上。這樣,在指標(biāo)平臺(tái)上,可以實(shí)現(xiàn)數(shù)據(jù)的管研用一體化,通過簡單的拖拉拽即可完成指標(biāo)的加工。這樣企業(yè)就可以實(shí)現(xiàn)集中化的指標(biāo)管理。在這一過程中,業(yè)務(wù)人員和數(shù)據(jù)管理人員可以直接參與指標(biāo)的定義、管理和使用,無需依賴傳統(tǒng)的數(shù)據(jù)分析師團(tuán)隊(duì)。此外,新平臺(tái)上的指標(biāo)加工實(shí)現(xiàn)了即用即建,極大地縮短了指標(biāo)加工的周期,幾乎可以趨近于零。
基于 HeadlessBI 的指標(biāo)平臺(tái)理念,如果設(shè)計(jì)得當(dāng)、產(chǎn)品力強(qiáng)大,它將為企業(yè)數(shù)據(jù)消費(fèi)端的下游應(yīng)用、Agent 和 BI 等帶來更加便捷的體驗(yàn)。這不僅是數(shù)據(jù)價(jià)值釋放的關(guān)鍵,更是實(shí)現(xiàn)數(shù)據(jù)建??梢暬乙瞥鰝}的重要步驟。通過這一平臺(tái),業(yè)務(wù)人員、數(shù)據(jù)分析師以及其他對(duì)數(shù)據(jù)指標(biāo)加工和價(jià)值釋放有需求的角色都可以直接參與指標(biāo)的開發(fā),從而提升整個(gè)企業(yè)的數(shù)據(jù)驅(qū)動(dòng)能力。
2. 數(shù)據(jù)建模右移
(1)HeadlessBI 和指標(biāo)平臺(tái)
- HeadlessBI
數(shù)勢科技致力于實(shí)現(xiàn) HeadlessBI 和指標(biāo)平臺(tái)的核心價(jià)值。這背后的關(guān)鍵在于深入理解行業(yè),將產(chǎn)品力抽象至極致,形成易于使用且功能強(qiáng)大的產(chǎn)品。當(dāng)產(chǎn)品足夠優(yōu)秀時(shí),使用門檻將大大降低,指標(biāo)加工將變得優(yōu)雅而高效。這一過程中,系統(tǒng)的穩(wěn)定性和指標(biāo)管理能力都至關(guān)重要,它們?yōu)槲磥泶竽P蛻?yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。我們已成功交付數(shù)十家頭部客戶,并發(fā)布了行業(yè)首份指標(biāo)平臺(tái)白皮書。今年 5 月,我們更成為首家通過信通院認(rèn)證的指標(biāo)平臺(tái)。
- HME(指標(biāo)計(jì)算引擎)
在服務(wù)眾多客戶的過程中,我們面臨一個(gè)挑戰(zhàn):如何在滿足消費(fèi)端靈活性和速度的同時(shí),降低計(jì)算和存儲(chǔ)成本。這構(gòu)成了一個(gè)“不可能的三角”。為解決這一問題,我們打磨出了 HME 指標(biāo)計(jì)算引擎。它確保了我們的產(chǎn)品既具備秒級(jí)高性能,又保持優(yōu)雅的產(chǎn)品能力,同時(shí)實(shí)現(xiàn)成本、效益最大化。
- OLAP
對(duì)于 OLAP 選型,我們基于 Doris 和 StarRocks 進(jìn)行了深度優(yōu)化。這一技術(shù)路線選擇,確保了我們?cè)诖髷?shù)據(jù)處理和分析方面的性能優(yōu)勢。事實(shí)上,我們已通過第三方測試驗(yàn)證了這一點(diǎn),相關(guān)測試數(shù)據(jù)在公網(wǎng)上,均可查閱。我們堅(jiān)信,這一技術(shù)基礎(chǔ)將為客戶帶來更高效、更穩(wěn)定的數(shù)據(jù)分析體驗(yàn)。
(2)HeadlessBI 架構(gòu)
典型的 HeadlessBI 架構(gòu)分為三層。底層是物理層,利用 OLAP 技術(shù)(如使用外表等方式)將物理數(shù)據(jù)注冊(cè)為基礎(chǔ)元數(shù)據(jù),并捕獲基礎(chǔ)顆粒度的指標(biāo)。隨后,通過深度理解客戶業(yè)務(wù)邏輯和場景需求,實(shí)現(xiàn)指標(biāo)加工的可視化操作,簡化從數(shù)據(jù)準(zhǔn)備到模型構(gòu)建,再到指標(biāo)開發(fā)的流程。使整個(gè)過程是低門檻、優(yōu)雅且高效的,同時(shí)實(shí)現(xiàn)集中管理。構(gòu)建好這一層后,向上提供通用的主流 API 接口,支持 BI 分析、大模型應(yīng)用以及企業(yè)內(nèi)部的自主數(shù)據(jù)查詢,為其提供高性能、高并發(fā)、高吞吐以及高實(shí)時(shí)性的指標(biāo)服務(wù)。
為了滿足上述需求,我們服務(wù)的客戶數(shù)據(jù)規(guī)模常達(dá) TB 甚至 PB 級(jí)別,用戶數(shù)量更是數(shù)以億計(jì)。處理如此龐大的數(shù)據(jù)量和滿足客戶的復(fù)雜分析需求,要求我們擁有高度技術(shù)抽象能力的指標(biāo)引擎,以確保系統(tǒng)的高效運(yùn)行和數(shù)據(jù)處理能力。
(3)高性能虛擬計(jì)算引擎 V3.0
數(shù)勢科技的指標(biāo)引擎經(jīng)過三代演進(jìn),現(xiàn)已達(dá)到 V3.0 階段。最初,我們采用基于 Cube 或者大寬表的傳統(tǒng)方法,這些方法雖能滿足基本的取數(shù)需求,但存儲(chǔ)成本高昂,空間利用率低下。隨后,我們深入洞察不同業(yè)務(wù)和客戶的使用場景,對(duì)指標(biāo)和維度進(jìn)行了高度抽象,并引入了類似數(shù)據(jù)集的預(yù)計(jì)算和預(yù)加工技術(shù)。這一改進(jìn)在存儲(chǔ)和性能上取得了顯著的平衡,但靈活性受到了一定限制,并且在某些語義下仍存在數(shù)據(jù)冗余的問題。然而,我們始終致力于通過技術(shù)創(chuàng)新解決這些挑戰(zhàn),以提供更加高效、靈活且成本效益顯著的數(shù)據(jù)解決方案。
(4)HMEV3.0 基于 ROI 智能自迭代加速
HMEV3.0,作為新一代高性能指標(biāo)引擎,采用了基于結(jié)果的后置數(shù)據(jù)預(yù)計(jì)算策略,實(shí)現(xiàn)了基于 ROI 的智能自迭代加速。
這一策略的核心在于,系統(tǒng)通過注冊(cè)數(shù)據(jù)的元數(shù)據(jù)和使用場景,能夠自動(dòng)診斷哪些指標(biāo)在處理時(shí)速度較慢或無法及時(shí)生成。針對(duì)這些問題,系統(tǒng)會(huì)對(duì)相關(guān)數(shù)據(jù)進(jìn)行有針對(duì)性的調(diào)優(yōu)和預(yù)計(jì)算。一旦這些計(jì)算完成,新的查詢請(qǐng)求到來時(shí),系統(tǒng)會(huì)自動(dòng)改寫查詢語句,利用已完成的預(yù)計(jì)算結(jié)果,從而顯著提升查詢速度。
這種機(jī)制實(shí)現(xiàn)了企業(yè)數(shù)據(jù)使用的最小化預(yù)計(jì)算集合,并且具備自迭代能力。隨著企業(yè)查詢的不斷進(jìn)行,系統(tǒng)能夠智能地識(shí)別出哪些預(yù)計(jì)算資源已經(jīng)不再使用,并釋放這些資源,以保持存儲(chǔ)空間的優(yōu)化利用。這種智能查詢引擎的引入,使得企業(yè)在使用數(shù)據(jù)時(shí)能夠體驗(yàn)到查詢速度的不斷提升,同時(shí)降低空間和存儲(chǔ)成本,這正是我們持續(xù)迭代和優(yōu)化的理想目標(biāo)。
3. 數(shù)據(jù)解讀右移
(1)數(shù)勢科技 SwiftAgent
在擁有成熟產(chǎn)品和新設(shè)計(jì)理念的基礎(chǔ)上,再加上底層加速引擎的技術(shù)支撐,我們進(jìn)一步探索數(shù)據(jù)解讀的右移。在企業(yè)中,數(shù)據(jù)的消費(fèi)者可能是管理者、業(yè)務(wù)人員乃至全員,往往面臨一個(gè)共同的挑戰(zhàn):他們可能不熟悉BI 工具,導(dǎo)致這一強(qiáng)大工具在企業(yè)中的普及度受限。
然而,還有更多的人并不知道企業(yè)內(nèi)哪些數(shù)據(jù)能為他們的工作帶來幫助,也不知如何提出和尋找這些數(shù)據(jù)。即便我們提供了智能助手或與大模型交互的工具,他們也可能因不熟悉而難以利用。
基于對(duì)行業(yè)痛點(diǎn)的深入理解,數(shù)勢科技通過 SwiftAgent 致力于實(shí)現(xiàn)數(shù)據(jù)解讀價(jià)值的右移。我們的目標(biāo)是讓企業(yè)的每一位數(shù)據(jù)消費(fèi)者都能最大限度地挖掘和利用數(shù)據(jù),了解哪些數(shù)據(jù)對(duì)他們當(dāng)前的工作有益,并將這些數(shù)據(jù)轉(zhuǎn)化為知識(shí)和決策支持,從而真正發(fā)揮數(shù)據(jù)的價(jià)值。
(2)NL2SQL 存在效果瓶頸和性能風(fēng)險(xiǎn)
在當(dāng)前的行業(yè)趨勢中,主流技術(shù)思路之一是期望通過自然語言直接轉(zhuǎn)換為 SQL 或 Python 代碼,以滿足數(shù)據(jù)查詢需求。用戶可以通過大模型將自然語言描述的數(shù)據(jù)需求轉(zhuǎn)化為相應(yīng)的查詢語句,然后直接從數(shù)據(jù)倉庫中拉取數(shù)據(jù),得到反饋。
然而,根據(jù)我們的評(píng)估,盡管 NL2SQL 的準(zhǔn)確率在調(diào)優(yōu)后,能達(dá)到百分之六七十的較高水平,但在實(shí)際應(yīng)用中仍面臨諸多挑戰(zhàn)。首先,生成的 SQL 語句往往缺乏足夠的調(diào)優(yōu),這可能導(dǎo)致查詢性能低下,甚至無法正確執(zhí)行。對(duì)于復(fù)雜的數(shù)據(jù)加工和計(jì)算任務(wù),可能需要預(yù)計(jì)算支持,而 NL2SQL 系統(tǒng)通常無法直接處理這類需求。
此外,即便能夠生成并執(zhí)行查詢語句,頻繁的實(shí)時(shí)查詢也會(huì)對(duì)企業(yè)的存儲(chǔ)和計(jì)算資源造成巨大壓力,造成資源的浪費(fèi)。同時(shí),NL2SQL 技術(shù)還需要考慮學(xué)習(xí)成本、數(shù)據(jù)安全等一系列問題。因此,雖然 NL2SQL 技術(shù)具有一定的潛力和價(jià)值,但在實(shí)際應(yīng)用中仍需面對(duì)諸多挑戰(zhàn)和限制。
(3)數(shù)勢 NL2MQL 之路相比 NL2SQL 優(yōu)勢
鑒于 NL2SQL 在復(fù)雜查詢場景下遭遇的諸多挑戰(zhàn)和限制,數(shù)勢科技采取了創(chuàng)新的解法,通過整合指標(biāo)平臺(tái)和智能代理(agent)的能力,成功實(shí)現(xiàn)了自然語言到指標(biāo)(簡稱 NL2MQL)的轉(zhuǎn)換,再將指標(biāo)對(duì)應(yīng)到 SQL,這一路徑有效克服了 NL2SQL 的難題。
以復(fù)雜的查詢?yōu)槔S著查詢復(fù)雜度的提升,NL2SQL 的實(shí)現(xiàn)難度急劇增加,甚至在某些場景下變得不可行。而數(shù)勢科技的 NL2MQL 方案則通過先將自然語言轉(zhuǎn)換為細(xì)顆粒度的指標(biāo)語義,再將指標(biāo)語義轉(zhuǎn)化為 API 請(qǐng)求,最后通過指標(biāo)平臺(tái)調(diào)用取數(shù) SQL,這一過程不僅確保了查詢的準(zhǔn)確性和高效性,還使得大模型的數(shù)據(jù)解讀能力得以商業(yè)化落地。
數(shù)勢 NL2MQL 的優(yōu)勢在于其能夠更精準(zhǔn)地理解用戶的查詢意圖,將自然語言轉(zhuǎn)化為更符合業(yè)務(wù)邏輯的指標(biāo)語義,進(jìn)而通過高性能的指標(biāo)平臺(tái)快速生成并執(zhí)行 SQL 查詢。這種兩段式的處理方式不僅提高了查詢的準(zhǔn)確性和效率,還降低了對(duì)存儲(chǔ)和計(jì)算資源的消耗,為企業(yè)帶來了更大的商業(yè)價(jià)值。
此外,數(shù)勢 NL2MQL 還具備高度的靈活性和可擴(kuò)展性,能夠輕松應(yīng)對(duì)不同行業(yè)和不同場景下的數(shù)據(jù)查詢需求。通過不斷的優(yōu)化和迭代,數(shù)勢科技將繼續(xù)推動(dòng) NL2MQL 技術(shù)的發(fā)展,為企業(yè)提供更高效、更智能的數(shù)據(jù)分析和決策支持。
(4)指標(biāo)平臺(tái)+大模型,實(shí)現(xiàn)數(shù)據(jù)價(jià)值的端到端
通過多個(gè)客戶的 POC 驗(yàn)證和交付實(shí)踐,我們已經(jīng)充分展示了指標(biāo)平臺(tái)與大模型結(jié)合后所帶來的強(qiáng)大能力。這種結(jié)合使得數(shù)據(jù)質(zhì)量和問題回答的準(zhǔn)確率幾乎達(dá)到了數(shù)據(jù)質(zhì)量的上限,同時(shí)顯著提升了性能,降低了學(xué)習(xí)成本,并確保了數(shù)據(jù)安全。
在指標(biāo)平臺(tái)上,我們深入整合了數(shù)據(jù)的權(quán)限管理功能。通過與企業(yè)的組織劃分、人員權(quán)限標(biāo)簽等系統(tǒng)緊密連接,我們能夠?qū)崿F(xiàn)從表、緯度、指標(biāo)乃至更細(xì)顆粒度的權(quán)限控制。這種精細(xì)化的權(quán)限管理確保了數(shù)據(jù)的安全性和合規(guī)性,同時(shí)為企業(yè)提供了更加靈活和高效的數(shù)據(jù)使用方式。
(5)Agent 架構(gòu)運(yùn)轉(zhuǎn)流程
我們的產(chǎn)品中的 Agent 是一個(gè)典型的多智能體解決方案。通過運(yùn)用 TOT(Task Oriented Thinking)和 COT(Conversation Oriented Thinking)等先進(jìn)的 Prompt 工程技術(shù),Agent 能夠精準(zhǔn)地拆解問題,并實(shí)現(xiàn)協(xié)同決策。
在運(yùn)作過程中,Agent 會(huì)充分利用之前提到的指標(biāo)平臺(tái),高效地調(diào)用相應(yīng)的 Actions,獲取數(shù)據(jù)后進(jìn)行后驗(yàn)推理,并將結(jié)果準(zhǔn)確、及時(shí)地呈現(xiàn)給客戶。這一流程確保了數(shù)據(jù)處理的準(zhǔn)確性和高效性,為用戶提供了卓越的使用體驗(yàn)。
(6)數(shù)勢科技 SwiftAgent 流程圖
這是數(shù)勢科技 SwiftAgent 的一個(gè)典型請(qǐng)求流程圖。當(dāng)用戶發(fā)出請(qǐng)求時(shí),系統(tǒng)首先接收并處理這一請(qǐng)求。值得一提的是,我們采用 RAG(知識(shí)圖譜構(gòu)建方法)的方式,將企業(yè)的知識(shí)庫無縫集成,確保企業(yè)內(nèi)部指標(biāo)口徑的語言或工作語言習(xí)慣與指標(biāo)平臺(tái)保持一致,為大模型提供友好支持。
隨后,經(jīng)過大模型的處理,請(qǐng)求會(huì)流轉(zhuǎn)到工具調(diào)用部分。在這里,結(jié)合前面提到的指標(biāo)語義平臺(tái),我們能夠?qū)崿F(xiàn)足夠細(xì)顆粒度的 API 調(diào)用,確保數(shù)據(jù)的準(zhǔn)確性和高效性。整個(gè)流程的設(shè)計(jì)旨在為用戶提供卓越的使用體驗(yàn),同時(shí)確保數(shù)據(jù)處理的高效和準(zhǔn)確。
(7)數(shù)勢科技 SwiftAgent 創(chuàng)造性解決 5 大挑戰(zhàn)
借助指標(biāo)平臺(tái)與數(shù)勢科技研發(fā)的 Swiftagent 多智能體產(chǎn)品能力,我們成功實(shí)現(xiàn)了從數(shù)據(jù)生產(chǎn)到數(shù)據(jù)消費(fèi)的端到端的數(shù)據(jù)價(jià)值流轉(zhuǎn),創(chuàng)造性地提出了應(yīng)對(duì)五大挑戰(zhàn)的解決方案。
首先,針對(duì)分析準(zhǔn)確性的挑戰(zhàn),我們認(rèn)識(shí)到大模型在轉(zhuǎn)換為 SQL 或代碼時(shí)準(zhǔn)確率不足,這限制了產(chǎn)品的實(shí)用性。因此,我們利用指標(biāo)和標(biāo)簽的語義化產(chǎn)品,以及數(shù)據(jù)虛擬化技術(shù),實(shí)現(xiàn)了數(shù)據(jù)價(jià)值的右移,從而顯著提升數(shù)據(jù)分析的準(zhǔn)確性。
其次,數(shù)據(jù)全面性是另一個(gè)重要挑戰(zhàn)。為了深入理解企業(yè)數(shù)據(jù)的語義,我們整合了多源異構(gòu)數(shù)據(jù),包括結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),以及企業(yè)內(nèi)部知識(shí)庫。這一舉措有助于我們更全面地理解企業(yè)的數(shù)據(jù)結(jié)構(gòu)。
在人機(jī)融合創(chuàng)新方面,我們通過 SwiftAgent 產(chǎn)品的精細(xì)工程化,為用戶提供了智能的數(shù)據(jù)推薦和洞察。無論用戶是數(shù)據(jù)的消費(fèi)者還是新手,我們都能通過權(quán)限管理、模糊提問、反問和追問機(jī)制等,幫助用戶澄清問題,降低數(shù)據(jù)使用的門檻,釋放更大的數(shù)據(jù)價(jià)值。
此外,我們的模型還具備持續(xù)反思、積累和迭代能力,這是實(shí)現(xiàn)產(chǎn)品不斷優(yōu)化和進(jìn)步的關(guān)鍵。
最后,面對(duì) LUI 交互模式下靈活取數(shù)的需求,我們引入了指標(biāo)預(yù)計(jì)算 HME 技術(shù)。這一技術(shù)能夠確保在足夠靈活的取數(shù)場景下,仍然保持高性能的響應(yīng)速度。通過這一技術(shù),實(shí)現(xiàn)了企業(yè)數(shù)據(jù)價(jià)值的普惠化,讓每個(gè)人都能輕松使用數(shù)據(jù)。
四、指標(biāo)產(chǎn)品合作案例
1. 某頭部證券公司基于指標(biāo)平臺(tái)的經(jīng)營分析平臺(tái)建設(shè)
該案例涉及的是數(shù)勢科技與某頭部券商的合作,該券商在數(shù)據(jù)分析領(lǐng)域遇到了多個(gè)典型問題,包括分析準(zhǔn)確性、數(shù)據(jù)全面性、人機(jī)融合創(chuàng)新等方面的挑戰(zhàn)。數(shù)勢科技通過其指標(biāo)平臺(tái)和 SwiftAgent 產(chǎn)品,為該券商提供了端到端的數(shù)據(jù)價(jià)值流轉(zhuǎn)解決方案。
2. 80% 的新增指標(biāo)不依賴數(shù)據(jù)人員
隨著我們的第一代和第二代指標(biāo)平臺(tái)相繼成功實(shí)施,企業(yè)內(nèi)部約 80% 的指標(biāo)開發(fā)工作已經(jīng)實(shí)現(xiàn)了通過拖拉拽式的零代碼開發(fā),直接由業(yè)務(wù)人員完成。這一過程中,平臺(tái)提供了沖突檢查以及指標(biāo)全生命周期的質(zhì)量管理功能,確保數(shù)據(jù)的質(zhì)量與準(zhǔn)確性。
同時(shí),我們將剩余約 20% 更為底層和復(fù)雜的數(shù)據(jù)工作交給了專業(yè)的數(shù)據(jù)工程師團(tuán)隊(duì)。他們運(yùn)用自己的技術(shù)能力,專注于數(shù)據(jù)倉庫的質(zhì)量管理、生命周期維護(hù)以及更深層的數(shù)據(jù)管理,從而進(jìn)一步提純數(shù)據(jù)的價(jià)值。
這種分工方式使得整個(gè)數(shù)據(jù)處理流程更加高效,縮短了管道、流程和時(shí)間,確保數(shù)據(jù)能夠更快速、更準(zhǔn)確地為企業(yè)創(chuàng)造價(jià)值。
3. 面向業(yè)務(wù)人員的 BI 分析產(chǎn)品,隨時(shí)隨地修改卡片
基于這樣一個(gè)可以靈活取數(shù)的指標(biāo)平臺(tái),當(dāng)下游 BI 產(chǎn)生新的數(shù)據(jù)使用需求時(shí),業(yè)務(wù)人員可以直接在指標(biāo)平臺(tái)上通過簡單的拖拉拽操作,快速配置所需的數(shù)據(jù)。
4. 面向業(yè)務(wù)場景,低門檻靈活組裝個(gè)性化看板
此外,指標(biāo)平臺(tái)還支持多種低門檻、靈活的組裝方式,幫助業(yè)務(wù)人員輕松構(gòu)建出各類指標(biāo)的看板,實(shí)現(xiàn)數(shù)據(jù)的可視化展示和深度分析。
5. 支持業(yè)務(wù)同學(xué)對(duì)話式進(jìn)行數(shù)據(jù)分析,更好的智能化交互體驗(yàn)
通過 SwiftAgent 的強(qiáng)大能力,我們實(shí)現(xiàn)了數(shù)據(jù)使用的零門檻,讓業(yè)務(wù)人員能夠輕松上手。
最后進(jìn)行一下總結(jié),數(shù)勢科技始終秉持客戶、用戶至上的理念,通過技術(shù)和產(chǎn)品的創(chuàng)新,站在數(shù)據(jù)消費(fèi)者的角度,為客戶、用戶提供端到端的解決方案,真正解決他們?cè)跀?shù)據(jù)使用上的難題。我們誠摯地歡迎感興趣的同行共同探討,期待通過我們的共同努力,讓數(shù)據(jù)的價(jià)值實(shí)現(xiàn)真正的民主化、普惠化。感謝大家的關(guān)注與支持!
五、Q&A
Q1:請(qǐng)問方便說一下 agent 的底座模型是什么?自研還是開源?參數(shù)量級(jí)是多少?
A1:在國內(nèi),當(dāng)涉及到大模型的部署,特別是面向 ToB 企業(yè)時(shí),我們通常會(huì)遇到私有化部署的需求。在這個(gè)方面,我們與百川、智普緊密合作,共同探索和創(chuàng)新,以滿足企業(yè)的特殊需求。然而,隨著市場競爭的加劇和價(jià)格戰(zhàn)的到來,我們注意到一個(gè)明顯的趨勢:越來越多的客戶開始接受并傾向于使用大模型的 API 服務(wù)方式。
為了順應(yīng)這一市場變化,我們也積極適配了各大主流平臺(tái),如通義、文心以及 OpenAI 等,以確保我們的服務(wù)能夠覆蓋更廣泛的客戶群體。無論是選擇私有化部署還是 API 服務(wù)方式,我們都致力于為客戶提供最優(yōu)質(zhì)、最符合其需求的解決方案。
Q2:指標(biāo) Agent 在人效提升上有什么樣的促進(jìn)?比如讓每個(gè)崗位更好地創(chuàng)造價(jià)值,而不是像工具人的值指標(biāo)對(duì)齊。
A2:指標(biāo) Agent 在人效提升上起到了至關(guān)重要的作用,它不僅僅是對(duì)齊指標(biāo)的工具,而是每個(gè)崗位創(chuàng)造價(jià)值的強(qiáng)大助手。正如我之前提到的,ChatGPT 這類聊天工具在處理通識(shí)性的問題時(shí)表現(xiàn)出色,但當(dāng)面對(duì)專業(yè)性問題或期望其替代我們完成工作時(shí),其能力便顯得捉襟見肘。這正是 NL2SQL 等技術(shù)在應(yīng)用中遇到的困境,盡管它們有著一定的準(zhǔn)確率,但遠(yuǎn)未達(dá)到可以直接應(yīng)用于工作的程度。
然而,通過引入指標(biāo)平臺(tái)和 Agent 的結(jié)合,我們得以跨越這一障礙。這種方案不僅確保了數(shù)據(jù)的準(zhǔn)確性達(dá)到了數(shù)據(jù)質(zhì)量的上限,而且真正地對(duì)我們的工作產(chǎn)生了實(shí)質(zhì)性的幫助。Agent 不再是一個(gè)簡單的工具,而是成為了我們工作的延伸,它告訴我們數(shù)據(jù)的價(jià)值,并幫助我們將這些價(jià)值轉(zhuǎn)化為知識(shí)和決策,進(jìn)而形成企業(yè)的寶貴經(jīng)驗(yàn)。
對(duì)于不同的角色——新員工、資深員工、專家以及管理者——他們對(duì)數(shù)據(jù)的解讀和洞察能力各不相同。但大模型的引入使得我們可以將企業(yè)的知識(shí)庫與之掛接,讓這個(gè)大模型在企業(yè)的應(yīng)用中不斷學(xué)習(xí)和提煉,變得越來越聰明。這不僅僅是一個(gè)數(shù)據(jù)分析的專家在訓(xùn)練 Agent,更是一個(gè)企業(yè)在訓(xùn)練自己的數(shù)據(jù)分析專家。這樣的專家不再局限于某個(gè)特定的崗位,而是可以為每個(gè)需要數(shù)據(jù)的員工提供服務(wù),即使他們不擅長提出專業(yè)問題,Agent 也能幫助他們最大化地利用手頭的數(shù)據(jù)資源。
因此,指標(biāo) Agent 的引入不僅僅是提升了人效,更是將數(shù)據(jù)的價(jià)值最大化、普惠化,幫助企業(yè)從數(shù)據(jù)中獲取更多的洞察力和決策依據(jù)。這個(gè)過程已經(jīng)超越了簡單的效率提升,而是為企業(yè)的整體發(fā)展注入了新的動(dòng)能。