偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

知識圖與大型語言模型的協(xié)同作用

人工智能
從非結(jié)構(gòu)化文本中提取有價值的見解是金融行業(yè)的關(guān)鍵應(yīng)用。然而,這項任務(wù)往往超出了簡單的數(shù)據(jù)提取,需要高級推理能力。

從非結(jié)構(gòu)化文本中提取有價值的見解是金融行業(yè)的關(guān)鍵應(yīng)用。然而,這項任務(wù)往往超出了簡單的數(shù)據(jù)提取,需要高級推理能力。

一個典型的例子是確定信貸協(xié)議中的到期日,這通常涉及破譯一個復雜的指令,如“到期日應(yīng)在生效日期三周年之前的最后一個工作日”。這種級別的復雜推理對大型語言模型(LLM)提出了挑戰(zhàn)。它需要結(jié)合外部知識,如假日日歷,以準確地解釋和使用給定的指示。集成知識圖是一種很有前途的解決方案,具有幾個關(guān)鍵優(yōu)勢。

Transformer的出現(xiàn)徹底改變了文本矢量化,實現(xiàn)了前所未有的精度。這些嵌入封裝了深刻的語義含義,超越了以前的方法,這就是為什么大型語言模型(LLM)在生成文本方面如此出色的原因。

LLM進一步展示了推理能力,盡管有局限性:他們推理的深度往往會迅速下降。然而,將知識圖與這些向量嵌入相結(jié)合可以顯著提高推理能力。這種協(xié)同利用嵌入的固有語義豐富性,將推理能力提升到無與倫比的高度,標志著人工智能的重大進步。

在金融領(lǐng)域,LLM主要通過檢索增強生成(RAG)來使用,這種方法將新的、訓練后的知識注入LLM。這個過程包括對文本數(shù)據(jù)進行編碼,為有效檢索建立索引,對查詢進行編碼,并使用類似的算法獲取相關(guān)段落。然后將這些檢索到的段落與查詢一起使用,作為LLM生成響應(yīng)的基礎(chǔ)。

這種方法大大擴展了LLM的知識基礎(chǔ),使其對財務(wù)分析和決策非常寶貴。雖然檢索增強生成標志著重大的進步,但它也有局限性。

一個關(guān)鍵的缺點在于通道向量可能無法完全掌握查詢的語義意圖,從而導致忽略了重要的上下文。出現(xiàn)這種疏忽的原因是,嵌入可能無法捕捉到理解查詢的全部范圍所必需的某些推斷連接。

此外,將復雜的段落濃縮成單個向量可能會導致細微差別的喪失,模糊了分布在句子中的關(guān)鍵細節(jié)。

還有就是匹配過程單獨處理每個段落,缺乏可以連接不同事實的聯(lián)合分析機制。這種缺失阻礙了模型從多個來源聚合信息的能力,而聚合信息對于生成來自不同上下文信息達成全面而準確的響應(yīng)通常是必需的。

改進檢索增強生成框架的努力有很多,從優(yōu)化塊大小到使用父塊檢索器、假設(shè)問題嵌入和查詢重寫。雖然這些策略提供了改進,但它們不會導致革命性的結(jié)果變化。另一種方法是通過擴展上下文窗口來繞過檢索增強生成,就像Google Gemini躍升到100萬個令牌容量一樣。然而,這帶來了新的挑戰(zhàn),包括在擴展的背景下不一致的焦點和大量的信息,通常是數(shù)千倍的成本增加。

將知識圖與密集向量結(jié)合起來是最有希望的解決方案。雖然嵌入有效地將不同長度的文本壓縮為固定維向量,從而能夠識別語義相似的短語,但它們有時無法區(qū)分關(guān)鍵的細微差別。例如,“來自銀行的現(xiàn)金和到期”和“現(xiàn)金和現(xiàn)金等價物”產(chǎn)生幾乎相同的向量,這表明相似性忽略了實質(zhì)性差異。后者包括有息實體,如“資產(chǎn)支持證券”或“貨幣市場基金”,而“銀行到期”指的是無息存款。

知識圖能捕獲概念之間復雜的相互關(guān)系。這培養(yǎng)了更深層次的上下文洞察力,通過概念之間的聯(lián)系強調(diào)了額外的獨特特征。例如,美國公認會計準則知識圖譜清楚地將“現(xiàn)金和現(xiàn)金等價物”、“銀行計息存款”和“銀行到期”的總和定義為“現(xiàn)金和現(xiàn)金等價物”。

通過整合這些詳細的上下文線索和關(guān)系,知識圖顯著提高了LLM的推理能力。它們可以在單個圖中實現(xiàn)更精確的多級推理,并促進跨多個圖的聯(lián)合推理。

責任編輯:華軒 來源: Ai時代前沿
相關(guān)推薦

2023-07-04 10:28:15

模型論文

2023-04-27 19:02:30

語言模型管理企業(yè)數(shù)據(jù)

2025-05-28 01:50:00

2025-01-09 10:52:23

RAG知識圖譜人工智能

2024-08-13 08:09:34

2024-12-12 09:11:58

2023-05-08 14:56:33

大型語言模型代碼

2017-04-13 11:48:05

NLP知識圖譜

2021-01-18 10:50:29

知識圖譜人工智能深度學習

2024-04-16 16:14:01

人工智能LLMRAG

2023-08-22 15:34:01

Python開發(fā)

2023-09-27 09:00:00

大型語言模型自然語言處理

2025-01-15 07:52:53

2023-06-19 16:05:22

大型語言模型人工智能

2024-01-29 00:25:59

人工智能結(jié)構(gòu)化編碼

2025-06-03 15:00:04

2024-04-16 14:57:51

人工智能深度學習

2023-06-09 08:00:00

QLoRa語言模型微調(diào)

2023-07-10 08:00:00

點贊
收藏

51CTO技術(shù)棧公眾號