偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

上交、清華、微軟、上海AI Lab等聯(lián)合發(fā)布數(shù)據(jù)分析智能體綜述,LLM化身數(shù)據(jù)分析師,讓數(shù)據(jù)自己「說話」

人工智能 新聞
近日,由上海交通大學(xué)、清華大學(xué)、微軟雷德蒙德研究院、上海 AI Lab 等機構(gòu)研究者聯(lián)合撰寫的最新綜述論文系統(tǒng)回顧了大語言模型在數(shù)據(jù)分析領(lǐng)域的整體演進:從傳統(tǒng)規(guī)則化流程到智能協(xié)作,從單模態(tài)到多模態(tài)融合,并提出構(gòu)建「通用數(shù)據(jù)分析智能體(General Data Analyst Agent)」的新范式。

傳統(tǒng)數(shù)據(jù)分析方法依賴人工拼接的流程,如編寫SQL、調(diào)用Python腳本及手動解讀數(shù)據(jù),不僅耦合度高且擴展性差,難以應(yīng)對動態(tài)、多模態(tài)的復(fù)雜數(shù)據(jù)。而大語言模型與智能體的出現(xiàn),將數(shù)據(jù)分析從「規(guī)則執(zhí)行」推向「語義理解」,使機器能夠真正解讀數(shù)據(jù)內(nèi)在邏輯與關(guān)系,從而靈活完成查詢、建模與報告生成等多樣化任務(wù)。

近日,由上海交通大學(xué)、清華大學(xué)、微軟雷德蒙德研究院、上海 AI Lab 等機構(gòu)研究者聯(lián)合撰寫的最新綜述論文系統(tǒng)回顧了大語言模型在數(shù)據(jù)分析領(lǐng)域的整體演進:從傳統(tǒng)規(guī)則化流程到智能協(xié)作,從單模態(tài)到多模態(tài)融合,并提出構(gòu)建「通用數(shù)據(jù)分析智能體(General Data Analyst Agent)」的新范式。

  • 論文標(biāo)題:LLM/Agent-as-Data-Analyst 
  • 論文地址:https://arxiv.org/abs/2509.23988
  • Github 項目主頁:https://github.com/weAIDB/awesome-data-llm

本文綜述了大語言模型(LLM)與智能體(Agent)在數(shù)據(jù)分析領(lǐng)域的最新進展,重點討論結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化及異構(gòu)數(shù)據(jù)上的關(guān)鍵技術(shù)與演化趨勢,并總結(jié)出語義理解、自主管道、自動工作流、工具協(xié)作與面向開放世界五大方向。還提出了在可擴展性、評估體系與實際落地等方面的未來挑戰(zhàn),旨在推動通用數(shù)據(jù)分析智能體的發(fā)展與應(yīng)用。

圖 1:大語言模型進行數(shù)據(jù)分析的技術(shù)演進示意圖

經(jīng)過系統(tǒng)的調(diào)研與分析,研究團隊總結(jié)出 LLM/Agent 技術(shù)在數(shù)據(jù)分析領(lǐng)域的四個核心演進方向:

  • 從字面理解 → 語義推理:模型不再只「看數(shù)據(jù)」,而是真正「理解數(shù)據(jù)」,能洞察語義、推理邏輯。
  • 從封閉工具 → 自由協(xié)作:模型能調(diào)用外部 API 與知識庫,與各類工具協(xié)同完成復(fù)雜任務(wù)。
  • 從封閉數(shù)據(jù) → 開放域分析:針對沒有結(jié)構(gòu)約束的數(shù)據(jù)進行分析,擺脫原有工具限制,可以從數(shù)據(jù)中分析獲得更有價值的結(jié)論。
  • 從靜態(tài)工作流 → 動態(tài)生成:智能體可自動構(gòu)建分析流程與管道,讓數(shù)據(jù)處理更高效、更靈活。
  • 從人工 Agent 框架 → 自動生成框架:智能體可以智能構(gòu)建為某個工作服務(wù)的智能體,更靈活的實現(xiàn) Agent 工作流。

這五大趨勢共同指向一個方向——讓數(shù)據(jù)分析真正從「規(guī)則系統(tǒng)」邁向「智能體系統(tǒng)」,讓模型不止是工具,而成為數(shù)據(jù)智能時代的思考者與合作者。

圖 2:LLM/Agent-as-Data-Analyst 技術(shù)總覽,涵蓋本文具體討論的四大數(shù)據(jù)模態(tài):結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和異構(gòu)化數(shù)據(jù)。

圖 2 展示了該綜述的主要研究內(nèi)容,首先從不同數(shù)據(jù)類別進行介紹,包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及異構(gòu)數(shù)據(jù),針對不同數(shù)據(jù)類型,針對不同任務(wù)或技術(shù)展開。

  • 結(jié)構(gòu)化數(shù)據(jù):(1)關(guān)系型數(shù)據(jù)分析:由 NL2SQL 向多樣化的 NL2Code、ModelQA 過渡,研究方向包括語義對齊與模式鏈接、多步分解與檢索增強推理、端到端表格問答(TableGPT、ReAcTable);(2)圖數(shù)據(jù)分析:以 NL2GQL 為代表,研究重點在圖查詢生成、語義級圖推理與代理式操作(如 R3-NL2GQL、GraphGPT),逐步實現(xiàn)從代碼級到語義級的自動理解與執(zhí)行。
  • 半結(jié)構(gòu)化數(shù)據(jù):(1)標(biāo)記語言理解:任務(wù)包含標(biāo)記抽?。ㄈ?Evaporate)、標(biāo)記查詢(如 XPath Agent)、以及結(jié)構(gòu)語義理解(如 MarkupLM)。技術(shù)路線從模板 + 規(guī)則驅(qū)動向基于 LLM 的數(shù)據(jù)抽取與查詢轉(zhuǎn)變,強調(diào)樹結(jié)構(gòu)建模、層級編碼、工具增強等;(2)半結(jié)構(gòu)化表格理解:核心任務(wù)涵蓋表格結(jié)構(gòu)化表示(如 ST-Raptor)、模型驅(qū)動轉(zhuǎn)換(如 TabFormer)、表格提示壓縮(如 HySem)與查詢推理(如 CoS)。
  • 非結(jié)構(gòu)化數(shù)據(jù):(1)文檔理解:使用 OCR 等技術(shù)將文檔轉(zhuǎn)換為純文本格式(ZenDB、QUEST),結(jié)合 RAG 等技術(shù)進行理解;從 OCR 模板式到 VLM 轉(zhuǎn)變(DocLLM、DocOwl2、DLAFormer),任務(wù)包括版面識別、RAG 檢索問答、摘要生成與多文檔推理。(2)圖表理解:將圖像解析與自然語言推理結(jié)合(ChartQA、Chart-of-Thought),支持描述生成、問答與可視化推理。(3)視頻與 3D 模型分析:實現(xiàn)時序定位、行為識別、三維語義融合(Video-LLaMA、LLMI3D)。
  • 異構(gòu)數(shù)據(jù):跨模態(tài)整合多源數(shù)據(jù)湖,支撐統(tǒng)一語義查詢與多模態(tài)推理。主要子任務(wù)包括模態(tài)對齊、自然語言檢索接口、異構(gòu)分析智能體(HetAgent、XMODE)。

不同于以往聚焦單一任務(wù)或單一模態(tài)的研究,這篇綜述首次從全模態(tài)與全流程視角系統(tǒng)梳理了 LLM/Agent 在數(shù)據(jù)分析領(lǐng)域的整體格局,提出了構(gòu)建「通用數(shù)據(jù)分析智能體(General Data Analyst Agent)」的五項核心設(shè)計原則。它不僅總結(jié)了當(dāng)前研究的關(guān)鍵能力與趨勢,也揭示了可擴展性、魯棒性與開放域適配等未來挑戰(zhàn)。歡迎感興趣的讀者閱讀、討論和引用該論文。

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2016-10-21 14:41:22

數(shù)據(jù)分析師大數(shù)據(jù)

2013-10-22 22:55:54

微軟大數(shù)據(jù)數(shù)據(jù)分析

2023-07-06 14:52:36

數(shù)據(jù)分析師SQL

2015-08-19 13:50:19

數(shù)據(jù)分析

2015-08-17 09:39:40

大數(shù)據(jù)

2012-08-08 09:00:29

數(shù)據(jù)分析師

2023-07-08 23:05:01

數(shù)據(jù)分析運營

2020-05-12 10:44:19

數(shù)據(jù)分析師薪資數(shù)據(jù)

2021-03-26 07:37:34

數(shù)據(jù)分析工具技能

2015-08-18 13:26:05

數(shù)據(jù)分析

2012-08-07 17:32:25

數(shù)據(jù)分析師

2019-10-25 15:55:18

永洪科技大數(shù)據(jù)分析

2023-05-26 07:50:17

數(shù)據(jù)分析師BI工具

2015-04-03 11:19:21

大數(shù)據(jù)大數(shù)據(jù)分析師

2023-07-28 14:48:00

數(shù)據(jù)分析效果

2013-07-29 15:58:28

大數(shù)據(jù)數(shù)據(jù)分析

2017-02-13 19:25:24

2016-01-26 10:33:23

大數(shù)據(jù)分析工具數(shù)據(jù)分析師

2017-05-11 10:05:47

數(shù)據(jù)分析excelPython
點贊
收藏

51CTO技術(shù)棧公眾號