偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<em id="6glgb"></em>

<bdo id="6glgb"><legend id="6glgb"></legend></bdo>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

淺看大模型用于Text2SQL的綜述原創(chuàng)

大模型自然語言處理

發(fā)布于 2024-12-5 14:34

瀏覽

0收藏

前言

我們來看看大模型在text2sql上的一篇綜述，大模型的發(fā)展，出現(xiàn)了一系列新方法，主要集中在提示工程（prompt engineering）和微調(diào)（fine-tuning）上。這篇綜述提供了LLMs在Text-to-SQL任務(wù)中的全面概述，討論了基準(zhǔn)數(shù)據(jù)集、提示工程、微調(diào)方法和未來的研究方向。

Text2SQL

淺看大模型用于Text2SQL的綜述-AI.x社區(qū)

利用大型語言模型（LLMs）解決文本到SQL任務(wù)的方法，主要包括提示工程和微調(diào)兩大類。

1.提示工程

淺看大模型用于Text2SQL的綜述-AI.x社區(qū)

淺看大模型用于Text2SQL的綜述-AI.x社區(qū)

提示工程通過設(shè)計(jì)結(jié)構(gòu)化的提示，使LLMs能夠理解任務(wù)需求并生成相應(yīng)的SQL查詢。提示工程分為三個(gè)階段：預(yù)處理、推理和后處理。

預(yù)處理：包括問題描述和數(shù)據(jù)庫模式的格式化和布局，以及引入額外的SQL知識(shí)或外部知識(shí)。問題描述可以采用Openai模板或"Create Table"布局，樣本數(shù)據(jù)可以幫助LLM更好地理解數(shù)據(jù)庫內(nèi)容。

淺看大模型用于Text2SQL的綜述-AI.x社區(qū)

淺看大模型用于Text2SQL的綜述-AI.x社區(qū)

推理：在接收到用戶問題和數(shù)據(jù)庫模式后，生成相應(yīng)的SQL查詢。推理過程可以設(shè)計(jì)特定的工作流，如Chain-of-Thought和Least-to-Most方法，也可以使用Demonstrations來增強(qiáng)SQL生成能力。
后處理：對(duì)生成的SQL進(jìn)行優(yōu)化，提高其性能和穩(wěn)定性。常見的后處理方法包括自校正（Self-Correction）和一致性方法（Self-Consistency和Cross-Consistency）。

2.微調(diào)

淺看大模型用于Text2SQL的綜述-AI.x社區(qū)

微調(diào)通過在特定任務(wù)數(shù)據(jù)上訓(xùn)練LLMs來提升其性能。微調(diào)過程包括數(shù)據(jù)準(zhǔn)備、預(yù)訓(xùn)練模型選擇、模型微調(diào)和模型評(píng)估。

數(shù)據(jù)：可以通過整合現(xiàn)有數(shù)據(jù)集或構(gòu)建新數(shù)據(jù)集來獲取訓(xùn)練數(shù)據(jù)。新數(shù)據(jù)集可以通過半自動(dòng)或全自動(dòng)的方法生成。
預(yù)訓(xùn)練模型選擇：選擇適合的預(yù)訓(xùn)練模型進(jìn)行微調(diào)，考慮模型參數(shù)規(guī)模、預(yù)訓(xùn)練語料庫和計(jì)算能力等因素。
模型微調(diào)：采用全量微調(diào)和參數(shù)高效微調(diào)等方法。參數(shù)高效微調(diào)通過僅微調(diào)少量模型參數(shù)來提高訓(xùn)練效率。
模型評(píng)估：通過綜合指標(biāo)分析、分類分析和基于LLM的分析評(píng)估來衡量模型性能。常用的評(píng)估指標(biāo)包括精確集匹配準(zhǔn)確率（EM）、執(zhí)行準(zhǔn)確率（EX）、測(cè)試集準(zhǔn)確率（TS）和有效效率得分（VES）。

參考文獻(xiàn)

A Survey on Employing Large Language Models for Text-to-SQL Tasks，https://arxiv.org/pdf/2407.15186v3

本文轉(zhuǎn)載自公眾號(hào)大模型自然語言處理作者：余俊暉

原文鏈接：??https://mp.weixin.qq.com/s/UxDDIF63j8R2yozJ8XtDQw??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2024-12-6 09:54:51修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

大模型與數(shù)據(jù)分析：探索Text-to-SQL

pangguiyu ? 1.2w瀏覽 ? 0回復(fù)
微軟發(fā)布Florence-2：用于處理各種視覺任務(wù)的小模型

AIGC最前線 ? 5671瀏覽 ? 0回復(fù)
大語言模型知識(shí)沖突的綜述

sbf_2000 ? 6132瀏覽 ? 0回復(fù)
一篇大模型NL2SQL全棧技術(shù)最新綜述

PaperAgent ? 9375瀏覽 ? 0回復(fù)
綜述 | 大模型的可控文本生成

NLP工作站 ? 5675瀏覽 ? 0回復(fù)
NL2SQL：基于LLM的解決方案是最好的嗎？

大語言模型論文跟蹤 ? 8496瀏覽 ? 0回復(fù)
Text2SQL 新一代解決方案Tool-SQL，基于LLM和Agent智能體實(shí)現(xiàn)，效果提升顯著

AI博物院 ? 8531瀏覽 ? 0回復(fù)
淺看引入智能信息助理提升大模型處理復(fù)雜推理任務(wù)的潛力-AssisTRAG

大模型自然語言處理 ? 3460瀏覽 ? 0回復(fù)
DB-GPT-Hub:text2sql的微調(diào)框架及基準(zhǔn)測(cè)試套件

大模型自然語言處理 ? 4363瀏覽 ? 0回復(fù)
阿里巴巴研究院推出 XiYan-SQL：用于Text-to-SQL的多生成器集成人工智能框架

Halo咯咯 ? 1.1w瀏覽 ? 0回復(fù)
低資源場景下Text2SQL方法

大模型自然語言處理 ? 3286瀏覽 ? 0回復(fù)
Hugging Face 發(fā)布 SmolVLM：用于設(shè)備端推理的 2B 參數(shù)視覺語言模型

Halo咯咯 ? 5390瀏覽 ? 0回復(fù)
從大模型數(shù)據(jù)，看大模型的前瞻應(yīng)用場景在哪里？

AIGC新知 ? 2909瀏覽 ? 0回復(fù)
Google 發(fā)布了用于視頻生成的最先進(jìn)的“Veo 2”和用于圖像創(chuàng)建的“Improved Imagen 3”

Halo咯咯 ? 3463瀏覽 ? 0回復(fù)
Text2SQL 已過時(shí)？TAG 如何一統(tǒng) AI 與數(shù)據(jù)庫江湖！

AIGC前沿技術(shù)追蹤 ? 5427瀏覽 ? 0回復(fù)
小紅書 NoteLLM-2：用于推薦的多模態(tài)表征

amei2000go ? 4373瀏覽 ? 0回復(fù)
小模型借 FEATHER-SQL，在 NL2SQL 領(lǐng)域掀翻天

AIGC前沿技術(shù)追蹤 ? 3725瀏覽 ? 0回復(fù)
大語言模型增強(qiáng)的文本到 SQL 生成：綜述

AIGC前沿技術(shù)追蹤 ? 3994瀏覽 ? 0回復(fù)
用 GRPO 給 Text-to-SQL 模型裝上“推理引擎”，讓語言模型不只是生成代碼！

Halo咯咯 ? 3291瀏覽 ? 0回復(fù)

大模型自然語言處理

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

整合多模態(tài)文檔解析與DeepResearch的框架：Doc-Researcher思路 4天前發(fā)布
多模態(tài)大模型Detect Anything量化坐標(biāo)設(shè)計(jì)思路 6天前發(fā)布

熱門推薦

阿里新一代企業(yè)級(jí)多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

別再怪AI“聽不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對(duì)比，你的選擇是？ 0回復(fù)

DeepSeek 成長史：從量化投資到 AI 革命的一個(gè) “非主流” 量化大佬的 AI 夢(mèng) 0回復(fù)

上一篇：參數(shù)高效微調(diào)-Prefix Tuning、Adapter Tuning、LoRA

下一篇：文檔截圖嵌入統(tǒng)一多模態(tài)檢索方法原理

社區(qū)精華內(nèi)容

目錄

<thead id="s4851"></thead>

<u id="s4851"></u>

<tfoot id="s4851"><strike id="s4851"></strike></tfoot>

<var id="s4851"><legend id="s4851"></legend></var>