偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

為什么有了大模型還需要用Embedding模型？

發(fā)布于 2024-12-27 14:05

瀏覽

0收藏

不知道大家有沒有想過這個問題？

我這兩天對這個問題還深入思考了一下，思考的初衷是來源于現(xiàn)在這么多的開源大模型，而且挺多是多模態(tài)場景，而Embedding模型相對單模且英文語料居多，如果能復(fù)用大模型的output layer，是不是會加速手頭上的實(shí)驗(yàn)進(jìn)展。

為什么有了大模型還需要用Embedding模型？-AI.x社區(qū)

但思考后覺得效果應(yīng)該是比不上原生的Embedding模型，有空再專門測試一下看看。

可能主要有以下幾點(diǎn)原因：

像LLM模型都是預(yù)測next token，那么針對next token的預(yù)測，模型肯定更加關(guān)注在這個token附近的信息，那么對應(yīng)這個Embedding也更多是這附近的局部信息。而我們需要的Embedding表征，是輸入句子的全局表征，而不是“你好嗎，我吃飯了，你可以出來了嗎？”這句話里，對其中“你可以出來了嗎”做的局部信息特征映射。
目前比較好的Embedding模型都用到了對比學(xué)習(xí)，這種學(xué)習(xí)方式能夠更精確地學(xué)習(xí)的全局Eembedding特征，如果用LLM也可以在下游接一個自監(jiān)督訓(xùn)練器，效果也會很不錯，就是成本有點(diǎn)高。最近有一篇paper也可供參考：《Improving Text Embeddings with Large Language Models》

為什么有了大模型還需要用Embedding模型？-AI.x社區(qū)

對比學(xué)習(xí)目標(biāo)是，學(xué)習(xí)一個這樣的特征提取器，在它提取的特征所構(gòu)建的 embedding 空間中，同類樣本的 embedding 互相靠近，而不同類樣本的embedding相互遠(yuǎn)離。通常，同類樣本對互稱為正樣本（positive sample），不同類樣本對互稱為負(fù)樣本（negative sample）。

本文轉(zhuǎn)載自 ??沐白AI筆記??，作者：楊沐白

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

從AIGC到AGI，為什么我們需要更多的“技術(shù)信仰派”？

51CTO技術(shù)棧 ? 5047瀏覽 ? 0回復(fù)
什么是AI網(wǎng)關(guān)？你還需要一個嗎？

51CTO技術(shù)棧 ? 5070瀏覽 ? 2回復(fù)
什么是超參數(shù)？大模型的超參數(shù)是做什么用的？超參數(shù)和大模型參數(shù)有什么關(guān)系？

AI探索時代 ? 8688瀏覽 ? 0回復(fù)
大模型所謂的參數(shù)是什么？大模型為什么需要訓(xùn)練？大模型訓(xùn)練到底干了什么？

AI探索時代 ? 8883瀏覽 ? 0回復(fù)
你知道什么是微調(diào)嗎？大模型為什么要微調(diào)？以及大模型微調(diào)的原理是什么？

AI探索時代 ? 8912瀏覽 ? 0回復(fù)
大模型愛好者的福音，有了它個人電腦也可以運(yùn)行大模型了

AI探索時代 ? 4982瀏覽 ? 0回復(fù)
什么是提示詞工程(prompt engineering)？為什么需要提示詞工程？

AI探索時代 ? 9142瀏覽 ? 0回復(fù)
什么是多模態(tài)大模型？為什么需要多模態(tài)大模型？

AI探索時代 ? 6894瀏覽 ? 0回復(fù)
什么是端到端(end to end)大模型，它和傳統(tǒng)的大模型有什么區(qū)別？其優(yōu)勢與劣勢是什么？

AI探索時代 ? 6046瀏覽 ? 0回復(fù)
什么是具身智能模型，它和普通大模型有什么區(qū)別？

AI探索時代 ? 5374瀏覽 ? 0回復(fù)
有了大模型的應(yīng)用經(jīng)驗(yàn)之后，再談對大模型的理解

AI探索時代 ? 2665瀏覽 ? 0回復(fù)
為什么預(yù)訓(xùn)練大模型要使用無監(jiān)督學(xué)習(xí)的方式？

AI探索時代 ? 4187瀏覽 ? 0回復(fù)
深入理解預(yù)訓(xùn)練與微調(diào)，為什么需要預(yù)訓(xùn)練，什么是微調(diào)？

AI探索時代 ? 5778瀏覽 ? 0回復(fù)
為什么Transformer要用LayerNorm？

智駐未來 ? 9556瀏覽 ? 0回復(fù)
你為什么要用GraphGAG？

熵減AI ? 3083瀏覽 ? 0回復(fù)
為什么 RAG 一定需要 Rerank？

玄姐聊AGI ? 3686瀏覽 ? 0回復(fù)
為什么大模型在 OCR 任務(wù)上表現(xiàn)不佳？

Baihai_IDP ? 2629瀏覽 ? 0回復(fù)
一文讀懂為什么要用PyTorch

碼農(nóng)隨心筆記 ? 1523瀏覽 ? 0回復(fù)
機(jī)器學(xué)習(xí) | 大模型為什么會出現(xiàn)"幻覺"？

周末程序猿 ? 1570瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

一文簡單理解KNN最近鄰算法 2025-07-21 07:11:30發(fā)布
一文講透深入理解邏輯回歸 2025-06-17 06:35:55發(fā)布

熱門推薦

別再怪AI“聽不懂人話”了，90%的返工和錯誤，都錯在你下達(dá)指令的第一句話 0回復(fù)

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測中展現(xiàn)出驚人效率，僅用15秒便將百頁P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對比，你的選擇是？ 0回復(fù)

上一篇：深度學(xué)習(xí)的Batchsize必須是2的n次方嗎？

下一篇：一文講清楚視覺大模型！CLIP模型論文解讀

社區(qū)精華內(nèi)容

目錄

<u id="ez1zp"></u><abbr id="ez1zp"></abbr>

<p id="ez1zp"><label id="ez1zp"></label></p>