偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

我們需要學(xué)會(huì)對(duì)大模型祛魅,大模型沒(méi)有大家想象中的那么復(fù)雜 原創(chuàng)

發(fā)布于 2025-5-13 06:43
瀏覽
0收藏

“ 大模型雖然看起來(lái)很復(fù)雜,但我們只要具備工具思想,那么就可以輕松地玩轉(zhuǎn)大模型。”

在對(duì)大模型的了解和應(yīng)用過(guò)程中發(fā)現(xiàn)一個(gè)問(wèn)題,就是很多人對(duì)大模型抱著神秘和高大上的想法;認(rèn)為搞大模型的都是技術(shù)大拿或者高學(xué)歷的精英人才,甚至有些人會(huì)認(rèn)為大模型無(wú)所不能。

但事實(shí)上,大模型沒(méi)有大家想象中的那么神秘和復(fù)雜;大模型也有自己的能力邊界,它也無(wú)法做到超出它能力范圍的事;而且現(xiàn)在大模型也存在各種各樣的問(wèn)題,否則大模型技術(shù)就不再需要發(fā)展了。

大模型祛魅

首先從純粹的技術(shù)理論來(lái)講,大模型本身就是一個(gè)模仿人腦神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型;通過(guò)統(tǒng)計(jì)和概率學(xué)的方法來(lái)模仿人腦的學(xué)習(xí)過(guò)程,雖然其中提出了各種各樣的模型架構(gòu),但本質(zhì)上來(lái)說(shuō)都是數(shù)學(xué)問(wèn)題。

只不過(guò)其主要是基于向量和多維矩陣這個(gè)數(shù)學(xué)工具來(lái)進(jìn)行相似度計(jì)算,通過(guò)這種方式來(lái)表示數(shù)據(jù)之間的關(guān)系;以此來(lái)完成語(yǔ)義,圖片理解和生成。

從大模型的運(yùn)行過(guò)程上來(lái)說(shuō),大模型主要有理解和生成兩個(gè)步驟;對(duì)應(yīng)用人員來(lái)說(shuō),大模型就是一個(gè)黑箱,有一個(gè)輸入口和一個(gè)輸出口;大模型接受用戶的輸入并理解用戶意圖,這個(gè)過(guò)程就是理解過(guò)程;而大模型在理解用戶意圖之后,通過(guò)模型參數(shù)來(lái)生成用戶所需要的東西,這個(gè)過(guò)程就是生成過(guò)程。

我們需要學(xué)會(huì)對(duì)大模型祛魅,大模型沒(méi)有大家想象中的那么復(fù)雜-AI.x社區(qū)

雖然根據(jù)不同的任務(wù)場(chǎng)景,有多種執(zhí)行不同任務(wù)的模型類型;但本質(zhì)上來(lái)說(shuō)都是輸入理解和結(jié)果生成的過(guò)程;其中包括推理類模型,只不過(guò)推理類模型會(huì)存在一個(gè)“思考”的過(guò)程。

不同任務(wù)的大模型因?yàn)楦鶕?jù)不同的任務(wù)類型會(huì)設(shè)計(jì)不同的技術(shù)架構(gòu),其目的就是為了更好的處理任務(wù)數(shù)據(jù);而除了模型架構(gòu)的區(qū)別之外,還一個(gè)就是訓(xùn)練數(shù)據(jù)的區(qū)別;不同任務(wù)的模型,需要使用特定形式或格式的訓(xùn)練數(shù)據(jù)。

比如說(shuō)分類模型需要使用不同分類的數(shù)據(jù)進(jìn)行訓(xùn)練;聊天模型需要使用對(duì)話數(shù)據(jù)進(jìn)行訓(xùn)練等;而不同的任務(wù)類型,需要使用特定任務(wù)或領(lǐng)域的數(shù)據(jù)進(jìn)行訓(xùn)練。

至于模型實(shí)現(xiàn)過(guò)程中需要使用的損失計(jì)算,優(yōu)化函數(shù),反向傳播,反饋學(xué)習(xí),強(qiáng)化學(xué)習(xí)等技術(shù);基本上都屬于模型通用的技術(shù)流程,只不過(guò)由于任務(wù)的特性可能會(huì)進(jìn)行適當(dāng)?shù)恼{(diào)整和使用不同的算法來(lái)實(shí)現(xiàn)。

而從技術(shù)開(kāi)發(fā)者的角度來(lái)說(shuō),使用大模型的能力,基本上就是調(diào)用幾個(gè)接口就行了;應(yīng)該說(shuō),大模型本身也就一到兩個(gè)接口,只不過(guò)根據(jù)不同的需求,設(shè)計(jì)不同的提示詞或角色扮演等來(lái)約束大模型的輸出。

而那些大模型服務(wù)提供商或者一些平臺(tái),它們雖然看似提供了很多功能接口;但這些接口基本上都是它們自己封裝的業(yè)務(wù)接口,然后背后依然是調(diào)用大模型的一個(gè)或兩個(gè)接口,和大模型沒(méi)太大關(guān)系。

所以,如果你不是搞模型開(kāi)發(fā),需要很強(qiáng)的數(shù)學(xué)和編程功底之外;從應(yīng)用的角度來(lái)說(shuō),大模型使用起來(lái)很簡(jiǎn)單,你給一個(gè)輸入,大模型給一個(gè)輸出。而本質(zhì)上就是提示詞的編寫(xiě),也就是說(shuō)在大模型應(yīng)用中,提示詞才是其中的核心部分。

  • 文本生成類(Text Generation)
  • 文本理解類(Text Understanding)
  • 多模態(tài)任務(wù)類(Multimodal Tasks)
  • 決策與推理類(Decision Making & Reasoning)
  • 序列轉(zhuǎn)換類(Sequence Transformation)
  • Embedding模型類
  • 強(qiáng)化學(xué)習(xí)對(duì)齊類(RL-Aligned)

只不過(guò),把大模型應(yīng)用到具體的產(chǎn)品或系統(tǒng)開(kāi)發(fā)中,會(huì)延伸出一系列的問(wèn)題;比如說(shuō)模型記憶問(wèn)題,文檔的處理問(wèn)題,格式化輸出問(wèn)題,提示詞的優(yōu)化問(wèn)題;以及怎么挖掘大模型的潛力,讓大模型在業(yè)務(wù)中表現(xiàn)得更好,這就需要結(jié)合大量的工程化能力來(lái)解決。

比如說(shuō)通過(guò)更好的提示詞來(lái)激發(fā)大模型的潛力,使用RAG技術(shù)來(lái)增強(qiáng)大模型的知識(shí),使用訓(xùn)練微調(diào)等技術(shù)來(lái)提升大模型的能力,使用Agent技術(shù)來(lái)充當(dāng)大模型的手和腳,使用工作流來(lái)串聯(lián)功能模塊等等。


本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires

原文鏈接:??https://mp.weixin.qq.com/s/JMUSX9KWldvyFUf_Tczxhw??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
已于2025-5-13 06:43:32修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦