人工智能應(yīng)用就是大模型能力+場(chǎng)景,基于大模型構(gòu)建應(yīng)用,首先要了解大模型的能力圈
在關(guān)于大模型應(yīng)用方面,雖然也了解和應(yīng)用過其中的一些技術(shù);但經(jīng)過這段時(shí)間的實(shí)踐和思考發(fā)現(xiàn),對(duì)大模型應(yīng)用的認(rèn)識(shí)還很淺顯,因此在此記錄一下自己的思考。
大模型應(yīng)用的思考
大模型作為人工智能應(yīng)用的底座技術(shù),所有應(yīng)用場(chǎng)景和技術(shù)都是構(gòu)建在大模型之上;但很多時(shí)候我們都搞錯(cuò)了一件事,那就是我們沒有搞清楚大模型能力和其它技術(shù)的關(guān)聯(lián)和區(qū)別。
因此,在這里我們要搞清楚一個(gè)概念,那就是大模型能力;所謂大模型的能力,就是模型開發(fā)人員怎么把模型做的更好更強(qiáng),其中設(shè)計(jì)到模型的設(shè)計(jì),訓(xùn)練等;具體有神經(jīng)網(wǎng)絡(luò)架構(gòu),模型蒸餾等等。
當(dāng)然,我們不需要關(guān)心大模型是怎么做出來的,以及大模型為什么能做那么好或者那么差;我們僅需要知道大模型有哪些能力和功能即可。
比如爆火的deekseep的V3模型和R1模型,其中V3更多的偏向生成模型,而R1更擅長(zhǎng)的是推理。
前面說了這么多,可能很多人還沒理解其中的含義;之所以說大模型的能力,那就是說我們要明白大模型就是大模型,其它任何附屬于大模型的技術(shù)都不屬于大模型的范疇。
比如說,RAG技術(shù),function call技術(shù),MCP技術(shù),其實(shí)他們并不屬于大模型本身的功能;特別是RAG,從技術(shù)上來看完全可以說RAG和大模型沒什么關(guān)系。
而function call和MCP技術(shù)只是大模型使用外界功能,也就是調(diào)用外部接口的能力;而思維鏈才屬于大模型本身的技術(shù),讓模型具備分析和推理的能力。
但至于怎么讓大模型使用外部工具,這個(gè)就是function call和MCP需要考慮的事情。
所以說,模型就是模型,功能就是功能,工具就是工具;但往往我們很多時(shí)候都會(huì)把這些混為一談;導(dǎo)致的直接結(jié)果就是,在構(gòu)建應(yīng)用的時(shí)候分不清什么技術(shù)解決了什么問題,也不知道自己能做什么應(yīng)用。
這也是為什么很多基于大模型開發(fā)的功能平臺(tái),它的核心能力其實(shí)是平臺(tái)的設(shè)計(jì)和功能;和具體的大模型沒直接關(guān)系,市面上有了更好的模型出現(xiàn),那么直接把現(xiàn)有的模型換掉就行了,并不會(huì)影響到這些平臺(tái)本身的業(yè)務(wù)和功能。
其實(shí)從這個(gè)角度來思考,事實(shí)上這就是一種方法論,很多人不知道怎么使用人工智能解決自己工作和生活中的問題,原因就在于不懂這種方法論;導(dǎo)致自己的認(rèn)知和方向有偏差,感覺自己明明學(xué)了好多東西,但卻不知道能干啥。
大模型是核心,function call和MCP既是一種技術(shù),也是一種工具;大模型可以選擇集成function call和MCP的能力,也可以選擇不使用這些功能。
function call和MCP屬于大模型能力的一種擴(kuò)展,就類似于一種可插拔組件,其是實(shí)現(xiàn)智能體(Agent)的技術(shù)手段。而思維鏈才是屬于大模型本身的能力,大模型先具備獨(dú)立思考的能力,學(xué)會(huì)分析和拆解任務(wù),其次再使用外部工具來完成任務(wù)。
當(dāng)然,大模型實(shí)現(xiàn)function call并不需要具備網(wǎng)絡(luò)接口調(diào)用的能力,大模型只需要按照需求生成調(diào)用接口所需要的參數(shù),然后把參數(shù)傳遞給開發(fā)者寫好的代碼中即可。