你對(duì)大模型認(rèn)知的開始——大模型的能力問題 原創(chuàng)
“ 大模型的能力是對(duì)大模型自身最好的詮釋 ”
在此之前,一直不知道該怎么準(zhǔn)確表達(dá)大模型,雖然一直在學(xué)習(xí)和使用大模型,但很多時(shí)候很難一句話說明白什么是大模型,也很難說明白大模型能干什么。
但在昨天想問題的過程中,腦子里突然冒出一個(gè)詞——能力,大模型的能力。
總之一句話,大模型能做什么,不能做什么就是大模型的能力問題。
大模型的能力
在過去的2023年,被稱為千模大戰(zhàn)的時(shí)代,無數(shù)大模型如雨后春筍般冒了出來,很多大模型公司也在不斷地強(qiáng)化各自的大模型。因此,我們也經(jīng)常會(huì)聽到某某大模型很強(qiáng)大,某某大模型又打破了什么記錄。
而千模大戰(zhàn),他們打的是什么?
用一句話概括就是,打的是大模型的能力,很多企業(yè)想方設(shè)法不斷的提升大模型的能力;你家的大模型能聊天,我們家大模型就能講故事,你們家大模型能生成視頻,我們家大模型就能做邏輯推理。
你知道了什么是大模型的能力,那么你就知道了你在學(xué)習(xí)和使用過程中在做什么,在學(xué)什么。

比如,機(jī)器學(xué)習(xí),神經(jīng)網(wǎng)絡(luò),模型訓(xùn)練等等就屬于實(shí)現(xiàn)大模型能力的技術(shù);而你用大模型去做產(chǎn)品,去解決問題,這就屬于大模型的應(yīng)用技術(shù)。
知道了這些,你就知道大模型的發(fā)展也就兩個(gè)方向,一個(gè)是怎么做一個(gè)擁有強(qiáng)大能力的大模型,另一個(gè)是怎么用好大模型的強(qiáng)大能力。
這也是前面文章中不斷提到的,技術(shù)的本質(zhì)是工具,一個(gè)會(huì)制造工具,即怎么把工具做的更好,第二個(gè)是學(xué)會(huì)使用工具,即怎么把工具給用好。
怎么做好工具,就是不斷地提升工具的能力;怎么用好工具,就是不斷地開發(fā)工具的使用場景。
大模型的能力
那大模型有哪些能力?
在之前的文章中,甚至是前一篇文章中也提到過,可以把大模型當(dāng)做一個(gè)人,它能夠?qū)懳恼?,做圖片,做視頻,甚至是做一些邏輯判斷和規(guī)劃,可以說人能做的事,從理論上來說它都能做。
但,受限于目前的技術(shù)能力,大模型的能力還有很多的局限性,比如有時(shí)候會(huì)一本正經(jīng)的胡說八道;有時(shí)在邏輯判斷中會(huì)出現(xiàn)明顯的邏輯錯(cuò)誤等,而這正是大模型廠商需要解決的問題。
而目前來說,大模型的主要能力表現(xiàn)在生成方面,也就是常見的生成文字,圖片,視頻,但隨著大模型技術(shù)的發(fā)展,已經(jīng)有生成音樂,PPT等內(nèi)容的模型出現(xiàn)。這也是為什么現(xiàn)在的大模型叫做生成式大模型的原因,顧名思義。

而大模型還一個(gè)主要能力就是推理規(guī)劃,在基于思維鏈(COT)研究的過程中,大模型已經(jīng)有了簡單的推理規(guī)劃能力,并且可以通過API的方式調(diào)用一些第三方工具里完成任務(wù)。
雖然說大模型的推理規(guī)劃能力還很弱,但隨著技術(shù)的發(fā)展,其推理規(guī)劃能力將越來越強(qiáng);其生成能力也會(huì)越來越強(qiáng)。就類似于一個(gè)無所不能的人。
雖然現(xiàn)在的大模型能力已經(jīng)很強(qiáng)大,但事實(shí)上它離人類的期望還有很長的路要走,比如說它還不具備自我學(xué)習(xí)的能力,還必須依靠預(yù)訓(xùn)練的方式才能完成知識(shí)的”學(xué)習(xí)”過程。
并且,一旦完成“學(xué)習(xí)”——訓(xùn)練,它的知識(shí)也就固定在它學(xué)習(xí)完成的那一刻,無法再了解最新的知識(shí);如果想讓它知道最新的知識(shí),只有通過重新訓(xùn)練或通過掛載知識(shí)庫的方式來更新它的知識(shí)。

而邏輯推理能力更是人類對(duì)大模型寄予的厚望,因?yàn)檫@是大模型通向AGI(通用人工智能)的一種方式;人類希望大模型能夠通過自己的邏輯判斷去自主學(xué)習(xí)和解決現(xiàn)實(shí)中的問題,并能不斷強(qiáng)化自身的能力。
技術(shù)的發(fā)展是一個(gè)量變到質(zhì)變的過程,openAI發(fā)布chatGPT代表著人工智能技術(shù)上了一個(gè)全新的臺(tái)階;而目前又將進(jìn)入一個(gè)長期的平穩(wěn)發(fā)展階段,可以預(yù)見在未來的某一天;人工智能技術(shù)又將一鳴驚人。
本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires

















