AI實戰(zhàn)派:解密DeepSeek企業(yè)級項目!AI不是炫技,而是回歸需求的必然答案 原創(chuàng)
嘉賓 | 陳亮、張云波
主持人 | 薛彥澤
撰稿 | 李美涵
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
在AI創(chuàng)業(yè)的浪潮里,最迷人的地方莫過于人人都知道這里是風(fēng)口,卻仍然能夠各自找到屬于自己的機會點。
在眾多試圖乘上AI風(fēng)口的創(chuàng)業(yè)者中,亨寶科技的CEO張云波和AI創(chuàng)智坊的主理人陳亮無疑是特別的存在。
張云波早年投身于鴻蒙生態(tài),今年年初就敏銳捕捉到DeepSeek大模型興起的契機,迅速將注意力投向AI領(lǐng)域的應(yīng)用開發(fā)。
他認為:“模型的強大,已經(jīng)顯著降低了開發(fā)的難度,因此開發(fā)本身不再是主要的挑戰(zhàn),重點是結(jié)合對特定行業(yè)的深入理解,才能開發(fā)出真正有競爭力的產(chǎn)品。”他所帶領(lǐng)的團隊,落地了一系列企業(yè)智能應(yīng)用,通過可以克隆聲音的數(shù)字人,探索了個人IP打造、數(shù)字人虛擬交互等前沿領(lǐng)域。
而陳亮則是一位因為AI大膽轉(zhuǎn)行的“跨界者”,從互聯(lián)網(wǎng)產(chǎn)品經(jīng)理轉(zhuǎn)型扎根于傳統(tǒng)制造業(yè),憑借對AI技術(shù)的敏銳嗅覺迅速完成身份轉(zhuǎn)變。圍繞AI在制造業(yè)的落地應(yīng)用,他協(xié)助許多制造業(yè)中小企業(yè)實現(xiàn)AI商業(yè)化落地,清晰梳理出DeepSeek能夠服務(wù)的業(yè)務(wù)場景與實際需求。
他指出:“AI圈的很多開發(fā)者都習(xí)慣‘炫技’,用非常復(fù)雜的智能體探索AI極限;然而,在商業(yè)落地中,往往是簡單的、短鏈路的智能體更合適、更可控?!睂π袠I(yè)需求與技術(shù)邊界的深刻洞察,讓陳亮的AI探索始終貼近企業(yè)的實際需求,他分享的智能聲控?zé)?、醫(yī)療模型案例能給人帶來很多現(xiàn)實的啟迪。
兩人因一次線下會議而相識,共同撰寫了《DeepSeek企業(yè)級AI應(yīng)用實踐》一書,試圖通過更深入、更務(wù)實的方式,讓AI真正落地到千行百業(yè)。
在4月23日51CTO獨家技術(shù)訪談欄目《AI創(chuàng)客說》中,我們邀請到張云波和陳亮兩位嘉賓,從模型部署、AI智能體的落地挑戰(zhàn),到AI產(chǎn)品設(shè)計與實際場景匹配,深度探討AI時代下技術(shù)落地的實踐與方法論。
以下是訪談的具體內(nèi)容整理,供各位朋友參考和閱讀。
1.智能體構(gòu)建有哪些誤區(qū)?
陳亮: 今天我們在聊一些偏商業(yè)化落地的一些話題,那我就重點說說這個領(lǐng)域的誤區(qū):
首先,AI圈的很多開發(fā)者都習(xí)慣“炫技”,用非常復(fù)雜的智能體探索AI極限;然而,在商業(yè)落地中,往往是簡單的、短鏈路的智能體更合適、更可控。一旦智能體采用了復(fù)雜的模型拼接和長鏈路,出錯的風(fēng)險就會不斷增加、成本失控,最終效果不佳。
其次,企業(yè)在應(yīng)用智能體時,不能“拿著錘子找釘子”,應(yīng)該先明確自身商業(yè)問題和需求。例如,對于一些中小企業(yè),如果對自身商業(yè)模式的理解不夠清晰,或者業(yè)務(wù)場景不適合智能體的應(yīng)用,導(dǎo)致智能體構(gòu)建的非常雞肋,其使用頻率自然提不上去。
最后,智能體構(gòu)建要有一個清晰的認知,第一點是要了解各個模型的上下限,第二點是要了解各個平臺智能體搭建的流程和效果。如果企業(yè)對自身數(shù)據(jù)化理解不足,知識庫內(nèi)容未經(jīng)清洗和質(zhì)量保證,那么智能體的輸出結(jié)果也難以達到預(yù)期。此外,本地化部署并不適合所有企業(yè),尤其是中小企業(yè)。公開平臺的智能體服務(wù)已經(jīng)能夠滿足大部分需求,企業(yè)應(yīng)根據(jù)自身實際情況選擇合適的方案。
張云波:陳亮老師剛剛聊到的觀點我也很認可。由于智能體目前仍存在較高的錯誤率,企業(yè)在嘗試將智能體引入業(yè)務(wù)流程時,應(yīng)該謹慎選擇強交付場景和核心業(yè)務(wù)場景,更推薦從邊緣業(yè)務(wù)入手。舉個例子,我們之前做一個項目,是語音控制的智能燈具,可以通過自然語言交互。當用戶說“太暗了”,模型可能不是每次都能理解意圖是要將燈調(diào)亮,有時反而會關(guān)掉燈——如果這是應(yīng)用在手術(shù)室的,那么一點錯誤都是不可接受的。
其次,DeepSeek爆火后有些媒體浮夸的吹捧,非常影響中小企業(yè)的判斷,使他們認為智能體無所不能,夸大了其對業(yè)務(wù)上的助力。但實際上,智能體在承載能力和穩(wěn)定性方面還存在明顯不足,可能承載百人的體量就會出現(xiàn)崩潰,沒有到達可依賴的程度。
但是我認為它是可以做一些初步的工作,比如為產(chǎn)品經(jīng)理跑個demo;做些創(chuàng)意設(shè)計、UI 設(shè)計的草稿,智能體是可以勝任部分任務(wù)的。
2.DeepSeek也能編輯圖像?多模態(tài)推理還有多遠?
陳亮: DeepSeek 多模態(tài)能力比較局限,因為它最開始設(shè)計時,就是基于多個專家模型加上一個小的微調(diào)模型,可能更聚焦在數(shù)學(xué)和代碼方向。
隨著技術(shù)發(fā)展,其他模型已經(jīng)逐漸跟上并超越了它,比如GPT-4o ,它才是真正意義上的多模態(tài)大模型,無論是圖像生成、語音對話,還是對文字和視頻的理解,都做得非常出色。這其實也給其他模型帶來了很大壓力,未來多模態(tài)肯定是大模型的必經(jīng)之路,所有模型都無法繞過這個方向。
目前來說, DeepSeek 的圖像功能還是簡單的一個 OCR技術(shù),只能對圖片中的文字進行識別,然后用大模型進行分析,這種應(yīng)用相對有限。在生圖方面,只能作為一個 Prompt 生成工具,輔助其他制圖工具使用。所以從多模態(tài)角度來看,DeepSeek 確實比較弱。
張云波: 其實 DeepSeek目前也有圖像功能,但多模態(tài)功能還不夠成熟,和其他的AI工具相比有一定差距。不過,AI 領(lǐng)域發(fā)展速度非???,產(chǎn)品幾乎每個月都在更新迭代,競爭非常激烈。作為技術(shù)人員或用戶,其實沒必要死盯著某一個模塊,而是應(yīng)該靈活選擇當前最先進的工具來滿足需求。比如最近很火的 GPT-4o 吉普利風(fēng)格的圖像生成工具,它就能快速生成高質(zhì)量的電商帶貨圖片。
我覺得多模態(tài)推理在未來肯定會和其他先進工具結(jié)合得更好。雖然 DeepSeek 的第一個版本還比較粗糙,但我相信它很快會推出更強大的多模態(tài)功能,至少不會比 GPT 差。
3.用DeepSeek進行產(chǎn)品設(shè)計,如何滿足用戶需求?
陳亮: 回歸到產(chǎn)品本身來說,AI產(chǎn)品在開發(fā)流程上與傳統(tǒng)應(yīng)用并無太大區(qū)別,關(guān)鍵在于如何發(fā)揮AI的能力,挖掘更具創(chuàng)意的產(chǎn)品方向。更重要的一點,我認為是AI產(chǎn)品更注重垂類性,即在一個小方向上做到極致,形成內(nèi)容壁壘。未來可能會出現(xiàn)很多小而美的錘煉型公司,團隊規(guī)模雖小,但能服務(wù)大量用戶。
我關(guān)注到杭州的一家AI公司,最開始是做AI植物識別的應(yīng)用。從現(xiàn)在來看,實現(xiàn)這樣一個功能,從技術(shù)角度看并不太難,但核心在于大量植物數(shù)據(jù)的積累,可能成為他們的核心競爭力。
在未來選擇AI創(chuàng)業(yè)的方向上,很多開發(fā)者需要對自己有重新的認識,更多地去做帶有創(chuàng)意性的東西,為用戶帶來情感和功能上的價值,無論是軟件還是硬件都是如此。我覺得也不該局限于是否是所謂的“套殼”應(yīng)用,用戶關(guān)注的是產(chǎn)品是否真正解決了需求,而非形式。大模型是實現(xiàn)功能的底座,開發(fā)者應(yīng)將關(guān)注點放得更長遠。
張云波: 剛才陳亮老師講的,更多地是把AI當做工具,實現(xiàn)自動化的一些功能,確實與傳統(tǒng)的設(shè)計區(qū)別不大,但現(xiàn)在用大模型去解決問題就非常高效,甚至連代碼都不用寫。比如我剛才提到的公廁中的智能聲控?zé)簦F(xiàn)在我把燈接一個 wifi 模塊接到這個華為云或者小米云之類的物聯(lián)網(wǎng)平臺上,再給大模型發(fā)個指令,就完成了產(chǎn)品的搭建,幾乎是0成本的。
再比如數(shù)字人的應(yīng)用,這就是挖掘了電商行業(yè)長期的痛點,極大地降低了雇傭主播的成本?,F(xiàn)在通過大模型,用戶可以輕松克隆自己的聲音和口型,并且相似度越來越高。這種技術(shù)可以應(yīng)用于短視頻工具或直播領(lǐng)域,幫助用戶快速生成個性化內(nèi)容,甚至形成新的商業(yè)模式。
4.聊一聊常用的DeepSeek集成開發(fā)工具
陳亮: 首先談?wù)劜渴鸸ぞ甙?,從我的觀察出發(fā),企業(yè)應(yīng)該明確自身的需求和場景,而不是盲目追求本地化部署或技術(shù)上的微調(diào)。我覺得對大部分的中小公司是本地化部署必要的。更多的是在工具選擇時,去看有沒有一些成熟的平臺可以幫助我們搭建AI能力,從而真正賦能自己的業(yè)務(wù)場景。
目前API已經(jīng)成為了一個主流的選擇,甚至是像字節(jié)扣子這種,平臺級的智能體,本身就集成了多家主流大模型,直接融合好了給用戶使用。
如果一定要進行本地化部署,推薦使用Ollama 來去結(jié)合本地化的模型,再配合一些開源的工具。
本地化部署的需求主要集中在兩類企業(yè):一類是擁有敏感數(shù)據(jù)的公司,它們通常已經(jīng)具備強大的技術(shù)壁壘,會自行搭建專業(yè)團隊來完成本地化部署;另一類是像醫(yī)藥行業(yè)這樣擁有龐大知識庫的企業(yè),它們需要基于自身封閉且高效的知識體系進行研發(fā),因此可能會考慮本地化部署。但對于一般企業(yè)來說,如果沒有明確的需求和收益預(yù)期,本地化部署往往是不必要的。
在微調(diào)模型方面,企業(yè)需要考慮是否有足夠全面且獨特的數(shù)據(jù)集作為核心壁壘。如果企業(yè)只是擁有少量數(shù)據(jù),那么使用知識庫或向量庫可能就足夠了,無需進行復(fù)雜的微調(diào)。此外,政府機構(gòu)等對數(shù)據(jù)安全要求極高的機構(gòu),可能會因數(shù)據(jù)敏感性而選擇本地化部署,但這也需要謹慎評估成本與收益。
張云波:其實工具很多,如果專門聊智能體開發(fā),可能常用的就那么幾個:國內(nèi)的扣子、Dify、FastGPT,國外也有幾個類似產(chǎn)品,功能大同小異。如果企業(yè)需要在線服務(wù),扣子是一個不錯的選擇,但其缺點是無法進行本地化部署。對于需要本地化部署的企業(yè)來說,像 Dify 這樣的開源平臺可能更適合,雖然其插件不如扣子豐富,但完全可以滿足企業(yè)的基本需求。如果企業(yè)有更進一步的定制需求,可能需要與開源方合作開發(fā),這是他們做開源的盈利方式。
我再補充一下,大家可以發(fā)現(xiàn)這些工具正在被大模型逐步地替代。例如,在Sora出現(xiàn)之前,大家可能會使用像ComfyUI這樣的設(shè)計工具,但這些工具本身較為復(fù)雜,對用戶不夠友好。這種趨勢同樣出現(xiàn)在編程領(lǐng)域。我認為模型的強大,已經(jīng)顯著降低了開發(fā)的難度,因此開發(fā)本身不再是主要的挑戰(zhàn),重點是結(jié)合對特定行業(yè)的深入理解,才能開發(fā)出真正有競爭力的產(chǎn)品。
5.企業(yè)部署AI模型環(huán)境有哪些注意點?
張云波: 簡單項目可以用Ollama,復(fù)雜項目可以用VLM,這類工具各有優(yōu)勢,比如n8靈活性強,而國內(nèi)常用的Dify 、FastGPT等開源工具也足夠應(yīng)對常見功能需求。DeepSeek在本地化集成、知識庫和工作流等方面都有支持,這些并不是最難的部分。
在我看來,最難的部分其實是對業(yè)務(wù)的深刻理解,以及如何讓技術(shù)真正助力業(yè)務(wù)。很多情況下,我遇到很多類似的情況,與客戶溝通花得時間非常長,客戶甚至都不知道自己究竟要用DeepSeek做什么。這就需要我們通過案例、知識和想象力去幫助他們梳理業(yè)務(wù)流程,明確需求。
另外一個難點其實是數(shù)據(jù)。例如醫(yī)療大模型,有些醫(yī)院聲稱使用AI技術(shù)能以95%的準確率識別X光片,但實際效果可能并不理想。其中很大的問題出在數(shù)據(jù)上,一個數(shù)據(jù)集里可能包含1000條Q&A,很多可能是無效數(shù)據(jù),而經(jīng)常有些外包公司會忽略數(shù)據(jù)清洗這方面的工作,最后得到的結(jié)果一定很差。在開發(fā)過程中,不僅要關(guān)注技術(shù)實現(xiàn),更要確保技術(shù)與業(yè)務(wù)需求的緊密結(jié)合,避免出現(xiàn)“為部署而部署”的情況。
陳亮:如果企業(yè)決定進行本地化部署,我認為有幾個關(guān)鍵問題需要重點關(guān)注。首先,實際應(yīng)用場景的吞吐量是核心考量之一,直接關(guān)系到算力的采購和模型選型,同時還要考慮現(xiàn)有數(shù)據(jù)庫的質(zhì)量,以及數(shù)據(jù)安全和合規(guī)性。這些因素都會直接影響本地化部署的落地效果。例如,算力成本很高,如果企業(yè)沒有準確評估吞吐量,可能會采購過多算力,造成浪費。
其次,數(shù)據(jù)安全是本地化部署中必須解決的問題。企業(yè)需要確保敏感數(shù)據(jù)的隔離,防止用戶通過prompt等方式獲取核心數(shù)據(jù)。這包括設(shè)置不同部門的數(shù)據(jù)分割、權(quán)限訪問控制以及加密傳輸?shù)却胧4送?,?shù)據(jù)的持續(xù)迭代和版本管理也值得關(guān)注。隨著新數(shù)據(jù)的產(chǎn)生,企業(yè)需要不斷微調(diào)模型以提高效率,同時還要建立有效的回滾機制,以應(yīng)對訓(xùn)練失敗或出現(xiàn)問題的情況。這些其實都是真正在部署過程中很細節(jié)的問題,但都非常重要。
6.大模型應(yīng)用開發(fā)目前有哪些挑戰(zhàn)?
陳亮: 我提一個比較特別但是必不可缺的一點,現(xiàn)在真正精通 AI和垂直領(lǐng)域知識的符合型人才非常少見,對于推動行業(yè)發(fā)展至關(guān)重要。隨著AI技術(shù)的廣泛應(yīng)用,跨行業(yè)知識成為必備技能。我們需要對自己用AI深耕什么方向有明確的認識。
我自己就是從互聯(lián)網(wǎng)轉(zhuǎn)到的制造業(yè),我發(fā)現(xiàn)有兩個問題需要克服:首先是不同行業(yè)從業(yè)者認知的差異,其次是工作模式會有不同?;ヂ?lián)網(wǎng)行業(yè)信息相對透明、信息壁壘較低,但傳統(tǒng)行業(yè)如制造業(yè)的信息差很大,企業(yè)之間可能合作多年也無法深入了解對方的核心需求。因此,開發(fā)者需要花費更多時間和精力去調(diào)研和理解這些行業(yè),才能更好地將AI技術(shù)與實際需求相結(jié)合。
7.AI創(chuàng)新項目如何獲取靈感?
張云波:我的經(jīng)驗是盡可能多跟業(yè)內(nèi)專業(yè)人士接觸,積極參加相關(guān)會議,甚至是跨行業(yè)的活動。相比在網(wǎng)上搜索,線下的面對面交流往往更有效。網(wǎng)上的案例可能比較淺顯,甚至有些真實性存疑,比如抖音上那些看似輕松賺錢的案例,我對其真實性就深感懷疑。我和陳老師就是線下參會認識的,和人交流不僅能接觸到前沿的技術(shù)和工具,還能了解到不同行業(yè)對AI的真實需求和應(yīng)用場景。
最近我參加了上海和北京的一些行業(yè)會議,甚至去微軟在上海的智能體平臺中心參觀學(xué)習(xí)。我發(fā)現(xiàn)每家公司都有獨特的工具和技術(shù),有他們自己的奇思妙想,但它們的核心都是圍繞需求展開的。
陳亮: 我會發(fā)現(xiàn)很多的需求和靈感來自于對AI工具能力的深刻認知以及與具體場景需求的巧妙結(jié)合。這個需求就是行業(yè)人員交流他們的具體痛點,你去考慮怎樣用現(xiàn)有技術(shù)去解決。
前面一段時間很火的小貓補光燈就是一個很好的案例,他的技術(shù)實現(xiàn)并不復(fù)雜,甚至他上手的時候可能沒有代碼能力。但因為挖掘到了女生拍照的補光需求,這個APP當時在榜單上的成績很好。
雖然未來AI的應(yīng)用場景會越來越多,但是開發(fā)者必須得是一個好學(xué)者,讓AI成為提升個人能力的工具,比如通過與AI的對話和學(xué)習(xí),它可以將你的能力從level 2提升到level 4,甚至更高,這是一個正向循環(huán)。但同時也需要警惕,如果過度依賴AI,不再自己思考,可能會陷入被動,就像現(xiàn)在很多人沉迷于抖音的推薦算法一樣,我覺得那是很可怕的事情。
我還是希望大家在 AI 時代里盡量多多學(xué)習(xí),然后能在自己感興趣的領(lǐng)域扎深一些,走出自己的路。
本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:李美涵
