DeepSeekR1的發(fā)布讓整個AI界重新思考成本與性能的關(guān)系。用相對較低的成本訓(xùn)練出媲美GPT4的模型,這種可能性正在變?yōu)楝F(xiàn)實(shí)。而現(xiàn)在,中國AI公司MiniMax又悄然交出了另一份答卷。這家因海螺(Hailuo)AI視頻而聲名鵲起的公司,剛剛發(fā)布了他們的最新大型語言模型MiniMaxM1。M1完全采用Apache2.0許可證開源,任何企業(yè)和開發(fā)者都可以免費(fèi)使用。更有趣的是訓(xùn)練成本:僅用53.47萬美元就完成了完整的強(qiáng)化學(xué)習(xí)訓(xùn)練。MiniMaxM1的成本控制能...
2天前 309瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
"我覺得未來十年,是一個只要你有能力去動手做、去實(shí)現(xiàn)想法,這種能力就會被極大放大的時代。"——MichaelTruell,CursorCEO最近Cursor的CEOMichaelTruell接受YCombinator的一段長訪談,Cursor站在AI編程的最前沿,通過這次訪談帶領(lǐng)我們更好的看清楚AI編程的視角。我們正在經(jīng)歷編程史上最重要的范式轉(zhuǎn)換——從手工編寫代碼的"人工編譯器"時代,躍遷到專注創(chuàng)意和邏輯的"設(shè)計師"時代。如果有一天你只需要描述你想要什么,電腦就能...
2天前 480瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
在自然語言處理(NLP)領(lǐng)域,我們面臨的第一個挑戰(zhàn)就是如何讓計算機(jī)理解人類的語言。計算機(jī)不認(rèn)識漢字或字母,它們只懂?dāng)?shù)字。因此,我們需要一種方法,將詞語轉(zhuǎn)換成計算機(jī)可以處理的數(shù)字形式。1.什么是詞向量?我們不能直接把"蘋果"這兩個字輸入到機(jī)器學(xué)習(xí)模型中。模型無法進(jìn)行任何計算。我們需要先把它變成一組數(shù)字。早期的方法早期自然語言處理方法,如獨(dú)熱編碼和詞袋模型,雖然對某些機(jī)器學(xué)習(xí)任務(wù)有用,但并不能捕捉到詞的意...
2025-06-18 06:44:36 970瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
介紹了Anthropic的元提示詞工具,展示了如何編寫清晰、具體、結(jié)構(gòu)化的提示詞。深入講解了提示詞工程的重要性,并總結(jié)了寫作提示詞的三個核心原理與技巧,讓用戶能像指導(dǎo)新員工一樣高效地引導(dǎo)AI,獲得穩(wěn)定準(zhǔn)確的輸出結(jié)果。1.提示詞工程基礎(chǔ):Anthropic元提示詞的核心理念什么是提示詞工程Anthropic元提示詞第1行的核心思想2.Anthropic元提示詞教你的三個寫作原理原理1:讓AI分步驟思考不要一次性處理復(fù)雜任務(wù)原理2:用完整示例教會...
2025-06-05 07:51:10 3529瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
本文介紹了在增強(qiáng)檢索生成(RAG)流程中,文本分塊的重要性和實(shí)現(xiàn)方式。詳細(xì)解釋了為什么要對文本進(jìn)行切分及代碼示例,展示了分塊后的效果。通過合理分塊,可以有效應(yīng)對模型的輸入限制,提升檢索與生成的質(zhì)量,是構(gòu)建高效LLM應(yīng)用的關(guān)鍵步驟之一。1.文檔分塊的原因2.文檔分塊的基本思路2.1基于長度的分塊類型2.2代碼實(shí)現(xiàn)2.2拆分結(jié)果3.圖形化顯示分塊總結(jié)在快速發(fā)展的自然語言處理(NLP)領(lǐng)域,增強(qiáng)檢索生成(RAG)已成為提高AI生...
2025-05-23 06:34:34 1345瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
隨著GenAI技術(shù)的突飛猛進(jìn),LLM的"幻覺"問題已成為業(yè)界關(guān)注焦點(diǎn)。最近,由Vectara發(fā)布了一份《幻覺排行榜》,對主流模型的幻覺表現(xiàn)進(jìn)行了系統(tǒng)對比。量化展示了不同LLM的幻覺率差異采用Vectara自研的HHEM2.1評估模型為選型提供一個參考本排行榜使用Vectara的商業(yè)幻覺評估模型HHEM2.1,來計算LLM排名(更新于2025年4月29日)排行榜地址:??https:github.comvectarahallucinationleaderboardtabreadmeovfile????https:hugging...
2025-05-09 01:12:22 2921瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
在RAG系統(tǒng)中,僅靠向量相似度檢索容易造成信息重復(fù)或片面。為提升回答的多樣性與覆蓋度,引入MMR(MaximumMarginalRelevance)算法能有效在“相關(guān)性”與“多樣性”之間取得平衡,從而挑選出既相關(guān)又不重復(fù)的信息,提升系統(tǒng)輸出的質(zhì)量與實(shí)用性。1.MMR是什么,它能解決什么問題?2.MMR的基本思想3.MMR的原理和公式解析3.1算法流程3.2舉個例子:摘要任務(wù)中的MMR4.MMR的應(yīng)用場景4.1.信息檢索(比如搜索引擎的結(jié)果排序)4.2.問答系統(tǒng)...
2025-04-24 07:18:48 1327瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
在RAG的核心步驟中,有一個至關(guān)重要的步驟:“文本分塊(TextSplitting)”。它的主要作用就是把一大段文本切分成更小、更合理的片段,這樣模型才能更好地理解、處理或者存儲這些內(nèi)容。如果一整篇文章不拆開,那embedding的顆粒度太粗,問答的時候很容易不準(zhǔn)。所以切得好不好,直接影響最后答案的相關(guān)性和準(zhǔn)確性。最基本的分塊方法是根據(jù)文檔的長度進(jìn)行拆分。這種簡單而有效的方法確保每個塊不會超過指定的大小限制?;陂L度拆...
2025-04-14 00:49:05 1354瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
RAG(檢索增強(qiáng)生成)是一種很厲害的技術(shù),能幫助企業(yè)開發(fā)更智能的AI應(yīng)用。這類AI不僅能結(jié)合實(shí)時數(shù)據(jù),還能利用企業(yè)自己的數(shù)據(jù),生成更自然、更有互動感的對話。RAG的核心思路是讓AI在回答問題時,不是光靠自己“想”,而是先去查找外部的、可靠的專業(yè)知識,把這些信息當(dāng)作參考,讓回答更準(zhǔn)確、更有依據(jù)。但問題在于,AI找到的資料是否靠譜,直接決定了它給出的答案是否可信。所以,優(yōu)化RAG的搜索過程非常重要,能有效提升AI生成...
2025-04-01 00:54:06 2016瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
本文整理了MCP的基本協(xié)議規(guī)范,包括協(xié)議架構(gòu)、協(xié)議基本消息類型、協(xié)議生命周期管理、協(xié)議的傳輸層1.協(xié)議之架構(gòu)1.1基本組件1.2基本消息類型1.3能力協(xié)商2.協(xié)議規(guī)范之基本消息類型2.1Requests(消息請求)2.2Responses(消息應(yīng)答)2.3Notifications(通知)2.4舉例:Client獲取ServerTool列表3.協(xié)議規(guī)范之生命周期管理3.1Initialization(初始化):3.2Operation(操作)3.3Shutdown(關(guān)閉)4.協(xié)議規(guī)范之傳輸層5.參考整個規(guī)范,可...
2025-03-20 07:28:19 3428瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
說實(shí)話,我以前特別怕做PPT。每次老板說“做個PPT吧”,我心里就咯噔一下。光是想到要查資料、寫內(nèi)容、調(diào)格式,我就想原地消失。更別提那些熬夜改來改去的日子了,眼睛都快瞎了,PPT還是丑得沒法看。每次交完P(guān)PT,我都覺得自己被掏空。最近體驗了DeepSeek+Kimi這個神器,簡直像開了掛一樣!它就像個超級助手,幫我搞定所有麻煩事。查資料?它來!寫內(nèi)容?它來!排版設(shè)計?它還來!以前要花一整天才能搞定的PPT,現(xiàn)在10來分鐘就...
2025-03-07 11:12:23 2869瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
流式傳輸允許實(shí)時接收生成的文本,隨著文本的生成而接收。這樣,您就不必等到整個文本準(zhǔn)備好后才能開始向用戶展示。我們將使用LangChain與LLM進(jìn)行流式交互,并使用Streamlit創(chuàng)建應(yīng)用的前端。1.什么是Streamlit?2.什么是LangChain?3.什么是流式輸出?4.代碼實(shí)現(xiàn)4.1安裝依賴4.2導(dǎo)入必要的庫4.3初始化OpenAI語言模型4.4創(chuàng)建StreamlitUI4.5實(shí)現(xiàn)流式輸出4.6管理聊天歷史4.7顯示聊天記錄4.8獲取用戶輸入并生成AI回復(fù)5.運(yùn)行項目總結(jié)...
2025-02-18 13:22:00 3940瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
在辦公場景中,WPS作為一款強(qiáng)大的辦公軟件,不僅提供了豐富的文檔編輯功能,還支持宏(Macro)來實(shí)現(xiàn)自動化處理。隨著人工智能技術(shù)的發(fā)展,將大模型(如ChatGPT、DeepSeek、文心一言等)集成到WPS中,可以大幅提升文檔編輯、內(nèi)容創(chuàng)作、數(shù)據(jù)分析的效率。本文介紹如何通過WPSJS宏調(diào)用DeepSeek大模型,實(shí)現(xiàn)自動化文本擴(kuò)寫功能。1.隨便打開一個word文檔,點(diǎn)擊工具欄“工具”2.點(diǎn)擊“開發(fā)工具”3.點(diǎn)擊“查看代碼”4.在打開的WPS宏編...
2025-02-10 12:00:08 5109瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
最近Distillation這個詞見的非常多。前兩天大火的DeepSeek團(tuán)隊發(fā)布的DeepSeekR1,其670B參數(shù)的大模型通過強(qiáng)化學(xué)習(xí)與蒸餾技術(shù),成功將能力遷移至7B參數(shù)的輕量模型中。蒸餾后的模型超越同規(guī)模傳統(tǒng)模型,甚至接近OpenAI的頂尖小模型OpenAIo1mini。在人工智能領(lǐng)域,大型語言模型(如GPT4、DeepSeekR1)憑借數(shù)千億級參數(shù),展現(xiàn)出卓越的推理與生成能力。然而,其龐大的計算需求與高昂的部署成本,嚴(yán)重限制了其在移動設(shè)備、邊緣計算等...
2025-01-26 13:38:19 1.8w瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
在機(jī)器學(xué)習(xí)中,損失函數(shù)是用來衡量模型預(yù)測值與真實(shí)值之間差距的一個函數(shù)。它在模型訓(xùn)練過程中起著至關(guān)重要的作用,因為通過最小化損失函數(shù),模型能夠調(diào)整其參數(shù),從而使得預(yù)測結(jié)果越來越接近真實(shí)值。為了幫助理解這一點(diǎn),我們將以均方誤差(MSE)為例,詳細(xì)講解什么是損失函數(shù),以及它在實(shí)際應(yīng)用中的作用。什么是損失函數(shù)?損失函數(shù)是一個用于評估模型預(yù)測準(zhǔn)確性的數(shù)學(xué)函數(shù)。具體來說,損失函數(shù)通過對比模型的預(yù)測值與真實(shí)值,...
2025-01-16 12:09:56 2762瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
BagofWords將文本看作由單詞構(gòu)成的無序集合,通過統(tǒng)計單詞在文本中出現(xiàn)的頻次來表示文本。因此,BagofWords主要用于文本分類、情感分析、信息檢索等自然語言處理任務(wù)中1.什么是詞袋模型(BagofWords)2.實(shí)現(xiàn)BagofWords的步驟2.1文本預(yù)處理2.2構(gòu)建詞匯表2.3向量化文本(詞袋表示)2.4通過文本的向量表示,使用余弦相似度分析句子相似度3.統(tǒng)計詞頻,通過評論提升餐廳滿意度在自然語言處理領(lǐng)域,如何將人類語言轉(zhuǎn)化為機(jī)器能夠理解...
2025-01-08 12:58:28 2094瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
智能體是一種能夠感知環(huán)境、做出決策并采取行動的系統(tǒng)。這些系統(tǒng)能夠執(zhí)行被動的任務(wù),也能夠主動尋找解決問題的方法,適應(yīng)環(huán)境的變化,并在沒有人類直接干預(yù)的情況下做出決策。1.業(yè)務(wù)需求現(xiàn)在有一個生意很好的鮮花店在運(yùn)營花店的過程中,經(jīng)常遇到特殊情況導(dǎo)致大量花朵損壞,會導(dǎo)致庫存短缺的問題因此花店急需一個能夠精準(zhǔn)預(yù)測和優(yōu)化庫存的解決方案來應(yīng)對這場危機(jī),否則我們將失去大量顧客并且信譽(yù)受損??墒?,花店人力嚴(yán)重不足A...
2024-12-30 12:53:50 4418瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
近年來大模型發(fā)展過程中面臨的幾個核心挑戰(zhàn):靜態(tài)知識的局限性、執(zhí)行能力的缺失、與外部系統(tǒng)的割裂。為了應(yīng)對這些挑戰(zhàn),推動大模型從單純的語言生成工具演變?yōu)檎嬲娜蝿?wù)執(zhí)行引擎,F(xiàn)unctioncalling誕生了,成為大模型一項不可或缺的核心能力。概念Functioncalling和ToolCalling會混用我們在做應(yīng)用開發(fā)的時候,大部分時候盡量避免直接耦合到OpenAI,會使得程序兼容性不好,這時只要面向LangChain開發(fā)就可以了。LangChain是一個靈...
2024-12-20 10:27:21 4252瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
AIAgent,即人工智能代理,一般直接叫做智能體。是一種能夠感知環(huán)境、做出決策并采取行動的系統(tǒng)。這些系統(tǒng)能夠執(zhí)行被動的任務(wù),也能夠主動尋找解決問題的方法,適應(yīng)環(huán)境的變化,并在沒有人類直接干預(yù)的情況下做出決策?;诖竽P偷腁IAgent開發(fā)常用框架包括:LangChain、LlamaIndex、OpenAIAPI1.LangChain是什么?(示例代碼基于v0.3版本)LangChain是一個開源框架,目標(biāo)是將大模型與外部數(shù)據(jù)連接起來,以便開發(fā)者能夠更快和更...
2024-12-10 10:22:41 7344瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
AI就像電力一樣。”這是因為,作為一種通用技術(shù)(類似于電力),AI有著無數(shù)的應(yīng)用場景。如果有人問你:“電力能用來做什么?”這個問題很難回答,因為電力幾乎無處不在。同樣,新興的AI技術(shù)正在為我們創(chuàng)造一個龐大的機(jī)會空間,能夠開發(fā)以前無法實(shí)現(xiàn)的應(yīng)用。經(jīng)常有人問我:“AI最大的機(jī)會在哪里?”我對AI技術(shù)棧的理解是這樣的:在最底層,是半導(dǎo)體技術(shù)。在其上是云基礎(chǔ)設(shè)施。當(dāng)然,再往上是各種基礎(chǔ)模型訓(xùn)練工具和模型本身。大...
2024-12-03 12:51:49 2320瀏覽 0點(diǎn)贊 0回復(fù) 0收藏