偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<button id="ivprh"><nobr id="ivprh"></nobr></button>

<samp id="ivprh"></samp>

<tt id="ivprh"><th id="ivprh"></th></tt>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

鴻煊的學(xué)習(xí)筆記

LV.2

包括但不限于機器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘、自然語言處理等

聲望 190

關(guān)注 0

粉絲 0

社區(qū)頭條作者熱門內(nèi)容榜上榜作者

私信

關(guān)注

主帖 21

回帖

為什么大家都開始探索 MoE 架構(gòu)？MoE 相比 Dense 有什么好處？

在大模型發(fā)展進程中，MoE架構(gòu)憑借獨特優(yōu)勢備受關(guān)注。與傳統(tǒng)Dense架構(gòu)相比，它在計算效率、模型擴展性和任務(wù)處理能力等方面表現(xiàn)突出，為大模型性能提升提供了新方向。下面是其優(yōu)勢：計算效率更高：MoE架構(gòu)通過路由器網(wǎng)絡(luò)動態(tài)選擇輸入token激活的專家集合，僅激活部分參數(shù)，大幅降低計算量。如DeepSeekV3激活37B參數(shù)（占總量671B的5.5%），其FLOPs可降低至傳統(tǒng)Dense架構(gòu)的30%以下。在推理時，MoE架構(gòu)能根據(jù)輸入動態(tài)分配計算資源，...

9h前 53瀏覽 0點贊 0回復(fù) 0收藏

大模型訓(xùn)練流程及 SFT、RLHF 作用簡述

一、大模型訓(xùn)練流程：從預(yù)訓(xùn)練到對齊的三階閉環(huán)1.1預(yù)訓(xùn)練階段基于海量無標注數(shù)據(jù)（如互聯(lián)網(wǎng)文本、多模態(tài)數(shù)據(jù)）進行自監(jiān)督學(xué)習(xí)，通過語言建模（LM）、對比學(xué)習(xí)等任務(wù)建立通用表征能力。典型參數(shù)規(guī)模為千億至萬億級別，需千卡級GPU集群訓(xùn)練數(shù)月。1.2監(jiān)督微調(diào)（SFT）階段使用標注數(shù)據(jù)（如領(lǐng)域問答、指令遵循）調(diào)整模型參數(shù)，使其適配下游任務(wù)。SFT階段僅需0.1%1%的預(yù)訓(xùn)練數(shù)據(jù)量即可顯著提升特定任務(wù)性能。1.3強化學(xué)習(xí)對齊（RLHF）...

9h前 117瀏覽 0點贊 0回復(fù) 0收藏

RLHF 核心算法解析：從 DPO 到 DAPO 的大模型對齊技術(shù)演進

開篇：RLHF如何重塑大模型交互范式在大模型從"技術(shù)展示"走向"產(chǎn)業(yè)落地"的進程中，如何讓模型輸出符合人類價值觀與使用習(xí)慣，成為比單純提升性能更關(guān)鍵的命題?；谌祟惙答伒膹娀瘜W(xué)習(xí)（RLHF）正是解決這一問題的核心技術(shù)——它通過將人類偏好轉(zhuǎn)化為訓(xùn)練信號，引導(dǎo)模型生成更自然、安全、符合預(yù)期的回答。而支撐RLHF的核心，是一系列不斷進化的強化學(xué)習(xí)算法。本文將解析四大RLHF算法，揭示它們?nèi)绾巫屇Ｐ蛷?quot;會說話"進化到"懂人心...

9h前 92瀏覽 0點贊 0回復(fù) 0收藏

Qwen3 Embedding 數(shù)據(jù)生成技術(shù)深度解析：從 LLM 驅(qū)動合成到領(lǐng)域適配優(yōu)化

精華

在Qwen3Embedding的技術(shù)體系中，數(shù)據(jù)生成模塊通過大模型驅(qū)動的結(jié)構(gòu)化合成框架突破了傳統(tǒng)文本嵌入模型的訓(xùn)練數(shù)據(jù)瓶頸。這一創(chuàng)新不僅使模型在MTEB多語言排行榜以70.58分登頂，更在代碼檢索等專業(yè)領(lǐng)域?qū)崿F(xiàn)80.68分的突破。以下結(jié)合官方技術(shù)報告與開源實踐，詳解數(shù)據(jù)生成的全流程技術(shù)細節(jié)。一、兩階段數(shù)據(jù)生成架構(gòu)：從語義建模到查詢生成1.1配置階段：三維語義空間定義Qwen3采用Qwen332B大模型為文檔生成結(jié)構(gòu)化語義配置，通過三大維...

1天前 227瀏覽 0點贊 0回復(fù) 0收藏

Qwen3 Embedding 深度解析

在檢索增強生成(RAG)技術(shù)成為企業(yè)級AI應(yīng)用核心架構(gòu)的2025年，阿里巴巴通義實驗室開源的Qwen3Embedding系列模型以70.58分登頂MTEB多語言排行榜，其80.68分的代碼檢索成績更超越GoogleGemini模型8.1%。這一技術(shù)突破背后蘊含著從模型架構(gòu)到訓(xùn)練范式的全面創(chuàng)新，本文將深入技術(shù)底層，解析Qwen3Embedding如何通過多維度技術(shù)創(chuàng)新重塑文本嵌入與重排序技術(shù)格局。一、簡介Qwen3Embedding是基于Qwen3基礎(chǔ)模型構(gòu)建的新一代文本嵌入與重排...

2025-06-20 06:18:14 1471瀏覽 0點贊 0回復(fù) 0收藏

Qwen3 Embedding 數(shù)據(jù)生成技術(shù)深度解析：從 LLM 驅(qū)動合成到領(lǐng)域適配優(yōu)化

精華

在Qwen3Embedding的技術(shù)體系中，數(shù)據(jù)生成模塊通過大模型驅(qū)動的結(jié)構(gòu)化合成框架突破了傳統(tǒng)文本嵌入模型的訓(xùn)練數(shù)據(jù)瓶頸。這一創(chuàng)新不僅使模型在MTEB多語言排行榜以70.58分登頂，更在代碼檢索等專業(yè)領(lǐng)域?qū)崿F(xiàn)80.68分的突破。以下結(jié)合官方技術(shù)報告與開源實踐，詳解數(shù)據(jù)生成的全流程技術(shù)細節(jié)。一、兩階段數(shù)據(jù)生成架構(gòu)：從語義建模到查詢生成1.1配置階段：三維語義空間定義Qwen3采用Qwen332B大模型為文檔生成結(jié)構(gòu)化語義配置，通過三大維...

2025-06-20 06:15:33 1181瀏覽 0點贊 0回復(fù) 0收藏

阿里: 開源Qwen3-Embedding Qwen3-Reranker系列模型

一、Qwen3Embedding系列模型介紹二、Qwen3Reranker系列模型介紹三、Qwen3Embedding和Qwen3Reranker的優(yōu)勢6月6日凌晨，阿里巴巴開源了Qwen3Embedding系列模型，包括Embedding（文本表征）和Reranker（排序）兩個模塊，旨在為文本檢索、語義匹配等任務(wù)提供強大支持。該系列模型基于Qwen3基礎(chǔ)模型進行訓(xùn)練，在多項基準測試中展現(xiàn)出卓越性能，尤其在多語言支持方面達到行業(yè)領(lǐng)先水平。官方數(shù)據(jù)顯示，Qwen3Embedding系列在多語言文本...

2025-06-09 00:12:13 1858瀏覽 0點贊 0回復(fù) 0收藏

五種 AI Agent 模式深度解析

在大模型技術(shù)爆發(fā)的今天，AIAgent（人工智能代理）正成為連接技術(shù)與場景的核心樞紐。它不僅是提升效率的「智能助手」，更是解鎖復(fù)雜任務(wù)的「萬能鑰匙」。本文結(jié)合多篇行業(yè)干貨，提煉出5種主流AIAgent模式，帶您看透智能時代的底層邏輯。一、AIAgent：重新定義人機協(xié)作的「智能體」簡單來說，AIAgent是基于大模型構(gòu)建的自主智能體，能像人類一樣「感知環(huán)境→規(guī)劃決策→執(zhí)行反饋」。核心特點：自主性：無需人工干預(yù)，自動分解任務(wù)...

2025-06-09 00:11:57 772瀏覽 0點贊 0回復(fù) 0收藏

萬字長文解析基于CrewAI創(chuàng)建Agent的各個細節(jié)

社區(qū)頭條

1.引言在人工智能領(lǐng)域，MultiAgent系統(tǒng)正逐漸成為解決復(fù)雜問題、實現(xiàn)高效協(xié)作的關(guān)鍵技術(shù)。CrewAI作為一款強大的多Agent協(xié)作工具，為開發(fā)者提供了便捷的方式來構(gòu)建智能協(xié)作系統(tǒng)。本文將詳細介紹如何基于CrewAI構(gòu)建MultiAgent系統(tǒng)。2.CrewAI核心概念詳解2.1代理（Agent）2.1.1Agent的定義與功能Agent是CrewAI中的自主單元，具備執(zhí)行任務(wù)、做出決策和與其他代理通信的能力。它們?nèi)缤瑘F隊中的成員，各自承擔(dān)特定角色，如研究員、作...

2025-05-27 06:19:40 1113瀏覽 0點贊 0回復(fù) 0收藏

LLM - Reasoner：讓 LLM 像 DeepSeek R1 一樣思考更深入

社區(qū)頭條

今天給大家分享一個超厲害的庫——LLMReasoner，它就像給大模型開了“智慧外掛”，能讓任何大語言模型（LLM）都像OpenAIo1和DeepSeekR1一樣深入思考！不管你是AI技術(shù)控，還是想提升大模型使用體驗的小伙伴，都別錯過～1.LLMReasoner是啥“寶藏”？LLMReasoner本質(zhì)是個庫，致力于打破大模型給出“黑箱答案”的局面。以往，大模型輸出結(jié)果時，咱根本不知道它是怎么思考的，就像拆盲盒，充滿未知。但有了LLMReasoner，這一切都變啦...

2025-05-13 00:04:54 828瀏覽 0點贊 0回復(fù) 0收藏

一文讀遍 LoRA 家族：大語言模型高效訓(xùn)練的"秘密武器"

社區(qū)頭條

在大語言模型（LLMs）的訓(xùn)練領(lǐng)域，LowRankAdaptation（LoRA）技術(shù)堪稱一項重大突破。它就像給模型訓(xùn)練開啟了一條“高速通道”，讓我們能更高效地為特定任務(wù)訓(xùn)練大語言模型。如今，LoRA在眾多應(yīng)用場景中廣泛使用，并且引發(fā)了一系列改進研究，催生出了許多變體，這些變體從不同角度優(yōu)化LoRA，提升訓(xùn)練速度、性能，或者兩者兼得。今天，咱們就來深入了解一下LoRA及其家族成員的奧秘。1.LoRA：基礎(chǔ)概念與核心優(yōu)勢LoRA的核心做法是在...

2025-04-27 00:35:57 2587瀏覽 0點贊 0回復(fù) 0收藏

一文讀懂 DeepSeek-R1 的 “最強外掛” GRPO 算法

精華

在大語言模型（LLMs）的飛速發(fā)展進程中，DeepSeekR1憑借出色的性能脫穎而出，吸引了無數(shù)目光。而它背后的“秘密武器”——GRPO（GroupRelativePolicyOptimization）強化學(xué)習(xí)算法，更是成為大家熱議的焦點。今天，咱們就用通俗易懂的方式，深入剖析一下這個讓DeepSeekR1大放異彩的GRPO算法！1.GRPO誕生的“前因后果”在大語言模型的微調(diào)環(huán)節(jié)，強化學(xué)習(xí)（RL）起著舉足輕重的作用。一直以來，近端策略優(yōu)化（PPO）算法都是LLM微調(diào)的...

2025-04-15 07:34:27 3115瀏覽 0點贊 0回復(fù) 0收藏

MCP不是 API，你知道嗎？

MCP全稱是ModelContextProtocol，也就是模型上下文協(xié)議。可別小瞧它，它可不是“另一個類似API的東西”，要是你這么想，那說明還沒真正get到它的精髓。說起傳統(tǒng)API，大家應(yīng)該不陌生。它就像一套固定的工具套裝，通過固定和預(yù)定義的端點來提供功能，像常見的products（產(chǎn)品相關(guān)接口）、orders（訂單接口）、invoices（發(fā)票接口）這些。但這也帶來了不少麻煩。比如說，你想給API添加新功能，就得新建端點或者修改現(xiàn)有端點。這一改...

2025-04-02 00:57:11 1688瀏覽 0點贊 0回復(fù) 0收藏

Awesome-llm-apps：大語言模型應(yīng)用的寶藏倉庫

大語言模型（LLM）正以前所未有的速度改變著我們的生活和工作方式。“awesomellmapps”這個精心策劃的倉庫，為開發(fā)者和研究者們提供了豐富多樣的大語言模型應(yīng)用示例。1.倉庫概述“awesomellmapps”是一個匯聚了眾多使用檢索增強生成（RAG）和人工智能代理構(gòu)建的大語言模型應(yīng)用程序的倉庫。它涵蓋了多種基于不同大語言模型構(gòu)建的應(yīng)用，包括OpenAI、Anthropic、Google的模型，以及DeepSeek、Qwen、Llama等開源模型，并且用戶可以...

2025-03-21 08:41:34 2409瀏覽 0點贊 0回復(fù) 0收藏

一文讀懂 RAG 中的 embedding model

在當(dāng)今人工智能的浪潮中，RAG（檢索增強生成）技術(shù)大放異彩，像是RAGFlow、Qanything、Dify、FastGPT等RAG引擎，逐漸走進大家的視野。在這些強大的RAG引擎背后，有一個關(guān)鍵組件起著不可或缺的作用，它就是嵌入模型（EmbeddingModel）。今天，就讓我們一起深入了解一下這個神秘的嵌入模型吧！1.Embedding究竟是什么？在了解嵌入模型之前，得先搞清楚Embedding的概念。簡單來說，Embedding是一種“神奇魔法”，能把離散的非結(jié)構(gòu)化...

2025-03-11 02:00:02 3075瀏覽 0點贊 0回復(fù) 0收藏

一文讀懂 PPO 與 GRPO：LLM 訓(xùn)練的關(guān)鍵算法

精華

大語言模型（LLM）的發(fā)展可謂日新月異。大家都知道，LLM的訓(xùn)練過程很復(fù)雜，其中有兩個關(guān)鍵階段：預(yù)訓(xùn)練和后訓(xùn)練。今天咱們就來深入聊聊在這一過程中發(fā)揮重要作用的近端策略優(yōu)化（PPO）算法和組相對策略優(yōu)化（GRPO）算法。這倆算法不僅在學(xué)術(shù)圈備受關(guān)注，在實際應(yīng)用中也有著舉足輕重的地位，理解它們，能讓你更懂LLM是如何一步步變得這么“聰明”的！一、從LLM訓(xùn)練說起LLM的訓(xùn)練如同一場漫長而復(fù)雜的旅程，主要分為預(yù)訓(xùn)練和后訓(xùn)...

2025-02-19 11:54:37 7588瀏覽 0點贊 0回復(fù) 0收藏

7G顯存，訓(xùn)練自己的 DeepSeek-R1：GRPO 資源下降80%

DeepSeekR1模型的出現(xiàn)引起了廣泛關(guān)注，眾多開源復(fù)現(xiàn)項目紛紛涌現(xiàn)（OpenR1、simpleRLreason、TinyZero、MiniR1等）。然而，受GPU條件的限制，有些小伙伴可能無法順利運行這些項目。今天，我們就來介紹一個神奇的工具——UnslothAI，它可以幫助我們在有限的資源下訓(xùn)練自己的DeepSeekR1推理模型，特別是通過GRPO（GroupRelativePolicyOptimization）技術(shù)，實現(xiàn)了資源的大幅降低。1.UnslothAI的神奇之處1.1GRPO技術(shù)簡介GRPO是一種強...

2025-02-12 13:13:42 3320瀏覽 0點贊 0回復(fù) 0收藏

Model2Vec：RAG 加速新引擎，模型瘦身15倍，速度提升500倍，最新emb benchmark

嵌入（Embedding）技術(shù)作為基石，廣泛應(yīng)用于自然語言處理（NLP）、搜索引擎、推薦系統(tǒng)等多個關(guān)鍵領(lǐng)域，發(fā)揮著不可或缺的作用。盡管嵌入技術(shù)歷經(jīng)持續(xù)發(fā)展并取得諸多顯著成果，但傳統(tǒng)嵌入方法始終受困于模型規(guī)模龐大、計算資源消耗嚴重、推理速度遲緩等難題，這些問題猶如枷鎖，限制了其進一步的拓展與應(yīng)用。在此背景下，Model2Vec的全新嵌入技術(shù)為行業(yè)帶來了突破性的解決方案。它憑借創(chuàng)新性的設(shè)計，成功實現(xiàn)了嵌入模型規(guī)?？s小15...

2025-02-04 18:12:45 2944瀏覽 0點贊 0回復(fù) 0收藏

清華&人大：search-o1 讓推理模型具有主動能力

1.背景大型推理模型如OpenAIo1、QwenQwQ等通過大規(guī)模強化學(xué)習(xí)，在科學(xué)、數(shù)學(xué)、編碼等復(fù)雜領(lǐng)域展現(xiàn)出了強大的逐步推理能力。它們以“慢思考”模式生成長思維鏈條，有效解決復(fù)雜問題，增強了推理的邏輯性和可解釋性。然而，這也帶來了顯著弊端，在長鏈式推理過程中，模型常常遭遇知識不足的困境。這使得推理鏈條容易出現(xiàn)錯誤傳播，嚴重影響最終答案的質(zhì)量。例如，在處理一些復(fù)雜的科學(xué)問題時，模型可能會因為對某些關(guān)鍵知識點的缺...

2025-01-20 10:57:57 2208瀏覽 0點贊 0回復(fù) 0收藏

Langbase：關(guān)于AI Agents的研究報告

2024年，AIAgents成為熱門概念，2025年則有望成為其爆發(fā)元年。AIAgents在企業(yè)場景中的應(yīng)用日益廣泛，但在落地過程中也面臨著諸多挑戰(zhàn)。本文將基于Langbase的研究報告，探討AIAgents的發(fā)展現(xiàn)狀，包括LLM提供商的選擇、應(yīng)用場景、落地制約因素以及所需的配套基建等方面。1.研究背景與參與者Langbase對來自100多個國家的3400多位專業(yè)人士進行了調(diào)查，涵蓋C級高管（46%）、工程師（26%）、客戶支持（17%）、市場營銷（8%）、IT（3%...

2025-01-10 12:28:44 2324瀏覽 0點贊 0回復(fù) 0收藏

獲得成就

已積累 9336 人氣

獲得 0 個點贊

獲得 0 次收藏

<var id="8vt5q"><dl id="8vt5q"></dl></var><cite id="8vt5q"><center id="8vt5q"></center></cite>