偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<samp id="p7frr"><delect id="p7frr"></delect></samp>

<abbr id="p7frr"><listing id="p7frr"><label id="p7frr"></label></listing></abbr>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

95%性能 + 85%成本節(jié)??？RouteLLM讓AI推理聰明又省錢(qián)！原創(chuàng)

發(fā)布于 2025-9-9 08:34

瀏覽

0收藏

在今天，AI Agent已經(jīng)從簡(jiǎn)單的"問(wèn)答機(jī)器"進(jìn)化成了能夠處理復(fù)雜任務(wù)的"智能協(xié)調(diào)員"。未來(lái)幾年，至少一定比例的企業(yè)軟件將依賴智能體AI，而路由模式正是這場(chǎng)變革的核心引擎。

路由模式的本質(zhì)

傳統(tǒng)的線性困境

早期的AI系統(tǒng)就像一條生產(chǎn)線——輸入進(jìn)來(lái)，按照預(yù)定步驟處理，輸出結(jié)果。這種方式在處理確定性任務(wù)時(shí)效率很高，但面對(duì)真實(shí)世界的復(fù)雜性時(shí)就顯得力不從心了。

比如客服場(chǎng)景：

用戶問(wèn)："我的訂單怎么還沒(méi)到？" → 查詢系統(tǒng)
用戶問(wèn)："你們的產(chǎn)品有什么優(yōu)勢(shì)？" → 產(chǎn)品介紹
用戶問(wèn)："我要投訴！" → 人工客服

如果每個(gè)問(wèn)題都走同一個(gè)流程，效率可想而知。

路由的核心價(jià)值

路由模式引入了條件邏輯層，讓AI系統(tǒng)能夠：

動(dòng)態(tài)評(píng)估：實(shí)時(shí)分析輸入特征
智能決策：選擇最優(yōu)處理路徑
靈活調(diào)度：根據(jù)上下文調(diào)整執(zhí)行策略

四種主流路由機(jī)制

基于LLM路由：用提示讓模型輸出1個(gè)“路由ID”。優(yōu)點(diǎn)：實(shí)現(xiàn)快、語(yǔ)義強(qiáng)。缺點(diǎn)：可解釋性與確定性弱，需約束輸出與監(jiān)控漂移。
基于嵌入的語(yǔ)義路由：將輸入與各“能力向量”比相似度再?zèng)Q策。優(yōu)點(diǎn)：語(yǔ)義穩(wěn)定、無(wú)監(jiān)督擴(kuò)展容易。缺點(diǎn)：需閾值標(biāo)定，對(duì)邊界類弱。
基于規(guī)則的路由：關(guān)鍵詞/正則/結(jié)構(gòu)化字段的if-else/switch。優(yōu)點(diǎn)：快、可預(yù)測(cè)。缺點(diǎn)：覆蓋面有限，維護(hù)規(guī)則成本高。
基于監(jiān)督模型的路由：小型分類器（LogReg、XGBoost、輕量Transformer）做判別。優(yōu)點(diǎn)：可解釋/可評(píng)估/可部署離線。缺點(diǎn)：需標(biāo)注與持續(xù)校準(zhǔn)。

架構(gòu)落地（控制面與數(shù)據(jù)信道）

控制面：路由器（LLM/嵌入/規(guī)則/分類器）產(chǎn)出route_id與confidence。
數(shù)據(jù)信道：原始輸入與狀態(tài)隨route_id流向?qū)?yīng)子智能體/工具鏈。
安全護(hù)欄：為每條路加“可運(yùn)行前置條件”和“失敗回退路徑”。
可觀測(cè)性：記錄request_id/route_id/confidence/latency/cost/outcome，便于復(fù)盤(pán)。

典型失效與降級(jí)策略

不明確意圖：路由到澄清子智能體，最多N輪后回到默認(rèn)路徑或人工升級(jí)。
誤路由：引入分層路由（粗分類→細(xì)分類），或影子路由離線比對(duì)再切換。
輸出不合規(guī)：對(duì)LLM路由加“有限集合強(qiáng)約束+重試+正則校驗(yàn)+溫度=0”。
循環(huán)與抖動(dòng)：在狀態(tài)中記錄近幾次route_id，對(duì)頻繁切換施加抑制與懲罰。

代碼實(shí)戰(zhàn)

將介紹三個(gè)最實(shí)用的開(kāi)源路由庫(kù)：

Semantic Router：最快的語(yǔ)義路由，毫秒級(jí)決策
RouteLLM：成本優(yōu)化神器，省85%的API費(fèi)用
LlamaIndex Router：最靈活的路由框架

Semantic Router - 極速語(yǔ)義路由

什么是Semantic Router？

Semantic Router是aurelio-labs開(kāi)源的超快速路由決策層。它不等待緩慢的LLM生成，而是使用語(yǔ)義向量空間來(lái)做決策，速度提升100倍以上。

5分鐘快速上手

# 安裝
pip install semantic-router

# 如果要完全本地化（不依賴API）
pip install "semantic-router[local]"

實(shí)戰(zhàn)示例1：客服路由系統(tǒng)

from semantic_router import Route
from semantic_router.encoders import OpenAIEncoder
from semantic_router.routers import SemanticRouter
import os

# 設(shè)置API密鑰
os.environ["OPENAI_API_KEY"] = "your-api-key"

# 1. 定義路由規(guī)則 - 簡(jiǎn)單直觀
order_route = Route(
    name="order",
    utterances=[
        "我的訂單在哪里",
        "訂單什么時(shí)候發(fā)貨",
        "查詢訂單狀態(tài)",
        "物流信息",
        "快遞到哪了",
        "為什么還沒(méi)發(fā)貨",
        "訂單號(hào)12345的狀態(tài)",
        "配送需要多久",
        "可以改地址嗎",
        "取消訂單"
    ]
)

payment_route = Route(
    name="payment",
    utterances=[
        "支付失敗了",
        "可以用信用卡嗎",
        "支持哪些支付方式",
        "退款要多久",
        "發(fā)票怎么開(kāi)",
        "可以分期嗎",
        "支付安全嗎",
        "怎么綁定銀行卡"
    ]
)

product_route = Route(
    name="product",
    utterances=[
        "這個(gè)產(chǎn)品有什么功能",
        "產(chǎn)品參數(shù)",
        "有哪些顏色",
        "保修期多長(zhǎng)",
        "使用說(shuō)明",
        "產(chǎn)品對(duì)比",
        "推薦產(chǎn)品",
        "價(jià)格多少"
    ]
)

complaint_route = Route(
    name="complaint",
    utterances=[
        "我要投訴",
        "太差勁了",
        "服務(wù)態(tài)度不好",
        "產(chǎn)品有問(wèn)題",
        "要求賠償",
        "找你們經(jīng)理",
        "這是欺詐"
    ]
)

# 2. 創(chuàng)建路由器
routes = [order_route, payment_route, product_route, complaint_route]
encoder = OpenAIEncoder()  # 也可以用 CohereEncoder() 或 HuggingFaceEncoder()
router = SemanticRouter(encoder=encoder, routes=routes)

# 3. 使用路由器
def handle_query(user_input: str):
    """處理用戶查詢"""
    decision = router(user_input)
    
    if decision.name == "order":
        return handle_order(user_input)
    elif decision.name == "payment":
        return handle_payment(user_input)
    elif decision.name == "product":
        return handle_product(user_input)
    elif decision.name == "complaint":
        return escalate_to_human(user_input)
    else:
        return handle_general(user_input)

# 測(cè)試
print(router("我昨天買(mǎi)的東西怎么還沒(méi)發(fā)貨"))  # -> Route(name='order')
print(router("可以用花唄支付嗎"))           # -> Route(name='payment')
print(router("這個(gè)手機(jī)防水嗎"))             # -> Route(name='product')

實(shí)戰(zhàn)示例2：使用本地模型（完全免費(fèi)）

from semantic_router.encoders import HuggingFaceEncoder
from semantic_router.llms import LlamaCppLLM

# 使用本地嵌入模型
encoder = HuggingFaceEncoder(
    model_name="sentence-transformers/all-MiniLM-L6-v2"
)

# 使用本地LLM（可選，用于動(dòng)態(tài)路由）
llm = LlamaCppLLM(
    model_path="./models/llama-2-7b-chat.gguf",
    n_ctx=2048,
    n_gpu_layers=32# 如果有GPU
)

# 創(chuàng)建完全本地化的路由器
router = SemanticRouter(
    encoder=encoder,
    routes=routes,
    llm=llm  # 可選：當(dāng)無(wú)法匹配時(shí)使用LLM判斷
)

高級(jí)功能：動(dòng)態(tài)路由

from semantic_router import Route

# 創(chuàng)建動(dòng)態(tài)路由 - 可以執(zhí)行函數(shù)
def get_order_status(order_id: str):
    # 查詢訂單系統(tǒng)
    returnf"訂單 {order_id} 正在配送中"

def process_payment(amount: float, method: str):
    # 處理支付
    returnf"正在處理 {amount} 元的 {method} 支付"

# 動(dòng)態(tài)路由可以提取參數(shù)并調(diào)用函數(shù)
dynamic_order_route = Route(
    name="order_status",
    utterances=[
        "訂單[ORDER_ID]的狀態(tài)",
        "查詢訂單[ORDER_ID]",
        "[ORDER_ID]到哪了"
    ],
    function=get_order_status,
    function_schema={
        "type": "object",
        "properties": {
            "order_id": {"type": "string"}
        }
    }
)

與向量數(shù)據(jù)庫(kù)集成（處理大規(guī)模路由）

from semantic_router.index import QdrantIndex
from semantic_router.routers import SemanticRouter

# 使用Qdrant向量數(shù)據(jù)庫(kù)存儲(chǔ)路由
qdrant_index = QdrantIndex(
    url="http://localhost:6333",  # Qdrant服務(wù)地址
    collection_name="routes"
)

# 創(chuàng)建支持向量數(shù)據(jù)庫(kù)的路由器
router = SemanticRouter(
    encoder=encoder,
    routes=routes,
    index=qdrant_index,  # 使用向量數(shù)據(jù)庫(kù)索引
    auto_sync="local"     # 自動(dòng)同步到本地
)

# 現(xiàn)在可以處理成千上萬(wàn)個(gè)路由規(guī)則

RouteLLM - 智能成本優(yōu)化

什么是RouteLLM？

RouteLLM是LMSYS開(kāi)源的成本優(yōu)化框架。它能智能地將簡(jiǎn)單問(wèn)題路由到便宜模型，復(fù)雜問(wèn)題路由到強(qiáng)大模型，在保持95% GPT-4性能的同時(shí)，降低85%的成本。

快速安裝與配置

pip install routellm

實(shí)戰(zhàn)示例：智能成本控制

from routellm.controller import Controller
import os

# 設(shè)置API密鑰
os.environ["OPENAI_API_KEY"] = "your-openai-key"
os.environ["ANYSCALE_API_KEY"] = "your-anyscale-key"# 用于Mixtral

# 創(chuàng)建智能路由控制器
client = Controller(
    routers=["mf"],  # 使用matrix factorization路由器
    strong_model="gpt-4",  # 強(qiáng)模型（貴但效果好）
    weak_model="anyscale/mistralai/Mixtral-8x7B-Instruct-v0.1",  # 弱模型（便宜）
)

# 使用示例
def smart_query(question: str, importance: str = "normal"):
    """
    智能查詢，根據(jù)重要性選擇路由閾值
    importance: "low", "normal", "high"
    """
    
    # 根據(jù)重要性設(shè)置閾值
    thresholds = {
        "low": 0.3,     # 更多使用便宜模型
        "normal": 0.5,  # 平衡
        "high": 0.8     # 更多使用貴模型
    }
    
    threshold = thresholds.get(importance, 0.5)
    
    response = client.chat.completions.create(
        model=f"router-mf-{threshold}",
        messages=[
            {"role": "user", "content": question}
        ],
        temperature=0.7
    )
    
    return response.choices[0].message.content

# 測(cè)試不同復(fù)雜度的問(wèn)題
simple_q = "今天星期幾？"# 簡(jiǎn)單問(wèn)題 -> 路由到Mixtral
complex_q = "解釋量子計(jì)算的原理，并給出實(shí)際應(yīng)用案例"# 復(fù)雜問(wèn)題 -> 路由到GPT-4

print(smart_query(simple_q, "low"))     # 用便宜模型
print(smart_query(complex_q, "high"))   # 用貴模型

服務(wù)器模式部署

# config.yaml
model_providers:
  - provider: openai
    api_key: ${OPENAI_API_KEY}
    models:
      - gpt-4
      - gpt-3.5-turbo

  - provider: anyscale
    api_key: ${ANYSCALE_API_KEY}
    models:
      - mistralai/Mixtral-8x7B-Instruct-v0.1

routers:
  mf:
    checkpoint_path: "routellm/mf_gpt4_augmented"
    strong_model: "gpt-4"
    weak_model: "anyscale/mistralai/Mixtral-8x7B-Instruct-v0.1"

啟動(dòng)服務(wù)器：

python -m routellm.openai_server --routers mf --config config.yaml --port 8000

現(xiàn)在可以像使用OpenAI API一樣使用：

import openai

openai.api_base = "http://localhost:8000/v1"
openai.api_key = "PLACEHOLDER"

response = openai.ChatCompletion.create(
    model="router-mf-0.5",  # 使用路由器
    messages=[{"role": "user", "content": "你好"}]
)

LlamaIndex Router - 最靈活的路由框架

什么是LlamaIndex Router？

LlamaIndex提供了最靈活的路由框架，支持多種路由策略，可以路由到不同的查詢引擎、檢索器或工具。

基礎(chǔ)示例：多索引路由

from llama_index.core import VectorStoreIndex, SummaryIndex, Document
from llama_index.core.tools import QueryEngineTool
from llama_index.core.query_engine.router_query_engine import RouterQueryEngine
from llama_index.core.selectors import LLMSingleSelector

# 創(chuàng)建不同類型的索引
documents = [
    Document(text="公司2024年?duì)I收100億..."),
    Document(text="產(chǎn)品使用說(shuō)明..."),
    Document(text="技術(shù)文檔...")
]

# 向量索引 - 用于語(yǔ)義搜索
vector_index = VectorStoreIndex.from_documents(
    documents[:2]
)

# 摘要索引 - 用于總結(jié)
summary_index = SummaryIndex.from_documents(
    documents[2:]
)

# 創(chuàng)建查詢工具
vector_tool = QueryEngineTool.from_defaults(
    query_engine=vector_index.as_query_engine(),
    description="用于查找具體信息和事實(shí)"
)

summary_tool = QueryEngineTool.from_defaults(
    query_engine=summary_index.as_query_engine(),
    description="用于獲取總結(jié)和概覽"
)

# 創(chuàng)建路由查詢引擎
router_query_engine = RouterQueryEngine(
    selector=LLMSingleSelector.from_defaults(),
    query_engine_tools=[vector_tool, summary_tool]
)

# 使用路由器
response = router_query_engine.query("公司去年的營(yíng)收是多少？")  # -> 路由到vector_tool
response = router_query_engine.query("總結(jié)一下技術(shù)文檔")      # -> 路由到summary_tool

高級(jí)示例：多模態(tài)路由

from llama_index.core.query_engine import SimpleMultiModalQueryEngine
from llama_index.core.indices import MultiModalVectorStoreIndex

class MultiModalRouter:
    """多模態(tài)路由器"""
    
    def __init__(self):
        # 文本查詢引擎
        self.text_engine = self._create_text_engine()
        
        # 圖像查詢引擎
        self.image_engine = self._create_image_engine()
        
        # 混合查詢引擎
        self.hybrid_engine = self._create_hybrid_engine()
    
    def route(self, query: str, has_image: bool = False):
        """根據(jù)查詢類型路由"""
        
        # 檢測(cè)查詢意圖
        if any(word in query.lower() for word in ["圖片", "圖像", "照片", "看"]):
            return self.image_engine.query(query)
        elif has_image:
            return self.hybrid_engine.query(query)
        else:
            return self.text_engine.query(query)
    
    def _create_text_engine(self):
        # 創(chuàng)建文本查詢引擎
        pass
    
    def _create_image_engine(self):
        # 創(chuàng)建圖像查詢引擎
        pass
    
    def _create_hybrid_engine(self):
        # 創(chuàng)建混合查詢引擎
        pass

工具路由示例

from llama_index.core.tools import FunctionTool
from llama_index.core.agent import ReActAgent

# 定義工具函數(shù)
def search_product(product_name: str) -> str:
    """搜索產(chǎn)品信息"""
    # 實(shí)現(xiàn)產(chǎn)品搜索邏輯
    returnf"找到產(chǎn)品: {product_name}"

def calculate_price(quantity: int, unit_price: float) -> float:
    """計(jì)算總價(jià)"""
    return quantity * unit_price

def check_inventory(product_id: str) -> int:
    """檢查庫(kù)存"""
    # 實(shí)現(xiàn)庫(kù)存查詢
    return100# 示例返回值

# 創(chuàng)建工具
tools = [
    FunctionTool.from_defaults(
        fn=search_product,
        description="搜索產(chǎn)品信息"
    ),
    FunctionTool.from_defaults(
        fn=calculate_price,
        description="計(jì)算價(jià)格"
    ),
    FunctionTool.from_defaults(
        fn=check_inventory,
        description="檢查庫(kù)存數(shù)量"
    )
]

# 創(chuàng)建智能代理（自動(dòng)路由到合適的工具）
agent = ReActAgent.from_tools(
    tools,
    verbose=True
)

# 使用代理
response = agent.chat("iPhone 15 Pro有貨嗎？")  # 自動(dòng)路由到check_inventory
response = agent.chat("10個(gè)單價(jià)99元的商品總價(jià)是多少？")  # 自動(dòng)路由到calculate_price

三種方案對(duì)比與選擇建議

性能與特性對(duì)比

特性	Semantic Router	RouteLLM	LlamaIndex Router
主要優(yōu)勢(shì)	速度最快(<10ms)	成本優(yōu)化(省85%)	功能最全面
適用場(chǎng)景	實(shí)時(shí)路由	API成本控制	復(fù)雜查詢系統(tǒng)
學(xué)習(xí)曲線	簡(jiǎn)單	中等	較復(fù)雜
本地部署	支持	支持	支持
向量數(shù)據(jù)庫(kù)	支持	不支持	支持
多模態(tài)	實(shí)驗(yàn)性	不支持	原生支持
成本監(jiān)控	無(wú)	內(nèi)置	需自建
生產(chǎn)就緒	?????	????	????

選擇決策

你的主要需求是什么？
│
├─ 需要極快的響應(yīng)速度？(<50ms)
│  └─ 選擇 Semantic Router
│
├─ 需要控制API成本？
│  └─ 選擇 RouteLLM
│
├─ 需要復(fù)雜的查詢能力？
│  ├─ 需要多模態(tài)？
│  │  └─ 選擇 LlamaIndex
│  └─ 只需要文本？
│     └─ 選擇 Semantic Router + LlamaIndex 組合
│
└─ 需要簡(jiǎn)單快速上線？
   └─ 選擇 Semantic Router

生產(chǎn)環(huán)境最佳實(shí)踐

1. 組合使用方案

class HybridRouter:
    """混合路由器 - 結(jié)合多個(gè)開(kāi)源方案的優(yōu)勢(shì)"""
    
    def __init__(self):
        # 第一層：Semantic Router處理常見(jiàn)查詢（最快）
        self.semantic_router = self._init_semantic_router()
        
        # 第二層：RouteLLM處理復(fù)雜查詢（成本優(yōu)化）
        self.cost_router = self._init_routellm()
        
        # 第三層：LlamaIndex處理專業(yè)查詢（功能強(qiáng)大）
        self.index_router = self._init_llamaindex()
    
    asyncdef route(self, query: str, context: dict = None):
        """三層路由策略"""
        
        # 1. 嘗試快速語(yǔ)義路由
        semantic_result = self.semantic_router(query)
        if semantic_result.confidence > 0.8:
            return self.handle_semantic_result(semantic_result)
        
        # 2. 評(píng)估查詢復(fù)雜度，決定是否需要貴模型
        if self.is_complex_query(query):
            returnawait self.cost_router.route_complex(query)
        
        # 3. 對(duì)于需要檢索的查詢，使用LlamaIndex
        if self.needs_retrieval(query):
            return self.index_router.query(query)
        
        # 默認(rèn)處理
        return self.default_handler(query)

2. 監(jiān)控與可觀測(cè)性

import time
from prometheus_client import Counter, Histogram, Gauge

# Prometheus指標(biāo)
route_counter = Counter('routing_total', 'Total routing requests', ['router', 'route'])
route_latency = Histogram('routing_latency_seconds', 'Routing latency', ['router'])
route_errors = Counter('routing_errors_total', 'Routing errors', ['router', 'error_type'])

def monitor_routing(router_name: str):
    """路由監(jiān)控裝飾器"""
    def decorator(func):
        def wrapper(*args, **kwargs):
            start = time.time()
            try:
                result = func(*args, **kwargs)
                route_counter.labels(router=router_name, route=result.get('route', 'unknown')).inc()
                return result
            except Exception as e:
                route_errors.labels(router=router_name, error_type=type(e).__name__).inc()
                raise
            finally:
                route_latency.labels(router=router_name).observe(time.time() - start)
        return wrapper
    return decorator

# 使用監(jiān)控
@monitor_routing("semantic_router")
def semantic_route(query):
    return router(query)

本文轉(zhuǎn)載自??AI 博物院?? 作者：longyunfeigu

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2025-9-9 08:40:17修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

谷歌更新Transformer架構(gòu)，更節(jié)省計(jì)算資源！50%性能提升

Crystalcxt ? 4387瀏覽 ? 0回復(fù)
又又又又翻車(chē)！谷歌新AI功能再遭公眾批評(píng)，稱前總統(tǒng)奧巴馬是穆斯林，“承認(rèn)谷歌違反反壟斷法”

51CTO技術(shù)棧 ? 3504瀏覽 ? 0回復(fù)
如何在保證模型性能條件下優(yōu)化Prompt降低使用成本及響應(yīng)延遲？

Syrupup ? 5080瀏覽 ? 0回復(fù)
混合模型：HybridLLM、RouterLLM 等優(yōu)化 LLM 推理成本的新思路

amei2000go ? 8603瀏覽 ? 0回復(fù)
利用多Lora節(jié)省大模型部署成本

卓勝微wjp ? 4079瀏覽 ? 0回復(fù)
Agent的進(jìn)化：RAISE如何讓AI更聰明？

探索AGI ? 4690瀏覽 ? 0回復(fù)
Agent工作流記憶 - 讓AI助手更聰明地完成復(fù)雜任務(wù)

芝士AI吃魚(yú) ? 4782瀏覽 ? 0回復(fù)
人工智能的新突破：StructRAG框架如何讓大型語(yǔ)言模型更聰明？

Halo咯咯 ? 4471瀏覽 ? 0回復(fù)
大推理模型DeepSeek-R1深度解讀：成本降低95%，推動(dòng)語(yǔ)言模型推理效率新高度

風(fēng)云2002_1 ? 1.4w瀏覽 ? 0回復(fù)
低成本+高性能+超靈活！Deepseek 671B + Milvus 重新定義知識(shí)庫(kù)搭建！

玄姐聊AGI ? 7111瀏覽 ? 0回復(fù)
比GraphRAG更懂“思考”，微軟又開(kāi)源PIKE-RAG：主打復(fù)雜私域知識(shí)理解和推理

PaperAgent ? 6314瀏覽 ? 0回復(fù)
新的推理模型編碼能力爆表！是的，那個(gè)王，他又回來(lái)了！

老蛀蟲(chóng) ? 3744瀏覽 ? 0回復(fù)
【AI 界大地震】AMD 開(kāi)源 30 億參數(shù)大模型 Instella：性能碾壓同類，訓(xùn)練成本暴跌 80%？

Halo咯咯 ? 3129瀏覽 ? 0回復(fù)
阿里Qwen家族又添猛將！Qwen2.5-Omni能看能聽(tīng)能說(shuō)能寫(xiě)，性能超越Gemini，視頻實(shí)時(shí)互動(dòng)

老蛀蟲(chóng) ? 3644瀏覽 ? 0回復(fù)
大型語(yǔ)言模型的推理經(jīng)濟(jì)學(xué)：平衡性能與計(jì)算成本的新范式

頓數(shù)AI ? 2980瀏覽 ? 0回復(fù)
讓AI讀懂PPT圖表！RAG系統(tǒng)從60分到95分的進(jìn)化之路，LlamaParse+多模態(tài)實(shí)戰(zhàn)全解析

AI博物院 ? 3620瀏覽 ? 0回復(fù)
AI 成本賬：LLM 推理成本鏈條分析

amei2000go ? 1944瀏覽 ? 0回復(fù)
天津大學(xué) MicroMix 技術(shù)揭秘：給大模型裝個(gè)混合精度 “智能壓縮包”，讓 AI 又快又聰明

十一月雨_55 ? 2528瀏覽 ? 0回復(fù)
算力成本大降！馬爾可夫思考機(jī)讓LLM推理成本直接降為線性

柏企閱文 ? 1401瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

告別上下文溢出！用DeepAgents+DeepSeek快速構(gòu)建具備網(wǎng)絡(luò)搜索能力的AI研究助手 4天前發(fā)布
用AI交差，讓同事擦屁股？警惕工作中的“AI垃圾” 2025-10-23 09:32:13發(fā)布

熱門(mén)推薦

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁(yè)P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

拯救老項(xiàng)目！比Cursor更細(xì)、比spec-kit更輕：OpenSpec如何顛覆AI編程工作流？ 0回復(fù)

阿里新一代企業(yè)級(jí)多 AI 智能體開(kāi)發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對(duì)比，你的選擇是？ 0回復(fù)

DeepSeek 成長(zhǎng)史：從量化投資到 AI 革命的一個(gè) “非主流” 量化大佬的 AI 夢(mèng) 0回復(fù)

上一篇： LangGraph + 多Agent系統(tǒng)實(shí)戰(zhàn)：上下文工程才是智能協(xié)作的核心基建

下一篇：報(bào)告生成質(zhì)量提升300%！玩轉(zhuǎn)LangChain Open Deep Research：快速部署+避坑指南+幻覺(jué)分析

社區(qū)精華內(nèi)容

目錄

<tt id="hk5hy"><b id="hk5hy"></b></tt><nav id="hk5hy"><strong id="hk5hy"></strong></nav>

<strong id="hk5hy"><label id="hk5hy"></label></strong>