偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專(zhuān)業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

把AI裝進(jìn)數(shù)據(jù)庫(kù)：PostgresML和Korvus的新思路

發(fā)布于 2025-9-23 07:03

瀏覽

0收藏

當(dāng)下機(jī)器學(xué)習(xí)應(yīng)用開(kāi)發(fā)就像是接力賽：從數(shù)據(jù)庫(kù)取數(shù)據(jù)，傳到應(yīng)用服務(wù)器，再送到 ML 服務(wù)，處理完原路返回。每一棒都是延遲。更別提，開(kāi)發(fā)者還需在SQL和應(yīng)用代碼之間不斷“翻譯”，這無(wú)形中增加了認(rèn)知負(fù)荷和工程的復(fù)雜度。

這時(shí)候，生態(tài)無(wú)比繁榮的開(kāi)源數(shù)據(jù)庫(kù) Postgres 再次帶來(lái)了驚喜，PostgresML 團(tuán)隊(duì)直接讓 AI 模型跑在數(shù)據(jù)庫(kù)中。

把AI裝進(jìn)數(shù)據(jù)庫(kù)：PostgresML和Korvus的新思路-AI.x社區(qū)

今天我們就介紹這個(gè)體系的兩個(gè)關(guān)鍵項(xiàng)目：PostgresML和Korvus。這兩個(gè)項(xiàng)目的關(guān)系很清晰，PostgresML作為底層，用 Rust 編寫(xiě)，提供 pgml schema 下的各種函數(shù)，能夠處理模型加載、GPU 調(diào)度、向量運(yùn)算等任務(wù)。而Korvus基于此對(duì)外提供各種語(yǔ)言（ Python、JavaScript、Rust、C等）的SDK封裝。這樣的組合，顯而易見(jiàn)降低了復(fù)雜度。

傳統(tǒng) RAG 架構(gòu)：

用戶(hù)請(qǐng)求 → API服務(wù)器 → 向量數(shù)據(jù)庫(kù) → API服務(wù)器 → LLM服務(wù) → API服務(wù)器 → 用戶(hù)

PostgresML + Korvus：

用戶(hù)請(qǐng)求 → Postgres（包含所有處理） → 用戶(hù)

PostgresML：數(shù)據(jù)庫(kù)即 AI 運(yùn)行時(shí)

PostgresML 是一個(gè) Postgres 擴(kuò)展，讓數(shù)據(jù)庫(kù)具備了完整的機(jī)器學(xué)習(xí)能力。

安裝后，你可以在 SQL 里直接訓(xùn)練模型：

-- 訓(xùn)練分類(lèi)模型
SELECT * FROM pgml.train(
    'Handwritten Digit Image Classifier',
    algorithm => 'xgboost',
    'classification',
    'pgml.digits',
    'target'
);

-- 預(yù)測(cè)
SELECT pgml.predict(
    'My Classification Project',
    ARRAY[0.1, 2.0, 5.0]
) AS prediction;

更強(qiáng)大的是深度學(xué)習(xí)支持。PostgresML 集成了 Hugging Face 模型庫(kù)，可以直接在數(shù)據(jù)庫(kù)內(nèi)運(yùn)行大語(yǔ)言模型：

-- 生成文本
SELECT pgml.transform(
    task => 'text-generation',
    inputs => ARRAY['Once upon a time'],
    args => '{"model": "gpt2"}'
);

-- 文本嵌入
SELECT pgml.embed(
    'sentence-transformers/all-MiniLM-L6-v2',
    'PostgresML is bringing AI to the database'
);

關(guān)鍵特性：

47 種機(jī)器學(xué)習(xí)算法
GPU 加速推理
支持 Hugging Face 上的預(yù)訓(xùn)練模型
內(nèi)置向量數(shù)據(jù)庫(kù)功能（基于 pgvector）
推理速度比 HTTP 服務(wù)快 8-40 倍

這個(gè)性能提升來(lái)自幾個(gè)方面：沒(méi)有網(wǎng)絡(luò)開(kāi)銷(xiāo)、沒(méi)有序列化成本、數(shù)據(jù)和計(jì)算在同一進(jìn)程。

Korvus：讓 RAG 變成一條 SQL

有了 PostgresML 的基礎(chǔ)能力，團(tuán)隊(duì)進(jìn)一步開(kāi)發(fā)了 Korvus。如果說(shuō) PostgresML 是引擎，Korvus 就是為 RAG 場(chǎng)景優(yōu)化的 SDK。

Korvus 的核心理念："One query to rule them all"。整個(gè) RAG 流程壓縮成一個(gè)數(shù)據(jù)庫(kù)查詢(xún)。

把AI裝進(jìn)數(shù)據(jù)庫(kù)：PostgresML和Korvus的新思路-AI.x社區(qū)

看一個(gè)完整例子：

from korvus import Collection, Pipeline
import asyncio

# 1. 初始化
collection = Collection("korvus-demo-v0")
pipeline = Pipeline(
    "v1",
    {
        "text": {
            "splitter": {"model": "recursive_character"},
            "semantic_search": {"model": "Alibaba-NLP/gte-base-en-v1.5"},
        }
    },
)

# 2. 添加pipeline
await collection.add_pipeline(pipeline)

# 3. 插入文檔
documents = [
    {"id": "1", "text": "Korvus is incredibly fast and easy to use."},
    {"id": "2", "text": "Tomatoes are incredible on burgers."},
]
await collection.upsert_documents(documents)

# 4. RAG查詢(xún) - 這里是關(guān)鍵
results = await collection.rag({
    "CONTEXT": {
        "vector_search": {
            "query": {"fields": {"text": {"query": "Is Korvus fast?"}}},
            "limit": 1
        },
        "aggregate": {"join": "\n"}
    },
    "chat": {
        "model": "meta-llama/Meta-Llama-3-8B-Instruct",
        "messages": [
            {
                "role": "system",
                "content": "You are a friendly assistant"
            },
            {
                "role": "user",
                "content": "Given the context:\n{CONTEXT}\nAnswer the question: Is Korvus fast?"
            }
        ],
        "max_tokens": 100
    }
}, pipeline)

這一個(gè)??rag()??調(diào)用在數(shù)據(jù)庫(kù)內(nèi)完成了：

將查詢(xún)文本向量化
在向量索引中搜索相似文檔
聚合搜索結(jié)果作為上下文
調(diào)用 LLM 生成回答

沒(méi)有外部 API，沒(méi)有多次往返，就是一個(gè)查詢(xún)。

部署和使用

最簡(jiǎn)單的方式是 Docker：

docker run \
    -it \
    -v postgresml_data:/var/lib/postgresql \
    -p 5433:5432 \
    -p 8000:8000 \
    ghcr.io/postgresml/postgresml:2.10.0 \
    sudo -u postgresml psql -d postgresml

或者使用 PostgresML Cloud，免費(fèi) tier 就提供 GPU 訪問(wèn)。

對(duì)于 Korvus，安裝后只需設(shè)置數(shù)據(jù)庫(kù)連接：

pip install korvus
export KORVUS_DATABASE_URL="postgresql://..."

小結(jié)

PostgresML 提供基礎(chǔ)能力，Korvus 簡(jiǎn)化使用體驗(yàn)，兩者結(jié)合讓"在 SQL 里跑 AI"從技術(shù)可能變成了工程現(xiàn)實(shí)，大大降低了開(kāi)發(fā)者上手 AI 的門(mén)檻。

“后端即服務(wù)”、“數(shù)據(jù)庫(kù)即服務(wù)”、“表格即服務(wù)”越來(lái)越流行，這背后其實(shí)是一種趨勢(shì)，大家越來(lái)越關(guān)注如何用最簡(jiǎn)單的方式解決問(wèn)題，而不是為了技術(shù)而技術(shù)。

github：

??https://github.com/postgresml/postgresml??

??https://github.com/postgresml/korvus??

本文轉(zhuǎn)載自??AI工程化??，作者：ully

標(biāo)簽

數(shù)據(jù)庫(kù)

已于2025-9-23 07:03:16修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

長(zhǎng)文本殺不死RAG：SQL+向量驅(qū)動(dòng)大模型和大數(shù)據(jù)新范式，MyScale AI數(shù)據(jù)庫(kù)正式開(kāi)源

輕薄滴假象 ? 4951瀏覽 ? 0回復(fù)
Advanced RAG 07：在 RAG 系統(tǒng)中進(jìn)行表格數(shù)據(jù)處理的新思路

Baihai_IDP ? 7419瀏覽 ? 0回復(fù)
怎么看大模型、RAG、Agent、知識(shí)庫(kù)、向量數(shù)據(jù)庫(kù)、知識(shí)圖譜、AGI的區(qū)別和聯(lián)系？

玄姐聊AGI ? 8014瀏覽 ? 0回復(fù)
一文搞懂大模型、RAG、函數(shù)調(diào)用、Agent、知識(shí)庫(kù)、向量數(shù)據(jù)庫(kù)、知識(shí)圖譜、AGI的區(qū)別和聯(lián)系??！

玄姐聊AGI ? 1.8w瀏覽 ? 0回復(fù)
一文搞懂大模型、RAG、函數(shù)調(diào)用、Agent、知識(shí)庫(kù)、向量數(shù)據(jù)庫(kù)、知識(shí)圖譜、AGI的區(qū)別和聯(lián)系！！

玄姐聊AGI ? 5286瀏覽 ? 0回復(fù)
用 Dify 和 Notion 打造輕量級(jí)金融數(shù)據(jù)庫(kù)

開(kāi)發(fā)者阿橙 ? 6025瀏覽 ? 0回復(fù)
LangChain-RAG必備：向量數(shù)據(jù)庫(kù)如何CRUD

ermulong ? 4000瀏覽 ? 0回復(fù)
RAG與本地知識(shí)庫(kù)，向量數(shù)據(jù)庫(kù)，以及知識(shí)圖譜的聯(lián)系與區(qū)別

AI探索時(shí)代 ? 7311瀏覽 ? 0回復(fù)
利用Milvus向量數(shù)據(jù)庫(kù)，帶你實(shí)現(xiàn)GraphRAG

AI科技論談 ? 4275瀏覽 ? 0回復(fù)
基于LangChain和云原生向量數(shù)據(jù)庫(kù)Milvus開(kāi)發(fā)混合搜索AI程序

51CTO內(nèi)容精選 ? 4613瀏覽 ? 0回復(fù)
大模型檢索增強(qiáng)生成之向量數(shù)據(jù)庫(kù)的問(wèn)題

AI探索時(shí)代 ? 3631瀏覽 ? 0回復(fù)
LanceDB：為 AI 應(yīng)用打造的高效嵌入式向量數(shù)據(jù)庫(kù)

Syrupup ? 1.2w瀏覽 ? 0回復(fù)
怎么提升向量數(shù)據(jù)庫(kù)的召回準(zhǔn)確率

AI探索時(shí)代 ? 4282瀏覽 ? 0回復(fù)
別再將LLM當(dāng)成數(shù)據(jù)庫(kù)了

51CTO內(nèi)容精選 ? 3663瀏覽 ? 0回復(fù)
圖數(shù)據(jù)庫(kù)的剪枝在大型語(yǔ)言模型中的知識(shí)表示

51CTO內(nèi)容精選 ? 2789瀏覽 ? 0回復(fù)
向量數(shù)據(jù)庫(kù)真的能滿足所有 AI Agent 的記憶需求嗎？

Baihai_IDP ? 3898瀏覽 ? 0回復(fù)
RAG實(shí)戰(zhàn) | 向量數(shù)據(jù)庫(kù)LanceDB指南

周末程序猿 ? 3745瀏覽 ? 0回復(fù)
AI 智能體應(yīng)用的向量數(shù)據(jù)庫(kù)如何選型？

玄姐聊AGI ? 2895瀏覽 ? 0回復(fù)
沒(méi)必要二選一：DeepSeek-V3.1 把“思考模式”和“效率模式”裝進(jìn)同一模型

Halo咯咯 ? 7934瀏覽 ? 0回復(fù)

這個(gè)用戶(hù)很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Glyph：文本轉(zhuǎn)圖片解決長(zhǎng)上下文困境，智譜把“DeepSeek-OCR”具像化了 3天前發(fā)布
LangChain提出Agent工程化的新分層（Agent harness） 3天前發(fā)布

熱門(mén)推薦

阿里新一代企業(yè)級(jí)多 AI 智能體開(kāi)發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁(yè)P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對(duì)比，你的選擇是？ 0回復(fù)

DeepSeek 成長(zhǎng)史：從量化投資到 AI 革命的一個(gè) “非主流” 量化大佬的 AI 夢(mèng) 0回復(fù)

DeepSeek團(tuán)隊(duì)開(kāi)源新模型DeepSeek-OCR，用3B參數(shù)量實(shí)現(xiàn)10倍文本壓縮的多模態(tài)突破 0回復(fù)

上一篇： Memori：用 SQL 給 AI 加上記憶

下一篇： Pepper：開(kāi)源版的 ChatGPT Pulse

社區(qū)精華內(nèi)容

目錄

<thead id="wl5s0"></thead>

<em id="wl5s0"><b id="wl5s0"></b></em>

<cite id="wl5s0"><dl id="wl5s0"></dl></cite>