偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<kbd id="tb0j0"><form id="tb0j0"></form></kbd>

<u id="tb0j0"></u>

<code id="tb0j0"><strong id="tb0j0"></strong></code>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

如何在本地運(yùn)行量化版的DeepSeek-R1-0528？原創(chuàng)

51CTO內(nèi)容精選

發(fā)布于 2025-6-16 08:08

瀏覽

0收藏

本文介紹了使用Ollama和WebUI 在本地運(yùn)行量化版的 DeepSeek-R1-0528 模型。

DeepSeek-R1-0528是DeepSeek R1 推理模型的最新版本，需要715GB的磁盤空間，使其成為市面上最大的開源模型之一。然而由于來自Unsloth 的先進(jìn)的量化技術(shù)，該模型的大小可以縮減至162GB，整整縮減了80%。這使得用戶能夠以顯著降低的硬件要求體驗(yàn)?zāi)Ｐ偷娜抗δ?，盡管性能略有下降。

在本教程中，我們將：

設(shè)置Ollama和Open Web UI，以便在本地運(yùn)行DeepSeek-R1-0528 模型。
下載并配置該模型的 1.78 位量化版（IQ1_S）。
使用GPU + CPU和純CPU兩種配置環(huán)境運(yùn)行該模型。

先決條件?

要運(yùn)行IQ1_S 量化版本，你的系統(tǒng)必須滿足以下要求：

GPU要求：至少1個(gè)24GB GPU（比如英偉達(dá)RTX 4090或A6000）和128GB RAM。在此配置下，預(yù)期生成速度約為每秒5個(gè)token。
RAM要求：運(yùn)行該模型至少需要64GB RAM；可以不使用 GPU 運(yùn)行該模型，但性能將限制為每秒1個(gè)token。
最佳設(shè)置：為了獲得最佳性能（每秒5個(gè)以上token），你至少需要180GB的統(tǒng)一內(nèi)存或180GB的RAM + VRAM組合內(nèi)存。
存儲(chǔ)：確保你至少有200GB的可用磁盤空間用于模型及其依賴項(xiàng)。

第1步：安裝依賴項(xiàng)和Ollama

更新你的系統(tǒng)并安裝所需的工具。Ollama是一款輕量級(jí)服務(wù)器，用于在本地運(yùn)行大語言模型。在Ubuntu 發(fā)行版上使用以下命令安裝它：

apt-get update
apt-get install pciutils -y
curl -fsSL https://ollama.com/install.sh | sh

第2步：下載并運(yùn)行模型

使用以下命令運(yùn)行DeepSeek-R1-0528 模型的 1.78 位量化版本（IQ1_S）：

ollama serve &
ollama run hf.co/unsloth/DeepSeek-R1-0528-GGUF:TQ1_0

如何在本地運(yùn)行量化版的DeepSeek-R1-0528？-AI.x社區(qū)

第3步：設(shè)置并運(yùn)行Open Web UI

拉取支持CUDA的Open Web UI Docker鏡像。運(yùn)行支持GPU并集成Ollama的Open Web UI 容器。

該命令將：

在8080端口啟動(dòng)Open Web UI服務(wù)器
使用--gpus all 標(biāo)志，啟用GPU加速
掛載必要的數(shù)據(jù)目錄（-v open-webui:/app/backend/data）

docker pull ghcr.io/open-webui/open-webui:cuda
docker run -d -p 9783:8080 -v open-webui:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:cuda

一旦容器運(yùn)行，在瀏覽器中訪問Open Web UI 界面：http://localhost:8080/。

第4步：在Open Web UI中運(yùn)行DeepSeek R1 0528

從模型菜單中選擇hf.co/unsloth/DeepSeek-R1-0528-GGUF:TQ1_0模型。

如何在本地運(yùn)行量化版的DeepSeek-R1-0528？-AI.x社區(qū)

如果Ollama服務(wù)器無法正確使用GPU，你可以切換到CPU執(zhí)行。雖然這會(huì)顯著降低性能（大約每秒1個(gè)token），但可以確保模型仍然能夠運(yùn)行。

# Kill any existing Ollama processes
pkill ollama 

# Clear GPU memory
sudo fuser -v /dev/nvidia* 

# Restart Ollama service
CUDA_VISIBLE_DEVICES="" ollama serve

一旦模型運(yùn)行，你可以通過Open Web UI與其交互。但請(qǐng)注意，由于缺乏GPU加速，速度將被限制為每秒1個(gè)token。

如何在本地運(yùn)行量化版的DeepSeek-R1-0528？-AI.x社區(qū)

結(jié)語?

即使運(yùn)行量化版本也頗具挑戰(zhàn)性。你需要快速的網(wǎng)絡(luò)連接來下載模型，如果下載失敗，必須從頭開始整個(gè)過程。我在試著在GPU上運(yùn)行時(shí)也遇到了很多問題，我一直收到與VRAM 不足相關(guān)的GGUF錯(cuò)誤。盡管嘗試了幾種常見的GPU錯(cuò)誤修復(fù)方法，但都不起作用，于是我最終把一切都切換到了CPU。雖然這確實(shí)有效，但現(xiàn)在模型僅僅生成響應(yīng)就需要大約10分鐘，這遠(yuǎn)非理想狀態(tài)。

我相信肯定有更好的解決方案，比如使用llama.cpp，但相信我，我花了一整天才讓它運(yùn)行起來。

原文標(biāo)題：??Run the Full DeepSeek-R1-0528 Model Locally??，作者：Abid Ali Awan

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

如何借助Cortex運(yùn)行本地LLM

51CTO內(nèi)容精選 ? 3403瀏覽 ? 0回復(fù)
解密o1推理過程！DeepSeek-R1-Lite預(yù)覽版上線

kede96 ? 4293瀏覽 ? 0回復(fù)
如何在安卓手機(jī)上本地安裝和運(yùn)行LLM?

51CTO內(nèi)容精選 ? 1.4w瀏覽 ? 0回復(fù)
DeepSeek-R1 + RooCline：極佳的強(qiáng)化學(xué)習(xí)AI編碼代理！對(duì)標(biāo)o1、蒸餾小模型本地部署

老蛀蟲 ? 5105瀏覽 ? 0回復(fù)
DeepSeek-AI 發(fā)布 DeepSeek-R1-Zero 和 DeepSeek-R1

Halo咯咯 ? 5851瀏覽 ? 0回復(fù)
手把手教你將本地部署的DeepSeek R1集成到Dify

AIGC新知 ? 7221瀏覽 ? 0回復(fù)
手把手教你在本地部署 DeepSeek R1，并集成到 Dify 中，建議收藏！

玄姐聊AGI ? 1.4w瀏覽 ? 0回復(fù)
如何運(yùn)用DeepSeek R1構(gòu)建一款全棧簡(jiǎn)歷篩選應(yīng)用

51CTO內(nèi)容精選 ? 4806瀏覽 ? 0回復(fù)
如何利用 DeepSeek-R1 本地部署強(qiáng)大的推理模型：從 ChatGPT 風(fēng)格界面到 API 集成

Halo咯咯 ? 5161瀏覽 ? 0回復(fù)
4090單卡跑滿血版DeepSeek-R1，清華團(tuán)隊(duì)開源項(xiàng)目再破大模型推理門檻

Crystalcxt ? 3752瀏覽 ? 0回復(fù)
Deepseek AI模型本地部署步驟簡(jiǎn)記：ollama + deepseek-r1 + 本地AI模型的Web UI

lintoms ? 4705瀏覽 ? 0回復(fù)
Deepseek AI模型本地部署步驟簡(jiǎn)記：ollama + deepseek-r1 + 本地AI模型的Web UI

parson2000 ? 4266瀏覽 ? 0回復(fù)
通過LM Studio本地私有化部署DeepSeek-R1模型，無網(wǎng)絡(luò)也能用

鴻花粉H ? 1.1w瀏覽 ? 0回復(fù)
輕量化AI的崛起：蒸餾模型如何在資源有限中大放異彩

Halo咯咯 ? 4074瀏覽 ? 0回復(fù)
M3芯片+Ollama本地部署DeepSeek R1：小白也能玩轉(zhuǎn)AI推理

zhishan15 ? 3411瀏覽 ? 0回復(fù)
AI大模型本地化方案：Xinference 本地運(yùn)行大模型

風(fēng)云2002_1 ? 6501瀏覽 ? 0回復(fù)
DeepSeek R1 & R2 技術(shù)原理

ceesoft ? 6317瀏覽 ? 0回復(fù)
DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當(dāng)，實(shí)測(cè)來了

老蛀蟲 ? 1.0w瀏覽 ? 0回復(fù)
Deepseek R1 0528實(shí)測(cè)：性能直逼頂尖，普通電腦本地運(yùn)行全攻略

凝固的雨_1 ? 1.2w瀏覽 ? 0回復(fù)

51CTO內(nèi)容精選

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

如何使用n8n構(gòu)建AI工作流 2h前發(fā)布
RAS 革命：從 RAG 到結(jié)構(gòu)化知識(shí)增強(qiáng)，破解 LLM 短板的新范式 3天前發(fā)布

熱門推薦

阿里新一代企業(yè)級(jí)多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

別再怪AI“聽不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對(duì)話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對(duì)比，你的選擇是？ 0回復(fù)

上一篇：馴服AI幻覺：通過人在循環(huán)（HITL）測(cè)試減輕AI應(yīng)用中的幻覺

下一篇： OpenAI?o3?pro?vs?Gemini?2.5?pro：得分相差不大，更推薦使用Gemini 2.5 Pro

社區(qū)精華內(nèi)容

目錄

<u id="mqnzo"><rp id="mqnzo"></rp></u>