偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Docker三分鐘搞定LLama3開(kāi)源大模型本地部署

人工智能
LLaMA-3模型分為不同規(guī)模的版本,包括小型、中型和大型,以適應(yīng)不同的應(yīng)用需求和計(jì)算資源。小型模型參數(shù)規(guī)模為8B,中型模型參數(shù)規(guī)模為70B,而大型模型則達(dá)到400B,仍在訓(xùn)練中,目標(biāo)是實(shí)現(xiàn)多模態(tài)、多語(yǔ)言的功能,預(yù)計(jì)效果將與GPT 4/GPT 4V相當(dāng)。

概述

LLaMA-3(Large Language Model Meta AI 3)是由Meta公司開(kāi)發(fā)的大型開(kāi)源生成式人工智能模型。它在模型結(jié)構(gòu)上與前一代LLaMA-2相比沒(méi)有大的變動(dòng)。

LLaMA-3模型分為不同規(guī)模的版本,包括小型、中型和大型,以適應(yīng)不同的應(yīng)用需求和計(jì)算資源。小型模型參數(shù)規(guī)模為8B,中型模型參數(shù)規(guī)模為70B,而大型模型則達(dá)到400B,仍在訓(xùn)練中,目標(biāo)是實(shí)現(xiàn)多模態(tài)、多語(yǔ)言的功能,預(yù)計(jì)效果將與GPT 4/GPT 4V相當(dāng)。

安裝 Ollama

Ollama 是一個(gè)開(kāi)源的大型語(yǔ)言模型(LLM)服務(wù)工具,它允許用戶在本地機(jī)器上運(yùn)行和部署大型語(yǔ)言模型。Ollama 設(shè)計(jì)為一個(gè)框架,旨在簡(jiǎn)化在 Docker 容器中部署和管理大型語(yǔ)言模型的過(guò)程,使得這一過(guò)程變得簡(jiǎn)單快捷。用戶可以通過(guò)簡(jiǎn)單的命令行操作,快速在本地運(yùn)行如 Llama 3 這樣的開(kāi)源大型語(yǔ)言模型。

官網(wǎng)地址:https://ollama.com/download

圖片圖片

Ollama 支持多種平臺(tái),包括 Mac 和 Linux,并提供了 Docker 鏡像以簡(jiǎn)化安裝過(guò)程。用戶可以通過(guò)編寫(xiě) Modelfile 來(lái)導(dǎo)入和自定義更多的模型,這類似于 Dockerfile 的作用。Ollama 還具備一個(gè) REST API,用于運(yùn)行和管理模型,以及一個(gè)用于模型交互的命令行工具集。

Ollama服務(wù)啟動(dòng)日志

圖片圖片

模型管理

下載模型

ollama pull llama3:8b

默認(rèn)下載的是llama3:8b。這里冒號(hào)前面代表模型名稱,冒號(hào)后面代表tag,可以從這里查看llama3的所有tag

圖片圖片

模型測(cè)試

注意:如果想讓模型中文回復(fù),請(qǐng)先輸入:你好!請(qǐng)中文回復(fù)

圖片圖片

配置Open-WebUI

在CPU下運(yùn)行

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

圖片圖片

訪問(wèn)

輸入地址 http://127.0.0.1:3000 進(jìn)行訪問(wèn)

圖片圖片

初次訪問(wèn)需要注冊(cè),這里我注冊(cè)一個(gè)賬號(hào),注冊(cè)完成登錄成功

圖片圖片

切換中文語(yǔ)言

圖片圖片

下載llama3:8b模型

llama3:8b

圖片圖片

下載完成

圖片圖片

使用

選擇模型

圖片圖片

使用模型

圖片圖片

注意:如果想讓模型中文回復(fù),請(qǐng)先輸入:你好!請(qǐng)中文回復(fù)

圖片圖片

內(nèi)存

圖片 圖片

責(zé)任編輯:武曉燕 來(lái)源: 開(kāi)源技術(shù)小棧
相關(guān)推薦

2024-04-30 08:28:44

開(kāi)源大模型Llama

2025-05-07 00:10:00

2009-11-05 16:04:19

Oracle用戶表

2022-01-05 18:18:01

Flink 數(shù)倉(cāng)連接器

2020-11-20 08:36:59

Jpa數(shù)據(jù)代碼

2024-07-05 09:31:37

2021-12-17 07:47:37

IT風(fēng)險(xiǎn)框架

2022-03-26 09:06:40

ActorCSP模型

2023-11-23 19:26:43

2024-05-16 11:13:16

Helm工具release

2009-11-09 12:55:43

WCF事務(wù)

2024-12-18 10:24:59

代理技術(shù)JDK動(dòng)態(tài)代理

2022-02-16 19:42:25

Spring配置開(kāi)發(fā)

2023-11-26 00:30:05

2024-01-16 07:46:14

FutureTask接口用法

2021-04-20 13:59:37

云計(jì)算

2022-02-17 09:24:11

TypeScript編程語(yǔ)言javaScrip

2024-08-30 08:50:00

2023-12-27 08:15:47

Java虛擬線程

2009-11-12 09:16:15

ADO.NET數(shù)據(jù)庫(kù)連
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)