偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

英偉達預(yù)告新版 TensorRT-LLM:推理能力飆升 5 倍、8GB 以上顯卡可本地運行,支持 OpenAI 的 Chat API

人工智能
英偉達在今天 Ignite 2023 大會上,宣布更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增強 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。

11 月 16 日消息,微軟 Ignite 2023 大會已于今天拉開帷幕,英偉達高管出席本次大會并宣布更新 TensorRT-LLM,添加了對 OpenAI Chat API 的支持。

IT之家今年 10 月報道,英偉達面向數(shù)據(jù)中心和 Windows PC,推出 Tensor RT-LLM 開源庫。最大的特點是,如果 Windows PC 配備英偉達 GeForce RTX GPU,TensorRT-LLM 可以讓 LLM 在 Windows PC 上的運行速度提高四倍。

英偉達在今天 Ignite 2023 大會上,宣布更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增強 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。

TensorRT-LLM 可以通過英偉達的 AI Workbench 在本地完成,開發(fā)者可以使用這個統(tǒng)一、易用的工具包,在 PC 或工作站上快速創(chuàng)建、測試和定制預(yù)訓(xùn)練的生成式 AI 模型和 LLM。英偉達還為此推出了搶先體驗注冊頁面。

英偉達將于本月晚些時候發(fā)布 TensorRT-LLM 0.6.0 版本更新,推理性能提高 5 倍,并支持 Mistral 7B 和 Nemotron-3 8B 等其它主流 LLM。

用戶可以在 8GB 顯存以上的  GeForce RTX 30 系列和 40 系列 GPU 上運行,一些便攜式 Windows 設(shè)備也能使用快速、準(zhǔn)確的本地 LLM 功能。

責(zé)任編輯:龐桂玉 來源: IT之家
相關(guān)推薦

2023-09-10 12:37:38

模型英偉達

2024-02-01 08:34:30

大模型推理框架NVIDIA

2024-02-04 00:00:00

Triton格式TensorRT

2024-10-22 09:17:07

2023-02-15 07:50:40

英偉達顯卡RTX

2024-12-05 13:50:00

AI大模型

2023-03-22 13:53:26

芯片英偉達

2024-10-21 10:20:00

訓(xùn)練模型

2024-12-18 14:30:00

數(shù)據(jù)訓(xùn)練AI

2024-12-26 16:00:00

英特爾推理模型

2025-03-25 12:49:25

2025-04-27 09:15:40

2023-10-06 13:22:50

自動駕駛技術(shù)

2018-08-16 11:09:03

SSDTLCQLC

2025-06-04 13:56:06

英偉達訓(xùn)練模型

2015-08-07 09:34:44

AMDLinux

2024-02-05 13:09:00

AI數(shù)據(jù)

2024-07-29 08:19:00

服務(wù)引擎

2022-09-21 18:41:15

英偉達顯卡

2024-11-28 16:45:50

點贊
收藏

51CTO技術(shù)棧公眾號