偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

DPG-Bench榜首!智譜開源文生圖模型CogView4:支持中英文輸入和生成,免費商用授權!

人工智能 新聞
今年,圖像模型領域終于迎來了新的突破,而CogView4無疑是這場變革中的佼佼者。

在圖像生成技術的浪潮中,智譜開源再次引領潮流,推出了全新的文生圖模型——CogView4。這款模型不僅支持中英雙語提示詞輸入,更擅長理解和遵循中文指令,讓創(chuàng)意表達無界限。尤為值得一提的是,CogView4開創(chuàng)了先河,成為首個能在畫面中直接生成漢字的開源文生圖模型,讓文字與圖像的融合更加自然流暢。

圖片

不僅如此,CogView4還具備極高的靈活性,支持生成任意寬高比的圖片,同時接受任意長度的提示詞輸入,滿足用戶多樣化的創(chuàng)作需求。更令人期待的是,后續(xù)還將開源對應的Controlnet、Comfyui支持及模型微調工具,為用戶帶來更加便捷、高效的創(chuàng)作體驗。

圖片

在DPG-Bench基準測試中,CogView4憑借卓越的表現榮獲綜合評分第一,彰顯了其在圖像生成領域的強大實力。今年,圖像模型領域終于迎來了新的突破,而CogView4無疑是這場變革中的佼佼者。

CogView4主要特點總結如下:

  • 支持中英雙語提示詞輸入,擅長理解和遵循中文提示詞
  • 首個能夠在畫面中生成漢字的開源文生圖模型
  • 支持生成任意寬高的圖片以及任意長度提示詞輸入

相關鏈接

  • 論文:https://arxiv.org/pdf/2403.05121
  • 項目:github.com/THUDM/CogView4
  • 模型:huggingface.co/THUDM/CogView4-6B
  • 試用:https://huggingface.co/spaces/THUDM-HF-SPACE/CogView4

圖片

效果展示

圖片

推理要求與模型介紹

  • 分辨率:寬度和高度必須介于512px和之間2048px,可被 整除32,并且確保最大像素數不超過2^21px。
  • 精度:BF16 / FP32(不支持 FP16,因為它會導致溢出,從而導致圖像完全變黑) 使用BF16精度為batchsize=4進行測試,內存使用情況如下表所示:圖片

模型指標

DFG-Bench

圖片

GenEval

圖片

T2I-CompBench

圖片

Chinese Text Accuracy Evaluation

圖片

責任編輯:張燕妮 來源: AIGC Studio
相關推薦

2024-05-14 16:58:05

騰訊混元大模型文生圖

2024-05-15 17:30:51

開源模型

2023-08-09 10:08:00

模型AI

2024-10-28 09:47:53

2023-12-25 13:24:00

模型OCR頁面

2023-09-16 13:31:25

模型訓練

2025-04-15 12:16:17

2015-08-18 15:19:51

2020-07-16 13:00:18

人工智能機器學習技術

2020-07-20 09:49:56

開源技術 趨勢

2020-06-08 11:16:06

百度

2021-10-15 15:26:10

AI 數據人工智能

2024-09-05 12:11:25

大模型抓取列表頁

2015-12-01 11:17:41

Windows 10Version 151鏡像

2010-04-06 09:33:37

CentOS系統(tǒng)

2009-10-20 14:07:00

CCIE必讀書籍

2013-06-21 10:48:18

WP7Windows Pho中英文互翻譯

2009-08-13 09:26:14

.NET正則表達式

2009-03-17 09:52:22

Unicode中英文Python
點贊
收藏

51CTO技術棧公眾號