偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

谷歌推出PaliGemma 2 mix:用于多任務的視覺語言模型,開箱即用

人工智能 新聞
谷歌宣布推出 PaliGemma 2 mix 檢查點。PaliGemma 2 mix 是針對多種任務進行調整的模型,允許直接探索模型功能并將其開箱即用,用于常見用例。

去年 12 月,谷歌推出了 PaliGemma 2 ,這是Gemma系列中的升級版視覺語言模型。該版本包含不同大小(3B、10B 和 28B 參數(shù))的預訓練檢查點,可輕松針對各種視覺語言任務和領域進行微調,例如圖像分割、短視頻字幕、科學問答和文本相關任務,并實現(xiàn)高性能。

2月19日,谷歌宣布推出 PaliGemma 2 mix 檢查點。PaliGemma 2 mix 是針對多種任務進行調整的模型,允許直接探索模型功能并將其開箱即用,用于常見用例。

PaliGemma 2 mix 有什么新功能?

  • 一個模型可完成多項任務:PaliGemma 2 mix 可以解決短字幕和長字幕、光學字符識別 (OCR)、圖像問答、對象檢測和分割等任務。
  • 適合開發(fā)人員的尺寸:借助不同的模型尺寸(3B、10B 和 28B 參數(shù))和分辨率(224px 和 448px),使用最適合您需求的模型。
  • 與您喜歡的框架一起使用:利用您喜歡的工具和框架,包括Hugging Face Transformers、Keras、PyTorch、JAX 和Gemma.cpp。

如果已經(jīng)在使用原始的 PaliGemma 混合檢查點,則可以直接升級到 PaliGemma 2,而無需進行任何更改。該模型根據(jù)提示方式執(zhí)行不同的任務。

效果展示

檢測

  • 任務:檢測(PaliGemma-2-3b-mix-224)
  • 輸入:“detect android\n”

結果

多物體檢測

  • 任務:多目標檢測(PaliGemma-2-3b-mix-224)
  • 輸入:“檢測椅子;桌子\n”

結果

  • 餐廳內物品的多物體檢測

結果:

光學字符識別 (OCR)

  • 任務:多目標檢測(PaliGemma-2-3b-mix-224)
  • 輸入-“ocr\n”

結果:

分割

  • 任務:分割 (PaliGemma-2-3b-mix-224)
  • 輸入-“segment cat\n”

結果

問答

  • 任務:問答 (PaliGemma2-mix-3b-448)
  • 輸入:“答案 en 牛站在哪里?\n”

結果

beach

字幕

  • 輸入:“caption en\n”

結果

a cow standing on a beach next to a sign that says warning dangerous rip current.

光學字符識別 (OCR)

結果:

  • WARNING
  • DANGEROUS
  • RIP CURRENT

立即開始

  • 試用:https://huggingface.co/spaces/google/paligemma2-10b-mix
  • 模型:https://www.kaggle.com/models/google/paligemma-2/
  • 運行:https://ai.google.dev/gemma/docs/paligemma/inference-with-keras
  • 部署:https://console.cloud.google.com/vertex-ai/publishers/google/model-garden/paligemma
責任編輯:張燕妮 來源: AIGC Studio
相關推薦

2024-05-17 08:33:33

視覺語言模型

2023-07-31 16:19:47

機器人人工智能

2022-04-26 09:44:29

算法庫EasyCV開源

2021-08-31 15:53:48

Nuxt 開箱服務

2011-02-21 10:16:16

多任務處理功能Windows Pho

2011-12-14 00:58:38

vStart虛擬化實施DELL

2023-04-03 10:32:56

模型數(shù)據(jù)集

2022-09-28 15:34:06

機器學習語音識別Pytorch

2023-01-15 20:28:32

前端圖片壓縮

2025-07-31 02:00:15

谷歌測試AI模型

2023-03-22 11:44:49

NVIDIAGTC

2023-11-04 12:43:44

前端圖片參數(shù)

2023-03-08 21:25:58

開源工具庫開箱

2022-08-08 08:29:55

圖片壓縮前端互聯(lián)網(wǎng)

2024-12-09 10:51:43

2021-04-13 14:39:08

谷歌Logica語言

2021-09-26 05:41:47

基礎設施連接無線技術網(wǎng)絡

2022-03-04 19:07:03

模型視覺人工智能

2013-03-25 09:43:09

Teradata 大數(shù)據(jù)天睿

2025-07-10 00:00:05

開箱ApacheHertzbeat
點贊
收藏

51CTO技術棧公眾號