偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

谷歌開源NLP模型可視化工具LIT,模型訓(xùn)練不再「黑箱」

新聞 開發(fā)工具
近日,Google 研究人員發(fā)布了一款語言可解釋性工具 (Language Interpretability Tool, LIT),這是一個(gè)開源平臺(tái),用于可視化和理解自然語言處理模型。

深度學(xué)習(xí)模型的訓(xùn)練就像是「黑箱操作」,知道輸入是什么、輸出是什么,但中間過程就像個(gè)黑匣子,這使得研究人員可能花費(fèi)大量時(shí)間找出模型運(yùn)行不正常的原因。假如有一款可視化的工具,能夠幫助研究人員更好地理解模型行為,這應(yīng)該是件非常棒的事。

近日,Google 研究人員發(fā)布了一款語言可解釋性工具 (Language Interpretability Tool, LIT),這是一個(gè)開源平臺(tái),用于可視化和理解自然語言處理模型。

論文地址:https://arxiv.org/pdf/2008.05122.pdf

項(xiàng)目地址:https://github.com/PAIR-code/lit

LIT 重點(diǎn)關(guān)注模型行為的核心問題,包括:為什么模型做出這樣的預(yù)測(cè)?什么時(shí)候性能不佳?在輸入變化可控的情況下會(huì)發(fā)生什么?LIT 將局部解釋、聚合分析和反事實(shí)生成集成到一個(gè)流線型的、基于瀏覽器的界面中,以實(shí)現(xiàn)快速探索和錯(cuò)誤分析。

谷歌開源NLP模型可視化工具LIT,模型訓(xùn)練不再「黑箱」

該研究支持多種自然語言處理任務(wù),包括探索情感分析的反事實(shí)、度量共指系統(tǒng)中的性別偏見,以及探索文本生成中的局部行為。

此外 LIT 還支持多種模型,包括分類、seq2seq 和結(jié)構(gòu)化預(yù)測(cè)模型。并且它具備高度可擴(kuò)展性,可通過聲明式、框架無關(guān)的 API 進(jìn)行擴(kuò)展。

相關(guān) demo,參見視頻:

00:00/00:00倍速

可以針對(duì)新穎的工作流程進(jìn)行重新配置,并且這些組件是獨(dú)立的,可移植的,且易于實(shí)現(xiàn)。

用戶界面

LIT 位于一個(gè)單頁 web 應(yīng)用中,由多個(gè)工具欄和包含多個(gè)獨(dú)立模塊的主體部分組成。如果模塊適用于當(dāng)前模型和數(shù)據(jù)集,它們將自動(dòng)顯示。例如,顯示分類結(jié)果的模塊僅在模型返回 MulticlassPreds 時(shí)顯示。

谷歌開源NLP模型可視化工具LIT,模型訓(xùn)練不再「黑箱」

LIT 用戶界面

谷歌開源NLP模型可視化工具LIT,模型訓(xùn)練不再「黑箱」

LIT 的布局設(shè)計(jì)圖。

功能

LIT 通過基于瀏覽器的用戶界面(UI)支持各種調(diào)試工作流。功能包括:

局部解釋:通過模型預(yù)測(cè)的顯著圖、注意力和豐富可視化圖來執(zhí)行。

聚合分析:包括自定義度量指標(biāo)、切片和裝箱(slicing and binning),以及嵌入空間的可視化。

反事實(shí)生成:通過手動(dòng)編輯或生成插件進(jìn)行反事實(shí)推理,動(dòng)態(tài)地創(chuàng)建和評(píng)估新示例。

并排模式:比較兩個(gè)或多個(gè)模型,或基于一對(duì)示例的一個(gè)模型。

高度可擴(kuò)展性:可擴(kuò)展到新的模型類型,包括分類、回歸、span 標(biāo)注,seq2seq 和語言建模。

框架無關(guān):與 TensorFlow、PyTorch 等兼容。

下面我們來看 LIT 的幾個(gè)主要模塊:

探索數(shù)據(jù)集:用戶可以使用不同的標(biāo)準(zhǔn)跨模塊(如數(shù)據(jù)表和嵌入模塊)交互式地探索數(shù)據(jù)集,從而旋轉(zhuǎn)、縮放和平移 PCA 或 UMAP 投影,以探索集群和全局結(jié)構(gòu)。

谷歌開源NLP模型可視化工具LIT,模型訓(xùn)練不再「黑箱」

比較模型:通過在全局設(shè)置控件中加載多個(gè)模型,LIT 可以對(duì)它們進(jìn)行比較。然后復(fù)制顯示每個(gè)模型信息的子模塊,以便于在兩個(gè)模型之間進(jìn)行比較。其他模塊(如嵌入模塊和度量模塊)同時(shí)得到更新,以顯示所有模型的最新信息。

谷歌開源NLP模型可視化工具LIT,模型訓(xùn)練不再「黑箱」

比較數(shù)據(jù)點(diǎn):切換到選擇工具欄中的「Compare datapoints」按鈕,使 LIT 進(jìn)入數(shù)據(jù)點(diǎn)比較模式。在這種模式下,主數(shù)據(jù)點(diǎn)選擇作為參考數(shù)據(jù)點(diǎn),并且在后續(xù)設(shè)置中都會(huì)以其為參考點(diǎn)進(jìn)行比較。參考數(shù)據(jù)點(diǎn)在數(shù)據(jù)表中以藍(lán)色邊框突出顯示。

谷歌開源NLP模型可視化工具LIT,模型訓(xùn)練不再「黑箱」

其他模塊的具體細(xì)節(jié),參見:https://github.com/PAIR-code/lit/blob/main/docs/user_guide.md

看了上面的介紹,你是不是迫不及待地想要上手試試這個(gè)炫酷的可視化工具?下面我們來看它的安裝過程和示例。

安裝教程

下載軟件包并進(jìn)行 Python 環(huán)境配置,代碼如下:

安裝并配置好環(huán)境,就可以體驗(yàn)工具包中自帶的示例。

示例

1. 情緒分類示例

代碼如下:

情緒分類示例是基于斯坦福情感樹庫微調(diào) BERT-tiny 模型,在 GPU 上不到 5 分鐘即可完成。訓(xùn)練完成后,它將在開發(fā)集上啟動(dòng) LIT 服務(wù)器。

2. 語言建模類示例

要想探索預(yù)訓(xùn)練模型(BERT 或 GPT-2)的預(yù)測(cè)結(jié)果,運(yùn)行以下代碼:

更多的示例請(qǐng)參考目錄:../lit_nlp/examples。

此外,該項(xiàng)目還提供了添加自己模型和數(shù)據(jù)的方法。通過創(chuàng)建定制的 demo.py 啟動(dòng)器,用戶可以輕松地用自己的模型運(yùn)行 LIT,類似于上述示例目錄../lit_nlp/examples。

完整的添加過程,參見:https://github.com/PAIR-code/lit/blob/main/docs/python_api.md#adding-models-and-data。

 

責(zé)任編輯:張燕妮 來源: 機(jī)器之心Pro
相關(guān)推薦

2020-03-17 09:42:00

谷歌開源機(jī)器學(xué)習(xí)

2025-06-03 08:35:00

2019-10-14 15:51:40

可視化技術(shù)微軟數(shù)據(jù)庫

2019-09-27 09:12:18

開源數(shù)據(jù)可視化大數(shù)據(jù)

2021-03-30 10:10:37

PyTorch可視化工具命令

2017-07-03 16:44:10

數(shù)據(jù)庫MongoDBNoSQL

2019-10-24 13:12:22

開源技術(shù) 軟件

2020-11-15 18:00:49

開源可視化工具Python

2023-05-22 09:19:19

2020-07-16 15:10:46

工具可視化Python

2017-07-04 16:00:16

PythonMatplotlib可視化工具

2017-07-27 09:49:37

Python工具Matplotlib

2021-04-11 09:51:25

Redis可視化工具

2015-12-02 09:44:04

Python視化工具

2022-10-21 15:47:59

測(cè)試工具鴻蒙

2021-03-18 09:07:13

日志可視化工具Devops

2023-09-01 13:56:00

谷歌模型

2015-11-11 11:10:40

數(shù)據(jù)可視化開源工具

2017-04-10 08:26:17

數(shù)據(jù)可視化工具deck.gl

2024-07-05 11:08:21

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)