偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Bengio參與、LeCun點贊:圖神經(jīng)網(wǎng)絡權威基準現(xiàn)已開源

新聞 深度學習
近期的大量研究已經(jīng)讓我們看到了圖神經(jīng)網(wǎng)絡模型(GNN)的強大潛力,很多研究團隊都在不斷改進和構建基礎模塊。

 [[317692]]

圖神經(jīng)網(wǎng)絡發(fā)展到什么程度了?現(xiàn)在我們有了專用的 Benchmark 工具來進行評測。

近期的大量研究已經(jīng)讓我們看到了圖神經(jīng)網(wǎng)絡模型(GNN)的強大潛力,很多研究團隊都在不斷改進和構建基礎模塊。但大多數(shù)研究使用的數(shù)據(jù)集都很小,如 Cora 和 TU。在這種情況下,即使是非圖神經(jīng)網(wǎng)絡的性能也是可觀的。如果進行進一步的比較,使用中等大小的數(shù)據(jù)集,圖神經(jīng)網(wǎng)絡的優(yōu)勢才能顯現(xiàn)出來。

在斯坦福圖神經(jīng)網(wǎng)絡大牛 Jure 等人發(fā)布《Open Graph Benchmark》之后,又一個旨在構建「圖神經(jīng)網(wǎng)絡的 ImageNet」的研究出現(xiàn)了。近日,來自南洋理工大學、洛約拉馬利蒙特大學、蒙特利爾大學和 MILA 等機構的論文被提交到了論文預印版平臺上,而且這一新的研究有深度學習先驅 Yoshua Bengio 的參與,也得到了 Yann LeCun 的關注。

Bengio参与、LeCun点赞:图神经网络权威基准现已开源

論文鏈接:https://arxiv.org/abs/2003.00982

在該研究中,作者一次引入了六個中等大小的基準數(shù)據(jù)集(12k-70k 圖,8-500 節(jié)點),并對一些有代表性的圖神經(jīng)網(wǎng)絡進行了測試。除了只用節(jié)點特征的基準線模型之外,圖神經(jīng)網(wǎng)絡分成帶或不帶對邊對注意力兩大類。GNN 研究社區(qū)一直在尋求一個共同的基準以對新模型的能力進行評測,這一工具或許可以讓我們實現(xiàn)目標。

現(xiàn)在,如果你想測試一下自己的圖神經(jīng)網(wǎng)絡模型,可以使用它的開源項目進行測試了。

項目地址:https://github.com/graphdeeplearning/benchmarking-gnns

 Bengio参与、LeCun点赞:图神经网络权威基准现已开源

不同任務上的測試腳本,每一個 Notebook 都會手把手教你如何測試不同的圖神經(jīng)網(wǎng)絡。

該開放基準架構基于 DGL 庫,DGL 由 AWS 上海 AI 研究院、紐約大學、上海紐約大學開放和維護,是業(yè)界領先的圖神經(jīng)網(wǎng)絡訓練平臺,并無縫支持主流深度網(wǎng)絡平臺。Benchmarking gnn 建立在 DGL 的 PyTorch 版本之上。

AWS 上海 AI 研究院首任院長、上海紐約大學張崢教授評論說:「這篇論文來得很及時,也有意義。第一,說明現(xiàn)有的數(shù)據(jù)集太小、以致成為前進的障礙,已經(jīng)成為學界的共識。值得贊揚的是這篇文章的作者并沒有因為 OGB 的發(fā)布就擱下不弄了。在我看來,他們的數(shù)據(jù)集和 OGB 有很強的互補性,呈現(xiàn)了圖神經(jīng)網(wǎng)絡更豐富的應用場景,比如把圖像數(shù)據(jù)轉換成圖數(shù)據(jù),雖然是從 MNIST 和 CIFAR 開始,也隱含了顛覆或改變基于卷積網(wǎng)絡 CNN 的解決方案,再比如旅行推銷員問題是一個經(jīng)典的優(yōu)化問題,等等?!?/p>

「另外,基于這一系列的數(shù)據(jù)得到的結論有比較高的可信度,比如數(shù)據(jù)多起來圖神經(jīng)網(wǎng)絡更能發(fā)揮優(yōu)勢,比如帶注意力的圖神經(jīng)網(wǎng)絡雖然參數(shù)更多,但性能也更好??傊@些結果對激勵更多的模型研究和拓展應用場景非常有意義。」張教授說

圖神經(jīng)網(wǎng)絡已成為分析和學習圖形數(shù)據(jù)的標準工具,并已成功地應用在很多領域中,包括化學、物理、社會科學、知識圖譜、推薦系統(tǒng)以及神經(jīng)科學等。隨著各領域的發(fā)展,確定架構類型以及關鍵的機制顯得尤為重要,這些架構與機制可以在跨圖形大小的情況下進行泛化,使得我們能夠處理更多更大更復雜的數(shù)據(jù)集以及領域。

但是,在缺乏具有一致性的實驗設置和大量數(shù)據(jù)集沒有標準化基準的情況下,衡量新的 GNN 有效性以及對比模型變得越來越困難。在本論文中,作者提出了一個可復制化的 GNN 基準測試框架,可以讓研究人員方便地添加新的數(shù)據(jù)集以及模型。從數(shù)學建模、計算機視覺、化學和組合問題等多方面將這一基準框架應用至最新的中尺度圖形數(shù)據(jù)集里,以便于在設計有效的 GNN 時建立起關鍵的操作。更準確的來說,圖卷積、各項異性擴散、殘差連接、歸一化層是開發(fā)魯棒性以及可擴展性 GNN 的通用構件。

基準測試的數(shù)據(jù)集和構建圖的方法

這項工作的目標之一是提供一個易于使用的中等規(guī)模數(shù)據(jù)集,在這些數(shù)據(jù)集上,面向過去幾年中所提出的不同 GNN 架構在性能表現(xiàn)上有明顯的差異。同時,這些差異從統(tǒng)計的角度上來說是具有相當?shù)囊饬x,該基準包含 6 個數(shù)據(jù)集,如表 1:

 Bengio参与、LeCun点赞:图神经网络权威基准现已开源

提議基準數(shù)據(jù)集的匯總統(tǒng)計信息。

對于這兩個計算機視覺數(shù)據(jù)集,來自經(jīng)典的 MNIST (LeCun et al., 1998) 以及 CIFAR10 (Krizhevsky et al., 2009) 數(shù)據(jù)集中的每個圖像都使用了所謂的超像素轉換成圖。

而接下來的任務是將這些圖形分類。在 PATTERN 和 CLUSTER 數(shù)據(jù)集中,圖形是根據(jù)隨機塊模型生成的。這些任務包括識別特定的子圖結構 (PATTERN 數(shù)據(jù)集) 或者識別集群 ( CLUSTER 數(shù)據(jù)集)。這些都屬于是節(jié)點分類任務。

Tsp 數(shù)據(jù)集是基于銷售人員旅行的問題 (假設給定一個城市列表,訪問每個城市并返回原始城市的最短路徑是什么?)

將隨機歐氏圖上的 TSP 問題作為一個邊界分類或是連接預測的任務看待,其中 Concorde Solver 給出的 TSP 旅行中每一邊界的真實情況值都屬于是在現(xiàn)實世界中已存在的分子數(shù)據(jù)集。每個分子可被轉換成一個圖形: 其中每個原子可成為一個節(jié)點,每個鍵可成為一個邊。

基準測試設置

GatedGCN-門控圖卷積網(wǎng)絡 (Bresson & Laurent,2017) 是考慮中的最后一個 GNN。如果在數(shù)據(jù)集中可用的情況下,其中 GatedGCN-e 表示使用邊緣屬性/特征的版本。另外,作者也實現(xiàn)了一個簡單的不使用圖結構的基線模型,它處于并行情況下對每個節(jié)點的特征向量使用一個 MLP,且獨立于其他節(jié)點。

這是后續(xù)可選的一個門控機制,用以以獲得門控 MLP 基線 (詳情見補充材料)。作者對 MNIST,CIFAR10,ZINC 以及 TSP 在 Nvidia 1080Ti GPU 上進行實驗,對 PATTERN 和 CLUSTER 在 Nvidia 2080Ti GPU 上進行實驗。

圖分類和超像素數(shù)據(jù)集

這一部分使用了計算機視覺領域里最流行的 MNIST 和 CIFAR10 圖像分類數(shù)據(jù)集。超分辨率格式為 SLIC(Knyazev et al., 2019)。MNIST 擁有 55000 訓練/5000 驗證/10000 測試圖,節(jié)點為 40-75 之間(即超像素的數(shù)量),CI-FAR10 有 45000 訓練/5000 驗證/10000 測試圖,節(jié)點數(shù)為 85-150。

 Bengio参与、LeCun点赞:图神经网络权威基准现已开源

圖 1. 示例圖和超像素圖。SLIC 的超像素圖(其中 MNIST 最多 75 節(jié)點,CIFAR10 最多 150 節(jié)點)是歐幾里得空間中的 8 個最近鄰圖形,節(jié)點顏色表示平均像素強度。

 Bengio参与、LeCun点赞:图神经网络权威基准现已开源

表 3. 不同方法在基于 MNIST 和 CI-FAR10 的標準測試集上的測試結果(數(shù)值越高越好)。該結果是使用 4 個不同種子運行四次結果的平均值。紅色為最佳水平,紫色為高水平。粗體則表示殘差鏈接和非殘差連接之間的最佳模型(如兩個模型水平相同則皆為粗體顯示)。

圖回歸和分子數(shù)據(jù)集

ZINC 分子數(shù)據(jù)集被用于對受限溶解度分子特性進行回歸分析。在這里 ZINC 有 10000 訓練/1000 驗證/1000 測試圖,節(jié)點數(shù)/原子數(shù)為 9-37。對于每個分子圖,節(jié)點特征是原子的類型,邊緣特征是邊緣的類型。

 Bengio参与、LeCun点赞:图神经网络权威基准现已开源

在 SBM 數(shù)據(jù)集上進行節(jié)點分類

研究者考慮了節(jié)點級別的圖模式識別任務和半監(jiān)督圖聚類任務。圖模式識別時為了找到一個固定的圖模式 P,嵌入于更大的圖 G 中。

而半監(jiān)督聚類任務則是網(wǎng)絡科學中的另一個重要任務。研究者針對以上兩個任務分別生成了相應的數(shù)據(jù)集。

Bengio参与、LeCun点赞:图神经网络权威基准现已开源

表 5:在標準測試集 PATTERN 和 CLUSTER SBM 圖上的性能表現(xiàn)。

TSP 數(shù)據(jù)集上的邊分類

TSP(Travelling Salesman Problem)指的是旅行推銷員問題:給定一個 2D 的歐幾里得圖,算法需要找到一個最優(yōu)的序列節(jié)點,名為 Tour。它應當有著最少的邊權重。TSP 的大規(guī)模特性使得它成為一個具有挑戰(zhàn)性的圖任務,需要對局部節(jié)點的近鄰和全局圖結構進行推理。

更重要的是,組合優(yōu)化問題也是 GNN 中有研究意義的一個應用場景。研究這類問題,不僅僅在現(xiàn)實中有著廣泛的應用,還對于理解圖模型的優(yōu)化和學習過程,圖網(wǎng)絡本身的局限性等有重要意義。

在基準測試中,研究者采用了基于學習的方法,建立了一 GNN 作為骨架網(wǎng)絡,來給每個邊和是否所屬預測結果集進行概率預測。這一概率經(jīng)由圖搜索技術被轉換為離散決策。研究者分別創(chuàng)建了 10000 個訓練實例和 1000 個驗證、1000 個測試實例。

Bengio参与、LeCun点赞:图神经网络权威基准现已开源

圖 2:TSP 數(shù)據(jù)集的樣本圖。節(jié)點以藍色表示,紅色表示 groundtruth 的邊。

Bengio参与、LeCun点赞:图神经网络权威基准现已开源

表 6:TSP 測試集的圖性能表現(xiàn),分為有/無殘差連接良好總情況。紅色表示最好的模型性能,紫色表示模型效果不錯。

 Bengio参与、LeCun点赞:图神经网络权威基准现已开源

表 7:在 TSP 測試集圖上的性能表現(xiàn)。模型是深度 GNN,有 32 層。模型分為使用殘差連接和沒有殘差連接兩種情況。L 表示層數(shù),B 表示最好的結果(有殘差連接和無殘差連接的情況)。

Bengio参与、LeCun点赞:图神经网络权威基准现已开源

 

表 8:ZINC、CIFAR10 和 CLUSTER 測試集圖在有或者沒有 BN、GN 的情況下的性能表現(xiàn)。

 

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-26 07:30:00

神經(jīng)網(wǎng)絡AI

2018-07-25 09:36:34

開源技術 項目

2019-03-15 11:34:19

神經(jīng)網(wǎng)絡數(shù)據(jù)圖形

2020-09-09 10:20:48

GraphSAGE神經(jīng)網(wǎng)絡人工智能

2023-05-04 07:39:14

圖神經(jīng)網(wǎng)絡GNN

2024-10-21 13:50:00

神經(jīng)網(wǎng)絡數(shù)據(jù)

2024-02-26 08:25:00

模型訓練

2021-10-15 10:32:42

神經(jīng)網(wǎng)絡AI算法

2018-07-03 16:10:04

神經(jīng)網(wǎng)絡生物神經(jīng)網(wǎng)絡人工神經(jīng)網(wǎng)絡

2024-02-01 13:02:00

AI模型

2024-12-12 00:29:03

2024-07-10 14:38:05

2024-04-30 14:54:10

2022-07-28 09:00:00

深度學習網(wǎng)絡類型架構

2017-05-22 14:45:51

大數(shù)據(jù)神經(jīng)網(wǎng)絡架構

2021-01-08 11:23:08

IP核

2022-07-04 11:33:50

人工智能神經(jīng)網(wǎng)絡

2023-12-20 13:34:56

2017-06-30 16:24:40

大數(shù)據(jù)神經(jīng)網(wǎng)絡NNabla

2022-03-02 14:53:34

人工智能神經(jīng)網(wǎng)絡
點贊
收藏

51CTO技術棧公眾號