DeepMind等摘得杰出論文、IBM超算深藍成經典,IJCAI2023獎項公布
國際人工智能聯(lián)合會議(IJCAI)是 AI 領域中頂級學術會議之一,首屆大會于 1969 年在加利福尼亞舉辦,之后每兩年召開一次。從 2016 年開始 IJCAI 變?yōu)槊磕昱e行一次。今年 IJCAI-23 于 8 月 19 日至 25 日在澳門舉行,所有相關獎項已經公布。
2023 IJCAI 論文接收情況如下,其中摘要提交 5120 篇、完整論文提交 4566 篇,最終接收了 643 篇,接收率約為 14%,相較去年的 15% 又有所下降。
下圖為基于關鍵詞的提交和接收論文情況,可以看到,機器學習和計算機視覺領域提交和接收的論文數(shù)量最多。
杰出論文獎(Distinguished Papers)
IJCAI 今年評選出了三篇杰出論文獎,獲獎機構包括 Google DeepMind 、阿爾伯塔大學、阿姆斯特丹大學 、萊比錫大學等機構。
論文 1《Levin Tree Search with Context Models》
- 論文地址:https://www.ijcai.org/proceedings/2023/0624.pdf
- 作者:Laurent Orseau 、 Marcus Hutter 、 Levi H. S. Lelis
- 機構:Google DeepMind 、阿爾伯塔大學
摘要:Levin 樹搜索 (LTS) 是一種利用策略(動作的概率分布)的搜索算法,并提供了在達到目標節(jié)點之前進行多少擴展的理論保證(guarantee),這取決于策略的質量。這種保證可以看作損失函數(shù),研究者將其稱之為 LTS 損失,從而用來優(yōu)化表示策略的神經網絡(LTS+NN)。
本文展示了神經網絡可以替換成從在線壓縮文獻中產生參數(shù)化的上下文模型(LTS+CM)。本文表明, 在這個新模型下 LTS 損失是凸的,它允許使用標準的凸優(yōu)化工具,并且在給定的一組解軌跡的在線設置中獲得了最優(yōu)參數(shù)的收斂保證 —— 這是神經網絡無法提供的保證。
新的 LTS+CM 算法在幾個基準上優(yōu)于 LTS+NN,包括 Sokoban (Boxoban)、The Witness、STP(the 24-Sliding Tile puzzle)基準。
在 STP 基準上的結果表明,兩者的差異非常大,即 LTS+NN 無法解決大多數(shù)測試實例,而 LTS+CM 在不到一秒內就解決了每個測試實例。此外,LTS+CM 能夠學習解決魔方策略,只需要幾百個擴展,從而大大改善了之前的機器學習方法。
下表為帶有 Budgeted LTS 的上下文模型:
論文 2《SAT-Based PAC Learning of Description Logic Concepts》
- 論文地址:https://www.ijcai.org/proceedings/2023/0373.pdf
- 作者:Balder ten Cate 、Maurice Funk、Jean Christoph Jung、Carsten Lutz
- 機構:阿姆斯特丹大學 、萊比錫大學等
摘要:在知識表示中,知識庫 (KB) 的手動管理既耗時又昂貴,這使得基于學習的知識獲取方法成為一種有吸引力的替代方案。
本文提出了 SPELL,這是一個基于 SAT 的系統(tǒng),可在下實現(xiàn)
的有界擬合。
本文在多個數(shù)據集上評估了 SPELL,結果表明 SPELL 的運行時間幾乎總是顯著低于 ELTL(EL tree learner)。這意味著 SPELL 可以學習比 ELTL 更大的目標查詢。本文還分析了兩種方法的相對優(yōu)勢和劣勢,確定其中一種系統(tǒng)的性能明顯優(yōu)于另一種系統(tǒng)的輸入類別。最后,本文進行了關于泛化的初步實驗,表明兩個系統(tǒng)都可以很好地泛化到看不見的數(shù)據,即使是在非常小的樣本上。
下圖為 SPELL、ELTL 一些比較結果:
論文 3《Safe Reinforcement Learning via Probabilistic Logic Shields》
- 論文地址:https://www.ijcai.org/proceedings/2023/0637.pdf
- 作者:Wen-Chi Yang 、 Giuseppe Marra 、 Gavin Rens 、 Luc De Raedt
- 機構:魯汶大學、斯泰倫博斯大學
摘要:安全強化學習(Safe RL)旨在保持安全的同時學習最優(yōu)策略,它的一種流行解決方案是屏蔽,利用邏輯安全規(guī)范來防止 RL 智能體采取危險的行動。不過,傳統(tǒng)的屏蔽技術很難與連續(xù)、端到端的深度 RL 方法集成。
研究者提出了概率邏輯策略梯度(Probabilistic Logic Policy Gradient, PLPG),它是一種基于模型的安全 RL 技術,使用概率邏輯編程將邏輯安全約束建模為可微函數(shù)。因此,PLPG 可以無縫地應用于任何策略梯度算法,還能提供相同的收斂保證。下圖 1 為概率邏輯屏蔽的示例。
實驗表明,與其他 SOTA 屏蔽技術相比,PLPG 可以學習更安全、更有價值的策略。
論文一作 Wen-Chi Yang 為魯汶大學 DTAI 研究團隊的博士,致力于通過形式化驗證與機器學習的結合,來提升安全約束可滿足性。她還特別對智能體利用背景知識來安全地學習和探索感興趣。本科畢業(yè)于臺灣交通大學,之后進入魯汶大學攻讀碩士和博士學位(均為計算機科學)。
個人主頁:https://wenchiyang.github.io/
AIJ 獎
AIJ 的全稱為 Artificial Intelligence Journal,即《人工智能期刊》,始建于 1970 年,是人工智能研究領域的頂級學術期刊,具有公認的權威性與知名性。
AIJ 突出論文獎
2023 年 AIJ 突出論文獎授予 José Camacho-Collados、Mohammad Taher Pilehvar、Roberto Navigli 合著的論文《Nasari: Integrating explicit knowledge and corpus statistics for a multilingual representation of concepts and entities》。該論文發(fā)表于 2016 年。
論文地址:https://www.sciencedirect.com/science/article/pii/S0004370216300820
摘要:語義表征被認為是 NLP 和 AI 研究中最基本的內容,其在過去幾十年中一直是詞匯語義學的重要研究領域。然而,由于缺乏大型的語義標注語料庫,大多數(shù)現(xiàn)有的表征技術僅限于詞匯層面,因此無法有效地應用于單個單詞的語義。
本文提出了一種新的多語言向量表征,稱為 Nasari,它不僅能夠準確地表征不同語言的詞義,而且與現(xiàn)有方法相比存在兩個優(yōu)點:
- 高覆蓋率,包括概念和命名實體;
- 跨語言和語言級別(即單詞、意義和概念)的可比性。
此外,Nasari 表征很靈活,可以應用于多種應用程序,并且可以在網站上免費獲得。該研究在四個不同任務上進行評估,即單詞相似度、語義聚類、域標記和詞義消歧,結果顯示,Nasari 表征在所有任務上表現(xiàn) SOTA。
下表為統(tǒng)一向量構造方法:
AIJ 經典論文獎
今年的 AIJ 經典論文獎頒給了關于超級計算機深藍的論文《Deep Blue》。該論文發(fā)表于 2002 年。
- 作者:Murray Campbell、A. Joseph Hoane Jr.、Feng-hsiung Hsu
- 機構:IBM T.J. 沃森研究中心、Sandbridge Technologies、Compaq
- 論文地址:https://core.ac.uk/download/pdf/82416379.pdf
摘要:深藍(Deep Blue)是由 IBM 開發(fā)的專門用以分析國際象棋的超級計算機。其在 1997 年的六場比賽中擊敗了當時的世界象棋冠軍加里?卡斯帕羅夫。促成這一成功的因素有很多,包括:
- 單芯片國際象棋搜索引擎;
- 具有多層并行性的大規(guī)模并行系統(tǒng);
- 搜索擴展;
- 復雜評價函數(shù);
- 有效地使用 Grandmaster 游戲數(shù)據庫。
本文描述了深藍系統(tǒng),并給出了深藍背后設計決策的一些基本原理。如下為 dual credit 算法。
IJCAI-JAIR 最佳論文獎
自 2003 年起,IJCAI-JAIR 最佳論文獎每年從最近 5 年發(fā)表在 JAIR 的論文中評選并表彰一篇杰出論文。評審的標準基于論文的重要性和 presentation 的質量。
2023 年的 IJCAI-JAIR 最佳論文獎授予了論文《Reward Machines: Exploiting Reward Function Structure in Reinforcement Learning》,作者來自智利天主教大學、加拿大 AI 研究機構 Vector Institute、多倫多大學等。
論文地址:https://jair.org/index.php/jair/article/view/12440
此前,2023 IJCAI 的「Donald E. Walker 杰出服務獎」授予了香港科技大學講座教授楊強,以表彰其對 IJCAI 組織和整個人工智能領域的杰出貢獻。他也成為了該獎項設置以來首位獲獎的華人科學家。