偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

陶哲軒點評谷歌AlphaProof:AI在數(shù)學(xué)競賽中展現(xiàn)「超凡智慧」

人工智能 新聞
常用 AI 輔助證明的數(shù)學(xué)家陶哲軒近期正處在出差的忙碌中,對問題求解引擎 AlphaProof 和 AlphaGeometry2 還未完全消化。

在奧數(shù)問題面前,AI 的「智商」往往不太夠用。

不過,這已經(jīng)是過去式了。谷歌 DeepMind 用 AI 做出了今年國際數(shù)學(xué)奧林匹克競賽 IMO 的真題,并且距拿金牌僅一步之遙。對于 AI 來說,奧數(shù)不再是問題了。

IMO 2024 中六個問題的每一個問題滿分為 7 分,總分最高 42 分。DeepMind 的系統(tǒng)最終得分為 28 分,意味著解決的 4 個問題都獲得了滿分 —— 相當(dāng)于銀牌類別的最高分。

DeepMind 文章連接:https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

常用 AI 輔助證明的數(shù)學(xué)家陶哲軒近期正處在出差的忙碌中,對問題求解引擎 AlphaProof 和 AlphaGeometry2 還未完全消化。但他在自己的博客上對 DeepMind 的 AI 系統(tǒng)參加 IMO 競賽這件事表達(dá)了自己的看法。

圖片

陶哲軒談到,這是一項非常偉大的工作, 再次改變了我們對哪些基準(zhǔn)挑戰(zhàn)可以通過 AI 輔助或完全自主的方法實現(xiàn)的期望。 

例如,IMO 級別的幾何問題現(xiàn)在對于專用的 AI 工具來說已基本解決。現(xiàn)在看來,通過強(qiáng)化學(xué)習(xí)過程可以找到形式化證明的 IMO 問題至少在某種程度上可以被 AI 攻克。雖然目前每個問題需要相當(dāng)大的計算量,并且在形式化方面需要人類的幫助。

在陶哲軒看來,這種方法還有一些「buff 加成」,它能使形式化數(shù)學(xué)更容易自動化,這反過來可能會促進(jìn)包含形式化成分的數(shù)學(xué)研究方法。如果更公開地共享由此產(chǎn)生的形式證明數(shù)據(jù)庫,它可能是一個有用的資源。 

這種方法(更多地基于強(qiáng)化學(xué)習(xí)而非大型語言模型,有點類似 AlphaGo 的精神,且強(qiáng)調(diào)整體方法)非常聰明,事后來看很有道理。正如「AI 效應(yīng)」所言,一旦解釋清楚,它不會給人一種展示人類智能的感覺;但它仍然是我們 AI 輔助問題解決工具集能力的擴(kuò)展。

圖片

「AI 效應(yīng)」是指當(dāng)人工智能技術(shù)取得進(jìn)展或解決問題時,人們往往會認(rèn)為這些成就并不是真正的人工智能或者不具備真正的智能。換句話說,一旦某項技術(shù)被理解或普及,它就不再被認(rèn)為是智能的。這種現(xiàn)象表明,人們對 “智能” 的定義和期望會隨著技術(shù)的進(jìn)步而不斷提高。 

本月月初,陶哲軒在自己的博客中發(fā)布 AI 數(shù)學(xué)奧林匹克競賽(AIMO 進(jìn)步獎)的初步成績已公布的消息。其中,獲得第一名的是 Numina 的團(tuán)隊。

他在最新博客中表示,DeepMind 的這些新工具無法與最近贏得 AIMO 進(jìn)步獎的 NuminaMath 模型直接比較。NuminaMath 模型完全自動化且資源效率高出數(shù)個數(shù)量級,并且采用了完全不同的方法(使用大型語言模型生成 Python 代碼,以蠻力解決區(qū)域競賽級別的數(shù)值答案問題)。這個模型也是完全開源的。這也是非常不錯的工作,展示了嘗試使用 AI 來輔助或自動化數(shù)學(xué)問題解決過程的不同部分的多維挑戰(zhàn)。

其實 DeepMind 在數(shù)學(xué)推理方面有著不懈的努力。在今年年初,它的人工智能算法就已經(jīng)在數(shù)學(xué)奧林匹克競賽(IMO)上取得了重大成績突破。論文《Solving olympiad geometry without human demonstrations》向世人介紹了 AlphaGeometry,還登上了國際權(quán)威期刊《自然》雜志。專家表示,這是人工智能朝著具有人類推理能力方向邁進(jìn)的重要一步。

圖片


論文鏈接:https://www.nature.com/articles/s41586-023-06747-5

未來 DeepMind 還將帶給我們怎樣的驚喜,我們拭目以待。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-07-29 13:28:52

2025-06-03 08:15:00

2023-12-06 13:44:00

模型訓(xùn)練

2024-02-26 08:30:00

2024-07-08 13:08:04

2024-07-04 15:28:11

2023-10-10 13:51:46

GPT-4GitHubAI

2024-12-09 09:35:00

AI數(shù)據(jù)訓(xùn)練

2023-05-15 15:13:46

智能工作

2024-10-14 14:31:36

2025-06-12 14:20:35

谷歌DeepMindAI

2023-10-04 08:07:06

CopilotGitHub

2024-06-17 08:45:00

2025-05-22 09:08:40

2024-04-09 09:44:21

數(shù)學(xué)模型

2024-07-29 14:39:39

2025-06-23 08:45:00

2023-06-30 13:42:44

2024-04-15 12:29:00

AI訓(xùn)練

2024-09-29 14:00:00

AI數(shù)學(xué)自動化
點贊
收藏

51CTO技術(shù)棧公眾號