偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

刷新世界紀(jì)錄!神秘學(xué)生擊敗谷歌AlphaEvolve難題最優(yōu)解,優(yōu)勢僅0.00006442

人工智能 新聞
一名在校生借助AI,在經(jīng)典的「Circle Packing」數(shù)學(xué)難題上擊敗了谷歌頂尖的AlphaEvolve算法,創(chuàng)造了新的世界紀(jì)錄。

一個還在上學(xué)的少年在AI的幫助下,擊敗了谷歌最先進的技術(shù),創(chuàng)造了新的世界紀(jì)錄!

當(dāng)IMO鬧劇還在爭論,這個少年靠著AI已經(jīng)在數(shù)學(xué)問題上逆襲了谷歌最先進的、用于設(shè)計高級算法的AlphaEvolve。

圖片

在「Circle Packing」問題上,這個少年的算法以「0.00006442」的優(yōu)勢超過了谷歌AlphaEvolve,也超過了此前的FICO Xpress創(chuàng)造的紀(jì)錄。

圖片

有必要先介紹下Circle Packing問題是什么,以及谷歌AlphaEvolve到底有多厲害。

Packing Problems,也就是填充問題,可以簡單理解為「將多種多邊形以最高效率填充到另一個多邊形中」。

Circle Packing問題則是一種特定情況,在一個給定區(qū)域(比如正方形)盡可能緊密地放置若干個互不重疊的圓,使得這些圓的半徑和最大,或填充的空間最大。

圖片

谷歌的AlphaEvolve發(fā)布時曾給出這個問題的最優(yōu)解。

首先這個問題可以分為兩類:

  • 在單位正方形內(nèi)填充
  • 在總和為4的矩形內(nèi)填充

第一個問題,給定一個正整數(shù)??,該問題是在單位正方形內(nèi)打包??個不相交的圓,使它們的半徑總和最大

AlphaEvolve找到了兩個「新的構(gòu)造」,給出了當(dāng)時的最優(yōu)解。

  • 當(dāng)??=26時,原來的最優(yōu)解是2.634,AlphaEvolve將其提升到了2.635;見下圖(左)。
  • 當(dāng)??=32時,原來的最優(yōu)解是2.936,AlphaEvolve將其提升到了2.937;見下圖(中)。

圖片

第二個問題,給定一個正整數(shù)??,該問題是在周長為4的矩形內(nèi)打包??個不相交的圓,使它們的半徑總和最大。

AlphaEvolve為??=21找到了一種「新的構(gòu)造」,將原來的最優(yōu)解從2.364提高到了2.3658;見上圖(右)。

AlphaEvolve改進了在不同約束下Circle Packing的已知最優(yōu)解,創(chuàng)造了當(dāng)時的世界紀(jì)錄。

但這個紀(jì)錄很快就被破了!

一家做信用卡評分的企業(yè)聲稱超越了AlphaEvolve

在介紹新的紀(jì)錄前,我們還是要簡單回顧下谷歌的AlphaEvolve。

5月14日,谷歌發(fā)布了一款由Gemini驅(qū)動的編碼智能體,看名字就知道,這個新工具可以自行設(shè)計算法來求解問題。

就像當(dāng)年AlphaGo之后的AlphaZero,通過「自我博弈」來提升下棋能力,順便說一句DeepMind對于Alpha和強化學(xué)習(xí)的執(zhí)念一直都在。

圖片

這種基于LLM,由Gemini驅(qū)動的的新工具,能夠自行編寫算法以解決那些「臭名昭著」的數(shù)學(xué)難題。

AlphaEvolve編寫的Python代碼能夠為數(shù)學(xué)問題找到有效的解決方案,并且在某些情況下,這些解決方案優(yōu)于此前已知的最佳方案。

換句話說,AlphaEvolve在某些長期存在的數(shù)學(xué)問題上創(chuàng)造了新的紀(jì)錄。

圖片

AlphaEvolve發(fā)現(xiàn)過程的擴展視圖

AlphaEvolve采用了一種進化方法來發(fā)現(xiàn)新算法。

白皮書報告中提到的示例包括改進的矩陣乘法方法以及圓填充問題的新解法。

隨后,一家名為FICO的公司試圖挑戰(zhàn)這個紀(jì)錄。

FICO(Fair Isaac Corporation)是一個專注于數(shù)據(jù)分析和決策管理的美國公司,最著名的產(chǎn)品是FICO信用評分,廣泛用于信貸行業(yè)評估個人的信用風(fēng)險。

他們想如果把同樣的問題交給 FICO Xpress Solver(FICO Xpress優(yōu)化套件的一部分)會有什么結(jié)果。

圖片

他們與位于柏林祖斯研究所(ZIB)的MODAL研究園區(qū)合作測試了新方法。

結(jié)果發(fā)現(xiàn),他們的算法更出色!

在AlphaEvolve報告中的多個基準(zhǔn)問題上,F(xiàn)ICO Xpress Solver產(chǎn)生了新的最優(yōu)解,超越了DeepMind此前創(chuàng)下的紀(jì)錄。

FICO研究了Circle Packing問題的一個版本:

任務(wù)是將任意大小的圓放入單位正方形中,以最大化它們半徑的總和。

我們現(xiàn)在知道,AlphaEvolve找到了半徑總和為2.63586275的解決方案,優(yōu)于此前最優(yōu)的2.634。

而FICO Xpress Solver則找到了更優(yōu)的解,半徑總和達到2.63591551。

左邊是谷歌的構(gòu)造,右邊是FIC的構(gòu)造,看起來圓形的排布幾乎一樣,只有半徑的細微差別,肉眼很難發(fā)現(xiàn),更別說用人力來窮舉了。

圖片

對于非單位正方形,F(xiàn)ICO聲稱只需從上個問題的模型中修改五行代碼,便能夠攻克下一個挑戰(zhàn)。

使用FICO Xpress得到的解2.36583237略微改進了AlphaEvolve得到的解2.36583213。

這些結(jié)果都可以通過谷歌DeepMind在Google Colab筆記本的驗證器進行確認,驗證代碼如下:

#@title Visualization function
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches
defplot_circles(circles: np.ndarray):
"""Plots the circles."""
_, ax = plt.subplots(1, figsize=(7, 7))
ax.set_xlim(0, 1)
ax.set_ylim(0, 1)
ax.set_aspect('equal')  # Make axes scaled equally.
Draw unit square boundary.
rect = patches.Rectangle((0, 0), 1, 1, linewidth=1, edgecolor='black', facecolor='none')
ax.add_patch(rect)
Draw the circles.
for circle in circles:
circ = patches.Circle((circle[0], circle[1]), circle[2], edgecolor='blue', facecolor='skyblue', alpha=0.5)
ax.add_patch(circ)
plt.title(f'A collection of {len(circles)} disjoint circles packed inside a unit square to maximize the sum of radii')
plt.show()

谷歌還提供了畫圖代碼,代碼如下:

#@title Visualization function
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches
defplot_circles(circles: np.ndarray):
  """Plots the circles."""
  _, ax = plt.subplots(1, figsize=(7, 7))
  ax.set_xlim(0, 1)
  ax.set_ylim(0, 1)
  ax.set_aspect('equal')  # Make axes scaled equally.
  # Draw unit square boundary.
  rect = patches.Rectangle((0, 0), 1, 1, linewidth=1, edgecolor='black', facecolor='none')
  ax.add_patch(rect)
  # Draw the circles.
  for circle in circles:
    circ = patches.Circle((circle[0], circle[1]), circle[2], edgecolor='blue', facecolor='skyblue', alpha=0.5)
    ax.add_patch(circ)
  plt.title(f'A collection of {len(circles)} disjoint circles packed inside a unit square to maximize the sum of radii')
  plt.show()

以下是谷歌在n=26問題中提供的最終圓形數(shù)據(jù),感興趣可以試試。

圖片

以上這些問題,都可以歸類為全局優(yōu)化問題。

在全局優(yōu)化中,目標(biāo)不僅僅是找到一個解決方案,而是要證明該方案是最優(yōu)解(或提供一個解與最優(yōu)解之間接近程度的界限)。

谷歌在AlphaEvolve的支持下開發(fā)的算法采用了略有不同的方法:它們屬于啟發(fā)式算法,專注于尋找較優(yōu)解,而非提供解的界限。

AlphaEvolve報告中的大多數(shù)問題要么沒有約束,要么僅受到輕微約束,例如僅受到簡單的變量邊界限制。

這使得它們特別適合采用自動訓(xùn)練的啟發(fā)式搜索方法,因為算法可以自由地探索解空間,而無需處理復(fù)雜的約束交互或陷入局部不可行的情況。

這些問題的真正挑戰(zhàn)在于其高度非線性且通常非凸的目標(biāo)函數(shù),這類函數(shù)可能產(chǎn)生多個局部最優(yōu)解。

就像谷歌AlphaEvolve的宣傳圖上的小圓點。

不過FICO聲稱他們的技術(shù)采用的是非生成式AI技術(shù)的全局優(yōu)化,功能要強大得多。

不僅能夠處理此類非線性問題,還能夠有效應(yīng)對高度約束的問題,包括具有整數(shù)性要求的問題,這類問題的可行解可能極少,并且這些解可能位于搜索空間中狹窄或不連續(xù)的區(qū)域。

「屠龍」少年

今天X平臺上一位名叫Alex的學(xué)生,聲稱他通過一個半月的獨自努力,創(chuàng)建的「Tactical Maniac v0.5」打敗了谷歌的AlphaEvolve。

圖片

這是一個多智能體算法發(fā)現(xiàn)框架,從高層次看,該算法通過迭代現(xiàn)有方案來探索創(chuàng)意空間。

圖片

Alex公布了他的成果。

在n=26的情況下,他的結(jié)果為2.63592717。

并且他聲稱已經(jīng)通過谷歌Colab筆記本中的驗證器進行了驗證,也畫出了圖形。

圖片

作為對比,我們把之前AlphaEvolve的方案和FICO的方案放在一起:

  • AlphaEvolve前:2.634
  • AlphaEvolve:2.63586275(+0.00186275)
  • FICO Xpress:2.63591551(+0.00005276)
  • Alex:2.63592717(+0.00001166,比AlphaEvolve +0.00006442)

從構(gòu)造上來看,Alex的解決方案與谷歌的類似,只是旋轉(zhuǎn)了90度。

但是圓形的大小有了細微的差別,這是靠人力無法完成計算的。通過微調(diào),終于從已經(jīng)「極限」的求解方案中找到新的更優(yōu)解。

圖片

他是怎么做到的?

目前Alex并沒有提供類似白皮書的詳細求解方法說明。

他聲稱由于還要求解一些其他問題,因此想保留部分信息作為專有內(nèi)容。

而他的主頁除了標(biāo)識了自己的UIUC CS專業(yè)外,沒有更多的信息。

這讓他變得十分神秘。

圖片

Alex聲稱他的方法和AlphaEvolve最為相似。

整體而言,Alex的方法使用LLM通過變異代碼來探索搜索空間。接下來會進一步微調(diào)云云。

在Reddit上已經(jīng)有人開始催促少年盡快發(fā)布白皮書來進行同行評審。

圖片

所以,Alex的這個結(jié)果是否能被學(xué)術(shù)界認定,依然還是個未知數(shù)。

但他在取得成績的第一時間,迅速在X和Reddit平臺來發(fā)帖,聲稱自己超越了谷歌的AlphaEvolve,并在Circle Packing問題上創(chuàng)造了新的世界紀(jì)錄。

圖片

但是同時,他又選擇不第一時間公開算法原理或者白皮書。

這讓人不禁聯(lián)想到最近兩天IMO的「鬧劇」。

AI時代的「快與慢」

IMO 2025剛剛結(jié)束沒有幾天,關(guān)于AI能否「拿下」金牌的,或者誰是第一家拿下金牌的AI工具,已經(jīng)爆發(fā)了戲劇性的沖突。

OpenAI的研究員率先站出來說「我們的推理模型」可以達到IMO金牌水準(zhǔn)。

公司的總裁Greg也理解發(fā)帖來支持這個說法。

圖片

但也就過去不到24小時,就被爆出,其實谷歌的模型也拿下了IMO金牌。

據(jù)一位IMO內(nèi)部人士透露,實際上OpenAI并沒有和組委會合作,拿下AI金牌不一定真實有效。

最關(guān)鍵的是,他們違背了IMO規(guī)定的「公布時間」規(guī)則。

為了避免AI公司們搶奪人類學(xué)生的風(fēng)頭,IMO評審團要求:在閉幕式結(jié)束一周后再公布結(jié)果。

然而,OpenAI卻在閉幕Party還未結(jié)束前,就發(fā)布了結(jié)果。

圖片

甚至,菲爾茲獎得主陶哲軒也一口氣連發(fā)三條評論暗諷OpenAI。

他表示,「自己不會評論任何未預(yù)先公開測試方法的AI競賽成績報告。在缺乏受控測試環(huán)境的情況下,AI的數(shù)學(xué)能力難以準(zhǔn)確評估」。

不論最終結(jié)果如何,這場鬧劇已經(jīng)證明AI已經(jīng)深度介入人類研究。

即使是在被譽為「人類智慧最后的堡壘」數(shù)學(xué)問題上。

Alex宣稱戰(zhàn)勝谷歌,和OpenAI「搶先」宣布拿下IMO金牌,本質(zhì)上都是為了搶奪當(dāng)下「第一個發(fā)現(xiàn)者/創(chuàng)造者」的定位。

正如谷歌DeepMind的產(chǎn)品負責(zé)人Logan Kilpatrick所說:

真正的AI里程碑是當(dāng)任何人、在任何地方都能取得重大突破,而不只是斯坦福的博士們。

當(dāng)一個身處「意料之外」地方的學(xué)生,用AI能解決全球性問題的時候,你就知道這項技術(shù)真正起作用了。

從谷歌最頂尖的AI實驗室,到實力雄厚的FICO優(yōu)化求解器,再到如今橫空出世的Alex,我們見證的已不僅是算法的迭代,更是科研范式的深刻變革。

AI正成為那個最強大的杠桿,它將曾經(jīng)專屬于頂級機構(gòu)的算力和智慧,普及到每一個擁有創(chuàng)想的個人手中。

讓「單槍匹馬挑戰(zhàn)巨頭」從神話變?yōu)楝F(xiàn)實。

然而,正如IMO賽場上的爭議所警示的那樣,當(dāng)發(fā)現(xiàn)的喜悅被「搶跑」的喧囂所裹挾,我們更需一份冷靜與審慎。

在這個「發(fā)現(xiàn)」被無限加速的時代,速度與聲明,必須與嚴謹和驗證同行。

Alex的成果是否能最終通過同行評審的嚴格考驗,為這場傳奇畫上圓滿的句號,我們拭目以待。

但可以肯定的是,「游戲的規(guī)則」已經(jīng)被徹底改寫!

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2018-08-03 16:09:42

搜狗

2025-09-24 10:45:41

2011-03-23 10:20:25

中興光通信100G

2018-07-03 09:37:12

量子計算機編碼

2019-10-15 09:07:30

AI 數(shù)據(jù)人工智能

2021-04-25 21:26:47

量子芯片U盤

2024-06-03 12:03:56

2020-05-21 10:26:35

數(shù)據(jù)庫

2020-05-21 10:06:23

支付寶OceanBaseTPC-C

2011-11-17 13:13:18

戴爾服務(wù)器

2014-10-23 16:22:05

華為

2014-11-03 16:07:03

華為服務(wù)器

2016-06-20 17:55:18

戴爾閃存

2019-02-21 22:25:18

曙光

2017-11-14 12:27:44

ThinkSystem

2019-07-17 16:48:00

AI 數(shù)據(jù)人工智能

2016-09-02 14:53:11

戴爾

2013-09-18 15:30:42

華為服務(wù)器華為RH5885 V2

2022-04-08 08:11:28

Python代碼
點贊
收藏

51CTO技術(shù)棧公眾號