偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

史上首次!谷歌AI玩家在星際爭霸II中擊敗人類

新聞 人工智能
日前,谷歌(Google)旗下 DeepMind 公司開發(fā)的人工智能軟件玩家在“星際爭霸 II”(Starcraft II)游戲中上擊敗了人類玩家——這在人工智能領(lǐng)域尚屬首例。

 [[256388]]

游戲在 DeepMind 公司的英國倫敦總部進(jìn)行了直播

  日前,谷歌(Google)旗下 DeepMind 公司開發(fā)的人工智能軟件玩家在“星際爭霸 II”(Starcraft II)游戲中上擊敗了人類玩家——這在人工智能領(lǐng)域尚屬首例。

  在 YouTube 和 Twitch 上播放的一系列游戲比賽中,AI 玩家連續(xù) 10 場擊敗人類玩家。在最后一場比賽中,職業(yè)游戲玩家科明茨(Grzegorz “MaNa” Komincz)為人類奪取了一場勝利。

  DeepMind 公司的研究負(fù)責(zé)人大衛(wèi)·西爾弗(David Silver)在比賽結(jié)束后表示:“人工智能在不同的游戲比賽中取得的成績,成為人工智能發(fā)展的重要里程碑。我希望——盡管顯然還有工作要做——未來的人們可能會回顧今天,并認(rèn)識到這是人工智能系統(tǒng)潛在能力又邁出的重要一步。”

  在電子游戲中打敗人類看起來像是人工智能發(fā)展中的一場雜耍,但這其實(shí)是一個重大的研究挑戰(zhàn)。像“星際爭霸2”這樣的游戲比棋類游戲(如國際象棋或圍棋)更難玩。在電子游戲中,人工智能軟件實(shí)體不能通過觀察每一個棋子的運(yùn)動來計(jì)算下一步的動作,他們必須實(shí)時作出反應(yīng)。

[[256389]]

一張去年 12 月份的游戲截圖,顯示了 AlphaStar 與 TLO 的對決

  這些因素看起來并不是 DeepMind 人工智能游戲玩家系統(tǒng)(AlphaStar)的主要障礙。首先,它擊敗了職業(yè)玩家達(dá)里奧“TLO”Wünsch,然后它開始挑戰(zhàn)科明茨。一系列比賽最初于去年 12 月在 DeepMind 的倫敦總部舉行,但今天對科明茨的最后一場比賽提供了直播,這位職業(yè)玩家為人類帶來了一場勝利。

  專業(yè)的星際爭霸評論員形容 AlphaStar 的表現(xiàn)是“非凡的”和“超人的”。

  在“星際爭霸 II”中,首先需要從同一張地圖的不同位置開始,隨后建立基地、訓(xùn)練軍隊(duì)和入侵?jǐn)橙祟I(lǐng)土。AlphaStar 特別擅長所謂的“微管理”(Micromanagement),即在戰(zhàn)場上快速果斷地控制部隊(duì)的能力。

  盡管人類玩家有時能訓(xùn)練出更強(qiáng)大的軍隊(duì),但 AlphaZero 仍能在近距離擊敗他們。在一場游戲中,AlphaStar 用一個快速移動的“潛行者”(Stalker)聚集了法力。評論員凱文“鹿特丹”范德科形容它實(shí)現(xiàn)了“非凡的軍隊(duì)控制,這不是一般人平時所能看到的水平。”

  在游戲比賽結(jié)束之后,科明茨表示:“如果我和任何人類對手比賽,他們就不會以這么高的水平對‘潛行者’進(jìn)行微操控。”

  這一事件與我們從其他高級人工智能游戲玩家中看到的行為相呼應(yīng)。

  去年,當(dāng) OpenAI 公司的 AI 玩家參加 Dota 2 的比賽時,他們最終被人類玩家所擊敗。不過,當(dāng)時業(yè)內(nèi)專家點(diǎn)評指出,AI 軟件玩家表現(xiàn)出了優(yōu)秀的清晰度和準(zhǔn)確度,能夠快速無誤地做出判斷,這也是人工智能玩家的優(yōu)勢所在。

  專家們已經(jīng)開始剖析這一次的游戲?qū)Q,并討論 AlphaStar 是否獲得了任何不公平的優(yōu)勢。人工智能玩家(軟件實(shí)體)在某些方面表現(xiàn)不佳,例如,AI 玩家每分鐘進(jìn)行的點(diǎn)擊次數(shù)被限制。不過,與人類玩家不同的是,它能夠一次查看整個地圖,而不是手動導(dǎo)航。

  DeepMind 公司的研究人員說,AI 玩家實(shí)際上并未獲得真正的優(yōu)勢,因?yàn)樗谌魏螘r候只專注于地圖的一個部分。但是,正如游戲過程所顯示,這并沒有阻止 AlphaStar 同時在三個不同的區(qū)域熟練地控制部隊(duì)。評論員表示,這對人類玩家來說是不可能的。值得注意的是,當(dāng)科明茨在直播的比賽中擊敗 AlphaStar 時,AI 正在使用一個受限的相機(jī)視圖模式。

  另外需要指出的是,這次和人工智能玩家對決的對手雖然是職業(yè)玩家,但并不是世界冠軍水平。參加比賽的玩家 TLO 還必須完成星際爭霸 II 中他所不熟悉的比賽。

圖形顯示了 AlphaStar 的游戲處理過程。該系統(tǒng)自上而下地觀察整個地圖,并預(yù)測哪些行為將獲得勝利

  撇開這一討論不談,專家們說,這場比賽是人工智能向前邁出的重要一步。長期參與“星際爭霸”人工智能場景研究的研究員戴夫·丘吉爾告訴英國“衛(wèi)報(bào)”:“我認(rèn)為人工智能游戲軟件實(shí)體所表現(xiàn)出的能力是一項(xiàng)重大成就,至少比我在人工智能研究人員中聽到的最樂觀的猜測早一年。”

  然而,丘吉爾也補(bǔ)充說,由于 DeepMind 還沒有發(fā)布任何有關(guān)這項(xiàng)工作的研究論文,因此很難判斷出 AlphaStar 是否獲得了任何技術(shù)上的飛躍。丘吉爾說:“我還沒有讀過這篇博客文章,也沒有看到任何文件或技術(shù)細(xì)節(jié)來做出一個判斷。”

  佐治亞理工學(xué)院人工智能副教授馬克·里德爾(Mark Riedl)說,他對游戲比賽結(jié)果并不感到驚訝,人工智能擊敗人類玩家只是“一個時間問題”。

  里德爾補(bǔ)充說,他并不認(rèn)為這場比賽表明星際爭霸 II 確實(shí)被人工智能玩家所征服。他表示,在過去直播的游戲中,AlphaStar 被限制在窗口中,這消除了人工智能的一些優(yōu)勢,“但我們看到的更大問題…是人工智能所學(xué)到的策略是脆弱的,當(dāng)一個職業(yè)玩家把人工智玩家逼出舒適區(qū)時,人工智能就會崩潰。”

  實(shí)際上,讓人工智能玩家在電子游戲中擊敗人類,其最終目的是提高人工智能的訓(xùn)練方法,特別是創(chuàng)造出能夠在類似星際爭霸這樣復(fù)雜的虛擬環(huán)境中運(yùn)行的人工智能系統(tǒng)。

  為了訓(xùn)練 AlphaStar,DeepMind 公司的研究人員使用了一種稱為強(qiáng)化學(xué)習(xí)的方法。AI 軟件實(shí)體為了達(dá)到某些目標(biāo)(如獲勝或僅僅是活著),基本上是通過反復(fù)試驗(yàn)來玩這個游戲的。他們首先通過模仿人類玩家來學(xué)習(xí),然后在游戲競技比賽中互相學(xué)習(xí)。在不同的 AI 軟件實(shí)體中,強(qiáng)者生存,弱者被拋棄。DeepMind 估計(jì),它的每一個 AlphaStar 軟件實(shí)體都以這種方式積累了大約 200 年的游戲時間,隨著游戲積累,它們玩游戲的速度也越來越快。

  DeepMind 清楚地知曉其開展這項(xiàng)工作的目標(biāo)。“最重要的是,DeepMind 的任務(wù)是構(gòu)建一種通用的人工智能系統(tǒng)。”AlphaStar 項(xiàng)目的負(fù)責(zé)人奧里爾·維尼亞爾斯(Oriol Vinyals)說,他指的是建立一個能執(zhí)行人類所能完成的任何心理任務(wù)的人工智能軟件實(shí)體。“要做到這一點(diǎn),重要的是要對我們的人工智能軟件實(shí)體在各種任務(wù)中的表現(xiàn)進(jìn)行測評對比。”

責(zé)任編輯:張燕妮 來源: 騰訊科技
相關(guān)推薦

2024-09-23 15:04:16

2023-11-18 09:48:23

2010-07-19 13:15:49

星際爭霸2

2012-01-17 12:39:09

JavaSwing

2024-04-22 07:00:00

AI駕駛

2010-01-14 17:17:32

云計(jì)算

2013-07-02 13:52:07

2021-01-07 14:56:55

AI 數(shù)據(jù)人工智能

2021-12-01 10:01:52

AI 游戲人工智能

2021-11-30 08:00:00

人工智能數(shù)據(jù)技術(shù)

2014-03-18 15:23:58

星際爭霸ARM平臺

2022-03-07 10:21:13

瀏覽器兼容性供應(yīng)商

2009-08-18 09:47:44

百強(qiáng)游戲任天堂

2019-10-31 14:37:55

技術(shù)人工智能開發(fā)

2022-08-05 14:59:21

iOS漏洞測試

2022-06-02 15:19:31

架構(gòu)智能強(qiáng)化學(xué)習(xí)

2024-04-11 12:30:40

2011-05-13 11:49:42

網(wǎng)絡(luò)安全技術(shù)周刊

2010-08-01 22:30:12

2019-01-30 11:17:46

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號