編程大神SethBling開發(fā)AI軟件 在《馬里奧賽車》中獲得勝利
國(guó)外的游戲編程大神SethBling又推出新玩意,此前他曾經(jīng)在《我的世界》中開發(fā)了一套MOD,能夠在MC中運(yùn)行Atari 2600模擬器,并運(yùn)行《大金剛》《太空入侵者》等游戲;他也曾經(jīng)在《超級(jí)馬里奧世界》中植入了《像素鳥》的代碼。現(xiàn)在他又訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò)來玩初代《馬里奧賽車》,在通過15個(gè)小時(shí)的游戲視頻訓(xùn)練并改進(jìn)一些行為后,這套AI系統(tǒng)最終在游戲的獎(jiǎng)杯賽中獲得了金牌。
這套系統(tǒng)為 MariFlow,通過學(xué)習(xí)人類玩家的操作來進(jìn)行訓(xùn)練,并通過手動(dòng)加權(quán)修改來改進(jìn)其行為,MariFlow 使用了循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network),這意味著它可以對(duì)前面的信息進(jìn)行記錄,賽車游戲中會(huì)遇到的突發(fā)狀況要復(fù)雜得多,有時(shí) MariFlow 會(huì)撞墻,在原地打轉(zhuǎn)。這種情況下,SethBling就會(huì)手動(dòng)介入,并且?guī)椭?jì)算機(jī)糾正應(yīng)對(duì)措施。通過循環(huán)神經(jīng)網(wǎng)絡(luò),就會(huì)在經(jīng)驗(yàn)中學(xué)習(xí),防止再發(fā)生類似的錯(cuò)誤。
經(jīng)過一系列訓(xùn)練后,AI在《馬里奧賽車》的大獎(jiǎng)賽模式里,、MariFlow 已經(jīng)在蘑菇杯和花杯中獲得了金牌,在星星杯中獲得了銀牌,盡管都是在低難度50cc組別下取得的。




























