偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

中國AI麻將打出新高度!戰(zhàn)勝真人職業(yè)選手,鵝廠「絕藝」刷新戰(zhàn)績

人工智能
在AI打麻將背后,提升的其實(shí)是AI在問題決策上的能力,這也有利于讓AI去解決更多現(xiàn)實(shí)生活中復(fù)雜的問題。所以絕藝LuckyJ是怎么做到的?

不愧是中國AI,打麻將“輕松”登頂。

騰訊最新消息,旗下棋牌類AI“絕藝”LuckyJ在日本麻將平臺“天鳳”上,刷新AI在麻將領(lǐng)域最好成績。

僅需1321盤對局,絕藝LuckyJ就達(dá)到了AI最高段位,比第二名Suphx減少了4052盤對局。

而且它的能力穩(wěn)定在十段,要知道人類頂級選手的平均穩(wěn)定段位也只有7.4。

圖片圖片

在日本麻將天鳳平臺上,絕藝LuckyJ也成為僅有的27個(gè)達(dá)到十段的玩家之一(包括AI),而該平臺的平均活躍人數(shù)在23.8萬。

不止是日本麻將,在國標(biāo)麻將中,絕藝LuckyJ也曾擊敗過六位職業(yè)選手,成為首個(gè)戰(zhàn)勝國標(biāo)麻將職業(yè)選手的麻將AI。

圖片圖片

其中一位國標(biāo)麻將選手作出了這樣的評價(jià)。

我們通常所謂的妙手、靈光一現(xiàn),甚至是基于經(jīng)驗(yàn)和感覺做出的置之死地而后生的選擇,對于AI來說可能都是常規(guī)操作了。

在絕藝LuckyJ拿下日本麻將十段后,還有不少網(wǎng)友前來祝賀。

圖片圖片

圖片圖片

畢竟在AI打麻將背后,提升的其實(shí)是AI在問題決策上的能力,這也有利于讓AI去解決更多現(xiàn)實(shí)生活中復(fù)雜的問題。

所以絕藝LuckyJ是怎么做到的?

打麻將AI需要學(xué)會更平衡的策略

先來看AI打麻將難在哪。

對于AI來說,玩游戲是一種極佳的檢驗(yàn)其能力的方式,常見形式比如下象棋、下圍棋、打王者榮耀等。

在這其中,圍棋和象棋等屬于完美信息博弈。即游戲雙方在每次落子前都能看到全局信息,也就是相互能看到彼此的情況。

這對AI來說難度并不高,因?yàn)樗梢酝ㄟ^強(qiáng)大算力暴力求解,找到一個(gè)最優(yōu)解。

但是打麻將的情況就復(fù)雜了。

玩家之間不僅無法看到多個(gè)其他玩家的牌,還有大量信息隱藏在沒有揭開的牌里,這就是典型的非完美信息博弈。

也就是說AI和人類玩家在最開始時(shí)都只能看到自己手里的13張牌,另外有一百多張牌未知。而且在每次打牌時(shí)要做一系列復(fù)雜的決策,比如是否吃牌、碰牌、胡牌等,做出的決策還要兼顧進(jìn)攻和防守。

與此同時(shí),其他玩家的吃碰杠操作都會改變接下來的摸牌順序,決策更加復(fù)雜。

在這樣一個(gè)橫坐標(biāo)表示可觀察信息量、縱坐標(biāo)表示隱藏信息量的圖標(biāo)中,可以看到麻將包含的隱藏信息遠(yuǎn)遠(yuǎn)高于其他棋牌游戲。

圖片圖片

所以該怎么辦?

騰訊AI Lab提出了一種基于強(qiáng)化學(xué)習(xí)和遺憾值最小化的自我博弈技術(shù)。

這使得AI能從零開始自我學(xué)習(xí)和提升能力,并最終收斂到一個(gè)最強(qiáng)的混合策略,在實(shí)際對戰(zhàn)過程中可以具備更加平衡的策略能力。

同時(shí)考慮到傳統(tǒng)的非完美信息搜索算法在麻將面前很難發(fā)揮太大作用,研究人員還基于樂觀價(jià)值估計(jì)的思想,提出了一種高效的非完美搜索方法,使得AI能在海量隱藏信息的游戲狀態(tài)中,實(shí)時(shí)調(diào)整當(dāng)前策略,更好應(yīng)對多變的戰(zhàn)局。

據(jù)研究員介紹,相比人類,AI在麻將游戲中,擁有更加平衡的策略,對局勢的計(jì)算非常精確,其中包括打每張牌的期望收益、未來可能胡哪些番型等等。在這樣的“策略”訓(xùn)練下,AI之后也能更快速進(jìn)入到其他行業(yè)中去。

在具體實(shí)戰(zhàn)測試中,絕藝LuckyJ是在“天鳳”中對決。

這是一個(gè)老牌日本麻將游戲平臺,創(chuàng)建于2006年。

從bootstrap分布來看,絕藝LuckyJ顯著強(qiáng)于另外兩個(gè)日本麻將AI(Suphx、NAGA):LuckyJ vs Suphx p value=0.02883;LuckyJ vs NAGA p value=3e-05。

圖片圖片

另外在國標(biāo)麻將將近2000場對局中,絕藝LuckyJ的平均贏番達(dá)到1.76番。

(這里番表示國標(biāo)麻將的結(jié)算單位,數(shù)值越大說明贏得越多)

圖片圖片

圖片圖片

游戲AI已經(jīng)跨行應(yīng)用了

不過,這么費(fèi)勁提升AI的打麻將能力,當(dāng)然不是只想讓它打麻將。

騰訊 AI Lab 研究員介紹,在游戲環(huán)境中推進(jìn)決策AI的能力,最終是希望AI能從虛擬走向現(xiàn)實(shí),解決真實(shí)世界的復(fù)雜問題。

在現(xiàn)實(shí)世界中充滿了需要在非完美信息狀態(tài)下做決策的場景,比如金融交易、自動(dòng)駕駛、交通物流、拍賣系統(tǒng)等。

而且騰訊AI Lab也已經(jīng)有了實(shí)際案例。

其旗下另一個(gè)決策AI絕悟,就學(xué)會了識別病理全片掃描圖像中的病灶位置,效率是傳統(tǒng)方法的400%。

圖片圖片

這個(gè)AI找尋最優(yōu)看片路徑的方法,是基于強(qiáng)化學(xué)習(xí)。

它避免了用傳統(tǒng)的窮舉方式去分析局部圖像切塊,而是先決策找到有觀察價(jià)值的區(qū)域,并通過跨多個(gè)分辨率級別獲得代表性特征,以加速完成全片判讀。

通過模仿人類的思維方式,不僅提高了看片效率,還做到了節(jié)約成本。

綜上,會玩《我的世界》的絕悟已經(jīng)能懸壺濟(jì)世了,也讓人期待會打麻將的絕藝之后能跨行干啥呢?

你覺得絕藝LuckyJ有哪些可應(yīng)用的方向?

責(zé)任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2020-11-25 15:58:59

AI 數(shù)據(jù)人工智能

2025-07-02 07:25:00

惡意數(shù)據(jù)集LLMAI

2023-10-14 13:06:11

AI視頻

2016-11-10 16:28:04

2022-01-05 10:42:12

AI 數(shù)據(jù)人工智能

2011-10-13 10:08:51

iOS 5iOS

2015-09-14 16:12:12

云計(jì)算大數(shù)據(jù)高度

2020-08-24 14:25:02

AI 數(shù)據(jù)人工智能

2018-08-20 14:58:05

OA

2020-07-03 18:01:06

邊緣計(jì)算物聯(lián)網(wǎng)技術(shù)

2024-09-25 14:57:52

2025-04-17 14:19:46

2021-08-06 15:18:27

聯(lián)想智慧服務(wù)

2025-01-23 20:42:44

2022-06-01 15:14:29

智能工廠智能制造5G

2015-03-06 09:00:23

Java高度關(guān)注內(nèi)存使用機(jī)制

2025-04-15 08:01:12

2024-04-15 12:07:13

AI虛擬人
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號