教AI逐幀搓招玩《鐵拳》通關最高難度，現在的街機游戲愛好者牛啊博雯發自凹非寺量子位|公眾號

博雯發自凹非寺量子位|公眾號QbitAI
現在的AI都開始學著逐幀搓招打街機了？
《拳皇98》、《街頭霸王》、《死或生》……一干童年回憶全都玩了個遍，其中還有號稱要打5000場才能入門的3D格斗游戲《鐵拳》：

文章圖片
沒錯，就是那個對新手極不友好的《鐵拳》，隨便拉一張角色的搓招表感受一下這個復雜度：
（沒錯，各種壓幀判定的JF技就是其特色之一）

文章圖片
△鐵拳TT2出招表
但AI偏偏就能在入坑沒多久就通關了最高難度：

文章圖片
△左側為AI
這款AI的背后是一位個人開發者，也是一位骨灰級的街機游戲愛好者。
他訓練出來的新手“鐵匠”在Reddit的“比賽錄播”已經有近500的熱度：

文章圖片
強化學習訓練框架
這位AI鐵匠的背后，是一個叫做DIAMBRAArena的強化學習交互框架。
DIAMBRAArena提供了多個強化學習研究和實驗環境，具有情節性的強化學習任務，由離散的動作（如游戲手柄按鈕）和屏幕中的像素和數據（如人物血條）組成。
在這一框架中，智能體會向環境發送一個動作，環境對其進行處理，并相應地將一個起始狀態轉換為新狀態，再將觀察和獎勵返回給智能體，以此交互循環：

文章圖片
要實現上述循環的代碼也非常簡單：
importdiambraArena#Mandatorysettingssettings={}settings["gameId"]="doapp"#Gameselectionsettings["romsPath"]="/path/to/roms/"#Pathtoromsfolderenv=diambraArena.make("TestEnv",settings)observation=env.reset()whileTrue:actions=env.action_space.sample()observation,reward,done,info=env.step(actions)ifdone:observation=env.reset()breakenv.close()
這一框架目前支持Linux、Windows、MacOS等主流的操作系統。
而這款AI的“實戰場”為早期的TekkenTagTournament ，當然，搓招復雜度完全不遜色于之后的新版本……

文章圖片
開發者選擇了風間仁（Jin）和吉光（Yoshimitsu）兩名具有代表性的角色作為主要操作對象。
【教AI逐幀搓招玩《鐵拳》通關最高難度，現在的街機游戲愛好者牛啊】輸入分別為：從RGB轉換為灰度，并縮小到128x128px的游戲屏幕像素值、對戰局數（Stage）、人物血條、游戲界面的一側。
訓練中的獎勵是一個基于生命值的函數，如果對方生命值損傷則得到正面獎勵，己方控制的角色生命值損失則得到負面懲罰。
同時， AI的動作速率也被限定為最大速率的1/10 ，即游戲中每6步發送一個動作。
由于框架使用的是一種離散的動作空間，因此，智能體在訓練中的同一時間只能選擇一個移動動作9向上，向下等）或攻擊動作（沖擊，踢，出拳) 。
因此，雖然一個連擊組合的實戰能力更強，但由于AI無法同時點擊兩個動作，在真實的對戰中，便會出現AI頻繁使用踢（Kick）和更換角色（swap）兩個動作的情況：

文章圖片
評論區有資深PVP愛好者表示，想要看到這種頂級AI選手互虐的激烈場景，而開發者本人對此非常贊同：
我們正在創建一個平臺，在這個平臺上，程序員將提交他們訓練有素的AI并互相對抗，并在我們的頻道上播放比賽。

欧美日韩国产一区二区|qovd片|小明个人发布看看|小浪货你夹真紧水又多|老头把我添高潮了A片故|99热久久精品国产一区二区|久久久春色AV

教AI逐幀搓招玩《鐵拳》通關最高難度，現在的街機游戲愛好者牛啊

相關經驗推薦

亞絲娜|近十年來超受歡迎的人氣日漫角色，琦玉老師榜上有名

大家好我是指尖|劉禪大招傷害bug被公布，這是熱度爆表的原因？用不好傷害降低

除濕氣茶什么時間喝好去濕氣茶什么季節喝好

不什么其什么，不什么其什么填空

顯卡|海關查貨礦渣顯卡，訊景官方店鋪關閉

10-3，7-7，5-8，LPL三支“偽強隊”終于確認！RNG迎來完美劇本

火影忍者|《火影忍者》在日漫歷史中是什么地位？

96歲大眾前掌門人卡爾·哈恩去世，曾引領品牌全球擴張、推動上汽大眾建立

對你的愛戀歌詞，對你的愛戀歌詞是什么歌

嬴政新傳說突襲，馬超新特效帥哭，亞瑟雙喜臨門，6元給阿古朵

肇慶加美學校收費標準肇慶加美學校學費包括哪些

成都旅游注意事項須知成都旅游注意事項

原神潺潺向前任務怎么做？好奇的嫣朵拉獲取方法介紹[多圖]

土豆餅煎多久熟

游戲《質量效應：傳奇版》發布首個社區補丁

人生總是充滿變數

泡個茶回民話怎么說

戴沐白|斗羅大陸：為什么戴沐白會主動放棄王位？原來他有更大的謀劃

被開水燙了怎么辦

原神樺木在哪里采集原神樺木在哪