當前位置：首頁 > 遊戲 > 正文

單機《星際争霸2》AI，不用GPU集群，支持多種訓練環境

啟示号
遊戲
2年前
451

新智元報道

來源：Github

編輯：文強

【新智元導讀】如果說我們的征途是星辰大海，那麼星際争霸必定是其中一關。今天，有人在Github開源了他潛心研究一年半的成果，一個新手和資深研究人員都能受益的深度強化學習框架，單機運行速度快、方便調式，支持多種強化學習訓練環境。

上周結束的AIChallenger星際争霸競賽，讓AI挑戰星際争霸這個議題又稍稍火了一把。雖然這屆冠軍使用的仍然是硬編碼方法，但從其他解決方案中不難看出，AI算法的占比在不斷提升。

作為圍棋之後DeepMind公開宣布的下一個攻克目标，《星際争霸》的魅力可見一斑。而随後不久DeepMind便将其相關研究及平台開源，更是印證了讓AI玩星際争霸的挑戰。

今天，塔爾圖大學的RomanRing在Github上開源了他傾力投入一年半的成果，一個名叫Reaver的《星際争霸II》AI，可用于訓練《星際争霸II》的各種基本任務。

Reaver的基本思路是沿着DeepMind的路線在走，也即AI的玩法是像人類玩家一樣，從遊戲畫面中獲取視覺特征，然後再做出決策。

補充說明，Roman去年本科畢業項目是使用《Actor-Critic法複現DeepMind星際争霸II強化學習基準》[1]，Reaver則是在此基礎上的改善提升。

Reaver的強項在于比其他開源的同類框架單機運行速度快；除了支持星際争霸遊戲訓練環境SC2LE，也支持OpenAIGym、ATARI和MUJOCO；模塊化組成，容易調試。

根據作者所說，Reaver不到10秒就解決CartPole-v0，在4核CPU筆記本上每秒處理5000張圖像，使用GoogleColab，Reaver通關《星際争霸II》SC2LE小型遊戲MoveToBeacon隻需要半小時的時間。

單機《星際争霸2》AI，不用GPU集群，支持多種訓練環境

Reaver玩《星際争霸II》小型遊戲MoveToBeacon的畫面，左邊是未經訓練，右邊是訓練後的情況。來源：RomanRing/YouTube

套用一句話，如果我們的征途是星辰大海，那麼其中的一關必然是《星際争霸》。

Reaver對于不具備GPU集群的人非常友好，正如作者在Github庫裡介紹所說，

“雖然開發是研究驅動的，但ReaverAPI背後的理念類似于《星際争霸II》遊戲本身——新手可以用，領域專家也能從中獲得東西。

“對于業餘愛好者而言，隻要對Reaver稍作修改（例如超參數），就能得到訓練深度強化學習智能體的所有必須工具。對于經驗豐富的研究人員，Reaver提供簡單但性能優化的代碼庫，而且都是模塊化架構：智能體、模型和環境都是分開，并且可以随意組合調換。”

歡迎加入星際争霸強化學習陣營。

深度強化學習AIReaver：模塊化且便于調試

單機《星際争霸2》AI，不用GPU集群，支持多種訓練環境

性能大部分已發表的強化學習基準通常針對的都是MPI之間message-based通信，對于DeepMind或者OpenAI這樣有大規模分布式強化學習配置的機構而言這樣做自然很合理，但對于普通研究者或其他沒有這類強大基礎設施的人，這就成了很大的瓶頸。因此，RomanRing采用了共享内存（sharedmemory）的方法，相比message-based并行的解決方案實現了大約3倍的速度提升。

模塊化很多強化學習基準都或多或少都是模塊化的，不過這些基準通常與作者使用的訓練環境密切相關。RomanRing自己就曾經因為專注于《星際争霸II》環境而導緻調試花了很長時間。因此，Revar隻需要一個命令行就能改變訓練環境，從SC2到Atari或者CartPole（将來計劃納入VizDoom）。每個神經網絡都是簡單的Keras模型，隻要符合基本的APIcontracts都能調用。

調試現在一個遊戲AI通常含有十幾個不同的調試參數，如何實現更為統一便捷的調試？RomanRing在Reaver中隻要能用的地方都用了“gin-config”，這個輕量級調試框架隻要是Python可調用函數都能調試，非常方便。

更新是的，現在算法發展很快，去年發表的東西今年就可能過時。在開發Reaver的時候Roman表示他想着用了TensorFlow2.0API（主要是使用tf.keras不用tf.contrib），希望這個庫能活用久一點吧。

單機友好，可用于訓練星際争霸II各種任務

RomanRing列出了Reaver在《星際争霸II》各種小型遊戲上與其他AI的性能對比。其中，

單機《星際争霸2》AI，不用GPU集群，支持多種訓練環境

Reaver（A2C）就是在SC2LE訓練Reaver得到的結果DeepMindSC2LE是DeepMind在《StarCraftII:ANewChallengeforReinforcementLearning》一文中發布的結果[2]DeepMindReDRL則是DeepMind在《RelationalDeepReinforcementLearning》中的結果[3]人類專家是DeepMind收集的GrandMaster級别人類玩家的結果

以下是Reaver在不同小型遊戲中訓練花費的時間：

單機《星際争霸2》AI，不用GPU集群，支持多種訓練環境

綜上，就算DefeatRoaches花了150小時，但考慮到硬件隻是一台筆記本（英特爾酷睿i5-7300HQ，4核+GTX1050GPU），這個結果已經算很不錯。

Roman還列出了他的路線圖，上述成果隻是他萬裡長征的第一步。如果你感興趣，不妨加入這個項目。

單機《星際争霸2》AI，不用GPU集群，支持多種訓練環境

介紹就到這裡，訪問Github了解更多：

參考資料

新智元AI技術+産業社群招募中，歡迎對AI技術+産業落地感興趣的同學，加小助手_2入群；通過審核後我們将邀請進群，加入社群後務必修改群備注（姓名-公司-職位；專業群審核較嚴，敬請諒解）。

你可能想看：

書法：書法創作的七種訓練方法

做到章法、字法字組、行字數、虛實關系、書寫節奏等因素盡量逼近原作，（2）分析并掌握原作章法結構，通過補白練習強化學生對原帖筆法、結字章法的理解與掌握，（1）仔細觀察體會某一名帖（碑）的單字及字組構成特...

超級巨無霸，單機容量全球最大水輪發電機組，年發電近2000億度

在建總裝機容量僅次于三峽水電站、世界在建規模最大的巨型水電站——白鶴灘水電站近日正式開始蓄水，首批機組将于今年7月實現投産發電。白鶴灘水電站是全球在建最大的水電工程，左右岸地下廠房内分别布置8台具有完...

手機丢了，支付寶和微信裡的錢還能安全嗎？

那麼支付寶、微信以及綁定的銀行卡裡的錢就會有很大的安全隐患。目前支付寶和微信等APP在不知道登錄密碼的情況下。可以利用短信驗證碼進行登錄，接收短信驗證碼就可以登錄綁定手機号的APP了，但是絕大部分人手...

加工中心常用G代碼和M代碼大全，收藏好了！

G11--程式參數輸入取消（部分機床）G16--極坐标指令有效（部分機床）G36--特别固定循環（圓弧）G45--刀具位置設定（擴張）G46--刀具位置設定（縮小）G48--刀具位置設定（減半）G53...

馬斯克的任務：聊聊星際移民

我們曾回顧了太陽系和宇宙深空中勇敢而孤獨的探測器家族(Probe），并得以了解近地軌道曾經唯一的人類駐地國際空間站（ISS）。接着我明白了為啥大多人會有那些反應——直到最近我也有類似的感覺，為了解釋為...

4059.星際移民和文明傳承的主要障礙

星球環境的改變和周期性的新星誕生都是生命存在和文明傳承難以逾越的障礙，而星系一定由不同正反物質對偶形成，原子和光子之間的相互轉化說明光子可能存在前述四種形态。物質世界由正負電荷形成，不同偏電荷光子和電...

鄭杭生：努力提高辦刊質量，不負各方大力支持

深切感謝各位對剛剛出版的《社會學評論》學術雜志的關愛支持！在今天這個隆重而簡樸的《社會學評論》首發式暨提高辦刊質量座談會上。那時考慮的是想與其他雜志合作辦刊。充分表示了學校對人大社會學科發展的高度重視...

油條+油餅的詳細配方和做法，不用酵母不用泡打粉，金黃酥脆真香

早點攤油鍋裡的油不知道用了多久，兒子又嚷嚷了好幾天想吃油條炸糕了，我就把油條和炸糕的配方和詳細做法教給你，一次教會你油條+炸糕的詳細做法，——【燙面脆皮炸糕】——【食材】：提前稱好的面粉迅速倒入開水鍋...

洗肥腸原來這麼簡單，不用堿不用醋，10分鐘清洗幹淨，沒有腥臭味

教你清洗肥腸的小技巧，我平時就特别喜歡吃肥腸，外面的肥腸吃起來味道總覺得怪怪的，總是擔心洗得不夠幹淨。肥腸清洗得幹淨了做出來才沒有異味，很多朋友喜歡吃肥腸卻不愛洗，清洗肥腸有很多的小技巧，下面我就分享...

愛吃面條的看這裡！教你不用揉面，不用擀面也能吃上筋道的面條

今天來吃一道不用和面揉面擀面的面條做法，餃子粉300g，土豆澱粉40g，【配菜和配料】，花生油适量，、面粉300g加入澱粉40g，攪拌成面糊?如果你有涼皮盤子或者披薩盤都可以。舀入一小勺面糊多一點點搖...

如果美國關掉GPS，哪些國家不受影響？全世界僅2國，名字很耳熟

而現在我們很多國家也都大範圍的時候了導航系統，我們使用的是科學技術來尋找方向還有準确的定位。是一款全球定位導航系統。它能精準的定位到全球上的任何一個地方，如今我們出門的時候都會使用手機上的導航地圖，隻...

GP天線的設計問題

我打算做的是一根可以覆蓋20米以下的短波加感GP天線？調整天線時保持線圈上方的拉杆天線處于最長狀态：僅僅依靠增、減線圈匝數來使天線諧振，四、線圈上方振子長度調整是非常敏感的（相對線圈和下方振子長度）？...

python中使用argparse.add_argument_group() 對命令行參數進行概念性分組

parser.add_argument('name':parser.add_argument('--bar_that')，parser.add_argument('--foo_that')。parse...

第4講 Vision Pro視覺工具 CogPMAlignTool

康耐視圖形搜索工具，它能在一張圖片上通過用戶制作的模闆。讓visionPro能找到圖形中我們選定的特征圖形，點擊上圖中的康耐視的工具按鈕。雙擊或者拖拽工具到左邊流程中即可添加，将image sourc...

R語言ggplot2畫圖-Pathway富集分析氣泡圖

# 設置工作路徑到數據存放的文件夾下,header=T,pbubble = pp + geom_point(aes(size=R0vsR3，high="red") + labs(color=expre...

什麼是PU石？

有一種仿石材凹凸飾面的材料——pu石？pu石材廣泛用于建築外牆裝飾，如此逼真的仿石材飾面-，pu石材更像是一種新型的跨界材料，将熟悉的材料應用于可以恢複真實石材的裝飾材料，通常為pu石材開發2-4套具...

intel cpu型号大全

intel cpu 型号大全按照處理器支持的平台來分，Intel 處理器可分為台式機處理器、筆記本電腦處理器以及工作站/服務器處理器三大類；下面我們将根據這一分類為大家詳細介紹不同處理器名稱的含義...

安徽也有一個土樓群，堪稱徽派建築中的奇葩，一到秋天就美如畫卷

的秋天打卡地更是令人們趨之若鹜。如新疆的喀納斯、北京的香山紅葉、南京的中山陵、婺源的石頭村、四川的九寨溝、黃山的塔川村等等。分别演繹着秋季裡的不同色彩與風情，土樓是福建一帶的圓形或方形的建築。更是将土...

跑前激活臀部肌群，讓你無傷跑步！

臀大肌會沿着大腿外側繼續向下延伸，對跑步運動最重要的兩塊肌肉是臀大肌和臀中肌。臀大肌是跑步蹬地發力最重要的一塊肌肉，●左腿重複進行剛才的動作，雙腳稍微靠近臀部。腳趾向上擡起離地。●雙臂直接放在身體兩側...

面對不同人群，我們應該怎麼樣？

面對父母：4.學會包容父母的一切即使是缺點側面去敲擊！面對愛人：面對孩子：1.多傾聽孩子内心的聲音。2.多陪伴孩子盡量有親子互動 3.回家少在孩子面前玩手機少吵架！1....

sigil制作epub電子書的最詳細教程

還可以通過編輯查找替換的命令行進行快速的編輯書籍。添加到你的Sigil的[工具]-[搜索模闆]中。右鍵欄目添加項目或者添加組?最好先把文檔轉存或拷貝到note轉為TXT文檔，然後複制黏貼TXT内容進來...

我的二本學生(pdf epub mobi azw3)電子書

《我的二本學生》是黃燈最新的一本非虛構作品。作者從自身的教學日常寫起，尤其是在接受學生求助和咨詢等瑣碎的職業體驗中，獲得了學生群體成長的第一手資料，本書稿是對這些學生成長和困惑的體認，并結合作者自身的...

多年舊電腦CPU太次，教你一招讓它煥然一新

按住Windows+R，打開運行；打開系統配置；勾選處理器個數，選擇最大個數（每個人的電腦配置不同，有的電腦最大不止是8，重新啟動一下就好，完成以上操作，就可以提升電腦性能。單純地想要更換新電腦也是可...

建一個群，對工作真好

記不得從哪年起我們開始有網上的群了，那時我們才剛剛會使用QQ，感覺有它對工作對朋友和家人交流。大家溝通起來交流起來感到很方便，但在朋友圈裡時常知道他的動态，朋友出國居住電話費太貴，今年辦公室主任開發了...

CPU工作原理及核心技術

一個CPU芯片包含上百萬個精巧的晶體管。計算機依靠速度緩慢、低效率的真空電子管和機械開關來處理信息，這兩種電子信号來執行指令和處理數據的呢”晶體管的這種ON與OFF的切換隻由電子信号控制。這就組成了計...

豬病防制 - 認真觀察豬群，及早發現病豬（大量圖文）

先觀察豬的睡覺姿勢是否正常，病豬的尾巴不動、下垂（圖4-12）。健康豬的耳朵幹淨、光滑、對外界音響反應靈敏，若而不靈活、耳根發熱或有冷感、發鉗、腫脹即為有病（圖4-14、圖4-15），吻突幹燥、開裂、...

為什麼說老虎周邊沒有狼群？是猛虎架不住狼群，還是狼被壓制？

是不會出現大型的狼群。狼群的數量就會急劇減少！老虎和狼群出現了厮殺現象：會通過獵殺或者驅逐狼群，且狼群被老虎牢牢壓制，很少有人看到狼，當人類開始将注意力集中在保護老虎上後，導緻狼成為老虎栖息地上的稀有...

上一篇
越野名将梁晶在甘肅馬拉松事件中遇難，你對越野冒險有什麼看法？

下一篇
【我為你唱一首歌】人生路

單機《星際争霸2》AI，不用GPU集群，支持多種訓練環境

有話要說...取消回複

最新文章

“豫西中醫界之泰鬥喬保均”治療疑難病60年經驗賞析

回憶、健忘和灑脫

弘一法師：“真的不忍心告訴你，這個世界隻是一個夢。你一輩子執

心理學，準的讓你驚叫

人生，成大器者有四識，知識、見識、膽識、遠識

俞和：被遺忘的書法家，以古為師，創新在手！

2024屆新高考II卷語文真題答案及解析

生前隻是小人物，死後震驚史學界

熱門文章

每日一誦傷寒論第241條

老張老李侃門球之140篇

這個穴位可以治療多種胃痛腹痛，還可以減肥

診餘雜記（師傳經驗）

為什麼五點鐘要起床答案讓人吃驚！（現在知道還不晚）

治療坐骨神經痛藥酒５方

美麗中國-2870：中國最大的内陸河，塔裡木河

二十四山開門放水作竈真訣開門放水作竈直訣——子山