星際爭霸未來的超詳細剖析,能否出現AI打敗最終兵器Flash?

By:Archslayer

星際爭霸二十週年活動,我想寫這個主題的絕大多數應該都是抒發情懷的,因為星際給我們這代遊戲玩家留下了很多美好的青春回憶。我對於星際當然也有難忘的情懷,但更多的我覺得星際對我的意義不止是玩過的一款經典遊戲,它塑造了我對競技的基本認知甚至影響了我的世界觀、價值觀。

在星際爭霸這款遊戲之前,我對於競技基本還處於偶像崇拜的階段,至於喬丹、大羅、舒馬赫這些各個領域的傳奇人物為什麼那麼無敵,肯定是缺乏認識的。而在星際爭霸這款遊戲的發展到成熟的過程中,各個階段都有代表性的頂尖玩家,都有代表性的戰術戰略體系。通過分析星際爭霸發展的歷程,我們就可以看到在一個成熟的競技項目中頂尖玩家究竟有何過人之處。

我之前寫過一篇紀念Oov的文章,回顧了從Grrrr到Oov和馬本座的星際歷程。當時我認為星際到Oov時代才進入了成熟期,進入了經濟至上、戰略至上的年代。現在來看,當時的觀念還是太膚淺了,星際只是從這個時代開始才有了真正的運營和暴兵,而對於操作而言,一直都在進步,時至今日仍有相當大的進步空間,根本沒有所謂的成熟期,甚至可能永遠不會有。回顧星際戰術體系發展的過程,會驚奇的發現,星際所有的戰術體系的進步和發展都是源於操作的進步以及操作的進步所帶來的對星際宏觀戰略的新的認知升級,甚至到星際後期整個戰術體系都是完全建立在操作的基礎上。比如最早期的ZVT基本戰術都是單基地速地刺(lucker),因為在當時的玩家操作水平下地刺這種能隱形的範圍攻擊兵種很強勢。

但當人族M+M的操作懂得控制陣型和壓制以後,這種戰術就被迅速淘汰了。而後來的飛龍聚團甩尾操作則徹底改變了星際Zerg對抗的所有基本格局。現在來看星際玩家的綜合實力,首先是基本功,也就是運營和操作的水平其次是對星際宏觀戰略的理解和實施;再次是複雜戰局的正確判斷和臨場應變能力。具體到比賽上還有很多其他因素,比如臨場狀態、心態、地圖、賽制、事先準備充分程度、網速等等很多影響玩家比賽發揮的因素。回顧星際各個時期的頂級玩家,Boxer擅於戰術和操作,Nada基本功紮實擅於應變,Oov運營超越時代,他們的崛起雖然各有不同,而他們走下神壇,卻都不是自身競技實力的明顯下滑,而是基本功被新生代更優秀的玩家完爆。Boxer的8BB曾讓yellow絕望,但在julyzerg面前就像幼稚園戰術。Savior馬本座的ZVP有著韓國職業最恐怖的勝率,卻在Bisu面前總是破綻百出。從這個意義上來說,基本功決定了職業玩家的上限,即使是像馬本座這樣完美的大局觀和意識也無法彌補差距。

星際史上最強玩家——教主flash,至今仍然擁有絕對的統治力,他為什麼如此之強?

星際爭霸未來的超詳細剖析,能否出現AI打敗最終兵器Flash?

馬本座是用基本功來實現他的戰略構想的,他的飛龍雖然不夠侵略性卻總可以拖住T的推進,熬到Z科技強勢的階段。而教主則不同,他是用自己更強大的全局意識全面的提升自己的運營和操作。

教主最初成名是靠大招流的,極具侵略性和迷惑性的戰術設計加上教主無懈可擊的操作,出招幾乎是無往而不利,即使是如日中天的Bisu也無力抵擋,也讓大家對他的第一印象是靠戰術吃飯的。教主在這個時期,他對於兵力強勢期的判斷,進攻中坦克雷車的協同,槍兵與農民的協同,坦克的更強的侵略性都能讓對手感受到在他的面前,貪經濟的開局是不成立的。教主至今也依然保持了這樣的威懾力,敢在開放式地圖上裸雙的P,敢在他8BB下12D外雙的Z基本開局就已經死了。

作為一個擅長戰術操作擊倒別人的人,如何防範被別人戰術操作擊倒就是另外一個更大更難的課題了。而教主所表現出的防各種rush的能力可以說是令人歎為觀止。常見的rush戰術像Z 5D之流在教主面前都是小兒科,教主只有在自己使用戰術而且被對手完克的時候才會中招。人族的每個兵種包括農民在教主手裡都能物盡其用,再好的P金甲也很難兩炮打死教主的移動坦克,也很難一炮殺傷大量農民,前中期不管用任何方法想一波流帶走教主都似乎是不可能完成的任務。再加上教主還經常有開圖般的偵查意識,對小地圖超強的反應力,這就讓教主幾乎免疫對手的rush戰術。雖然職業生涯裡也有OSL決賽被火星並不常規的狗rush導致被讓二追三的慘痛經歷,但綜合來說,作為人總會犯錯誤,教主的防禦能力也絕對是史上最強,沒有之一。

教主對運營的理解更是引領整個時代潮流的。在他主要用戰術大招的時代就給世人展示了TVP SKT2,雙重工3坦克或者5坦克的各種犀利無比的rush戰術,等優秀的P都能更好的應對他的戰術的時候,他意識到要想成為王者,開發戰術是遠遠不夠的,他要開發更先進的戰略體系。然後,他標誌性的單兵營速2礦,單重工速三礦,速攻防的著名TVP反航母流戰略體系橫空出世,在神族六龍引領的神族黃金時代,將一直弱勢的TVP竟就打成了優勢對抗。也因為這個戰略T前中期沒有什麼進攻性只能猥瑣防守,隨著幾首改編的猥瑣神教神曲廣泛傳播,猥瑣神教教主之名也就成了中國玩家對他最流行的稱呼。

TVZ在經歷了不少被新生代Z飛龍甩死的慘痛經歷後,教主也開發出了單兵營速2礦,速一攻5兵營的槍兵壓制流,不僅在防飛龍上有了質變,配合教主極具壓迫性的槍兵操作,Z連開出3礦都變得相當困難。教主在有了深厚的運營操作防禦功底後,打TVZ已經是信手拈來、遊刃有餘,一不經意間在直播時代竟又創造了一套速科技流打Z的新戰略體系。現在T所有主流的戰略體系,幾乎都是教主創立的,但也只有教主才能在實戰中更完美的實現戰略構想,這固然有教主英明果斷的臨場判斷和決策的原因,而更重要的則是教主超越所有人的紮實的基本功。有了如此深厚的基本功,無論是任何戰術還是戰略體系,他都可以駕馭的比別人更好。

星際爭霸未來的超詳細剖析,能否出現AI打敗最終兵器Flash?

教主對運營的理解還不僅限於創造戰術和戰略體系,他還會不停的思考、練習以改良運營的實效,完善每個細節。開局他會主動操作農民提高採礦效率,開圖般的偵查意識就是不斷優化農民各個地圖偵查路線選擇的結果,槍兵出的時機和數量都有戰略考量,TVZ雙基地以後雷達也下的越來越晚,優先保障雙礦農民的數量,Z三本科技打不下來轉機械化時,教主會三四五礦同時開,他總會在對手弱勢期的時候最大化自己的經濟。而且無論多好的經濟,教主都能把錢氣調配的合理, 將經濟轉化為兵力,200人口之前很難看到教主的餘錢上四位數。操作上他也會更大限度的挖掘潛力,小操作上像防P龍騎rush時槍兵農民進出BU吸引火力就相當的靈性,宏操作上操作坦克成片的大規模殺傷神族龍騎部隊更是教主招牌操作,教主直播後大家更能感受到他的操作有多麼的高效。像人族SK打法用海量科學球無限消耗Z氣體兵種這種戰略對絕大多數哪怕是職業玩家來講也只是個理想,而教主用起來似乎輕鬆寫意,甚至可以用到一隊半的球都沒能量。

教主為什麼能如此之強呢?ASL三連冠也展示了他比職業時期更恐怖的統治力。如果星際像足球那樣是世界第一運動的話,那麼“教吹神教”一定比“梅吹神教”還要誇張,畢竟教主就是星際界的“獨孤求敗”。從教主身上,我們當然可以看到他過人的天賦,年僅15歲就拿了OSL的冠軍。但更多的,應該是他的努力,玩過星際的都應該知道,基礎操作的一點點提升需要怎樣強度的練習。學習一套戰術很容易,想實現最理想的操作有多難。教主所表現出的所有過人之處,背後一定都是超出常人想象的刻苦訓練的結果。而教主最大的天賦,是他不但知道如何才能提高自己,他還能通過自己的努力做到。

現在再看喬丹、梅西這樣的本領域的超級偶像,發現他們的成功和教主如出一轍。他們的長處都是有著超越儕輩的最紮實的基本功,他們永遠知道如何才能提高自己,而且可以做到最好。他們最初成名時,都是因為最強的單兵作戰能力,但他們都不會就此滿足。喬丹可以從被人批評不會防守到成為聯盟最好的防守後衛,籃板、搶斷、助攻也都名列聯盟前列,一手絕活急停後仰跳投就問你對方如何防守?已經快31的梅西更是球技日臻完美,盤帶、突破、傳威脅球、射術、任意球、球場視野,哪一項有誰敢說比梅西強呢?

說回星際,在暴雪親手埋葬了星際1以後,我們已經很多年沒有見到有什麼讓人眼前一亮的星際新秀了。教主是不是就能代表星際水平的巔峰了呢?

也許已經是人類的巔峰,我認為星際的未來還是在AI。

從我們第一次使用計算器時,我們就應該意識到算盤玩的再好也不可能在計算能力上和它比較了。而這些年隨著材料學的進展,計算機的運算能力還在呈指數級的增長。所以在那些頂尖圍棋選手們還夢想捍衛自己第一智慧運動的榮耀時,我就知道那肯定是徒勞的。作為一個可以比你努力你可能都無法想象的數量級倍數的對手,智慧、天分都顯得沒那麼重要了,它需要的僅僅是一個能持續獲得哪怕那麼一點點進步的算法而已。

星際爭霸1應該是AI最好的即時戰略遊戲領域切入點,它有幾大優勢其他即時戰略遊戲無法比擬。第一、星際1畢竟是電子競技鄙視鏈頂端的存在,有足夠的複雜性,也就具有足夠的深度,一旦AI突破後對同類遊戲會有極強的可借鑑性。第二、得益於暴雪對於星際1長期的不聞不問,它二十年間居然也沒經歷過幾次大的版本變遷,從母巢之戰108B版本基本就定型了,穩定的版本對於AI的培養來說至關重要。第三、星際對抗裡的運氣因素應該是競技遊戲裡影響最小的,因為星際兵種攻擊防禦數值都是固定的,大概也只有低地打高地有概率因素。第四、星際有著相當長的職業化發展,有著以教主為代表的一批有著極高水準的職業玩家,對於最終驗證AI的能力也就有著相當高的標準。

星際爭霸未來的超詳細剖析,能否出現AI打敗最終兵器Flash?

如果有人因為上次星際AI表演賽裡AI的幼稚表現就認為AI征服不了星際領域,那就真的太天真了。確實,星際作為即時戰略遊戲,比起圍棋這樣的回合制遊戲,裡面的變量多了太多,最優選擇也就相對更難去判斷。但像表演賽裡AI如此拙劣的表現,應該說連半成品都算不上,這些AI的基本功在某些方面甚至還不如星際自帶的AI水平。據說某些AI開發都有一年之久了,如此表現讓人不禁聯想到美劇《硅谷》裡表現的某些大公司小團隊拿到了預算就混吃等死,最終在deadline之前拿出一個殘次品交差的場景。而我認為這應該並不是本次AI被碾壓的主要原因,相比之下,去年Ti7 Dota2國際邀請賽上Value公司向世人展示的中單solo AI就成功的擊敗了數個職業頂級中單選手,而這個AI是在無數次和自己交手的時候逐漸掌握了類似人類頂級中單才具備的技術。所以我覺得目前星際AI開發最大的問題還是捨本逐末了。

正如我上面分析的,基本功才是星際水平的基礎,而不管是大師做AI的理念還是表演賽裡AI頻繁使用5D的急功近利都屬於典型的捨本逐末的行為。不管什麼戰術戰略都要建立在操作和運營的基礎之上的,星際觀也是完全建立在對操作運營的極限瞭解基礎之上的。所以我認為星際AI開發,最重要的是要有能讓AI持續獲得提高的基本算法,然後就要從最基本的操作運營練起,就從瞭解一個固定地圖,從最基本的農民採礦如何效率最大化和農民能做到的最精細的操作開始做起,從實現每一個兵種和魔法的極限操作做起。而這個時候作為一個認為自己對星際理解足夠深或者甚至是現役職業選手,想幫助AI提高能做些什麼呢?灌輸戰術戰略理念麼?學過編程的應該都清楚,僅僅是做一個稍微複雜點的正確決策需要多少精準的邏輯判斷,其中任何一個邏輯判斷不夠嚴謹都會導致可能出現的bug,把人腦中形成的一個戰略體系用編程語言完美實現雖然難度極高也相當耗時但也不是不可能,只是這種努力是事倍功半而且偏離了做星際AI的初衷。實現人腦中形成的戰略體系也需要AI具備起碼現在職業水準的基本功的,等AI能有了這樣的功底,加上指數級的努力,它完全可以建立更高端更精密嚴謹的戰略體系。

人類的大腦雖然擅於判斷擅於決定擅於形成理念,但基本是武斷、片面甚至搞不清因果關係的。所以人類社會在科學誕生之前是沒什麼長足進步的,被腐朽思想或者宗教理念統治的地方還會出現文明的倒退,而科學思想恰恰就是驗證人類那些判斷、決定、理念是不是符合實際,就是這麼一點點嚴謹求實的精神,幾百年間就推動人類社會取得了翻天覆地的發展成果,人類對世界的認知也在不斷的迭代深入。所以,沒必要對自己的星際戰術戰略理念過於執著,作為一個想幫助AI提高的人,只要是把自己能看到的最好的操作運營用程序語言教給AI,讓它們可以在一些層面有一定的起點就很好了,剩下的能做的也就是給AI創造更好的訓練環境了。

給AI創造訓練環境最好就是去搭建一個開放式的星際模擬平臺,這個平臺不但要實現所有星際遊戲的功能,還要增加很多星際本身沒設計的附加功能,最重要的是要有無損加速和覆盤功能。無損加速就是在不會導致任何星際比賽參數紊亂的情況下儘可能快的進行AI對抗,提高AI的學習效率,從這個意義上來說,與人的對抗想讓AI受益效率還是太低了,所以還是等AI比較成熟了再讓它去和人對抗檢驗成果,發現不足。覆盤功能就更重要了,是讓AI可以在每局對抗的rep裡的任何時間節點任何一方去切入遊戲,這種反覆的演練才能更好的幫助AI確立最佳的行動邏輯。想想這樣的功能也一樣能高效的幫助人類職業選手提高水平,比起現在職業選手自己看rep腦中純思辨,反覆實戰推演肯定還是科學實效多了。

我就小小的展望下AI未來可能能達到的那些神級操作吧。

個體操作和群體操作的完美結合。現在已經有職業選手偶爾能做到P空投XX騙坦克攻擊的時候S住坦克等金甲下來直接轟金甲,AI則可以完美實現這種操作,甚至是免疫空投XX對己方坦克的誤傷。群體操作以同時秒殺地方單位為主,如4刺蛇秒殺一槍兵,2地堡秒殺一槍兵,坦克秒殺電兵龍騎,MM秒殺飛龍等等。還有像龍騎飛龍這種有攻擊彈道的兵種傷害經常溢出,AI也可以通過大量的練習對傷害進行精準控制。龍騎能發揮更大的威力,飛龍更能實現一次甩2-3槍兵這種極限操作,而且科學球再也無法威脅AI的飛龍群了,AI分中毒飛龍去送死這種操作都不需要學習一個程序就能實現。AI只要掌握了一隊飛龍的完美操作,那麼不管多少隊都很容易如法炮製。多線能力即使在如此幼稚的星際AI身上也表現出不俗的實力了,可惜就是基本功太不紮實,經驗明顯也很淺,未來AI那種超越職業操作水平甚至是可能超越我們想象力的操作水平的完美多線,真是想想都可怕。更可怕的是,它還能同時實現完美的運營。

所以我預想,星際AI未來擊敗教主這樣頂尖人類選手,可能有兩種方式。低端的一種就是AI演練出了一套嚴謹成熟的操作性極強的組合拳戰術,教主也不可能事先有所準備,所以被戰術性擊倒。高端的就是像阿爾法狗擊敗柯潔或者阿爾法零100:0擊敗阿爾法李一樣,讓教主這樣的職業選手感到絕望,毫無機會。不管是哪種方式,人類其實都並沒有真正的失敗。因為從本質上,這場競技並不是以勝負為主要目的的,所以也就不會以勝負為終點。可以說,人和一個與自己相比幾乎無限資源、無限努力的對手競爭,即使是最強的人類,被超越也只是時間的問題。關鍵在於,這個過程中我們可以認識到許多東西也可以驗證很多東西,通過對AI的理解我們還會學到很多東西。對星際本身來說,最直接的收益就是當星際AI被限定400apm仍然可以碾壓教主的時候,那個時候就是人類向AI來學習如何最有效的操作運營,學習戰略佈局,學習操作的優先級,學習如何取捨。而這才是星際這種即時戰略遊戲遊戲AI更大的意義所在,它可以做到在一個模擬的環境裡在知道全部規則的情況下尋找到最好的策略,作為個體需要具備哪些能力以及如何提高。而這個意義首先就能應用在軍事上,對於一個具體的軍事計劃而言,只要所有參數足夠準確詳實,或者預估模擬的與現實差距不大,那AI就可以在無數次模擬中找到最佳的戰略部署和具體實行,即使有意外情況發生,個體也有著足夠的訓練度也足以應對各種變化。

如果真的可以實現這些意義,那麼星際AI領域一旦突破取得的成就很有可能是里程碑級別的,比目前大熱的什麼區塊鏈、衛星互聯網技術更具劃時代的意義,擁有更廣闊的應用開發前景,甚至會促進人類社會的巨大進步。也許從未來的某個時間節點開始,AI就要指導人類來作判斷、作決策甚至更新人類的很多理念了。真的到了那個時候,作為如此里程碑式變革的載體遊戲星際爭霸,也許真的會煥發第二春了。

星際爭霸未來的超詳細剖析,能否出現AI打敗最終兵器Flash?

你們覺得教主已經是星際巔峰了嗎?


分享到:


相關文章: