靠着两个不公平优势,AI 玩《星际争霸》碾压了人类

  Komincz把两支强大的不朽者部队装进了一个叫做折跃棱镜的运输船,然后将它们运到AlphaStar的基地,在那里脆弱的探测器正在采矿,这些矿石是AlphaStar的战争武器的动力来源。他把不朽者投放到基地里,开始炸毁探测器。

  再次地,AlphaStar组建了一只庞大的追捕者部队,然后马上派遣去防御探测器。但在追捕者还没有进入到不朽者的范围之前,Komincz就已经把它们送回到折跃棱镜然后逃之夭夭了。折跃棱镜不见之后,AlphaStar就把追捕者派遣到Komincz的基地。

  Komincz然后又故伎重施:投放不朽者,摧毁几个探测器,然后在追捕者赶过来之前再把不朽者送走。就这么反复这样的操作。当他这么做的时候,AlphaStar的追捕者因为徒劳地往返而浪费了宝贵的时间。

  当Komincz第三次投放不朽者到AlphaStar的基地时,Stemkoski说:“这就是我经常看到的人机对战的情形。当你找到对方的一个漏洞时,你就会反复地抓住那个错误攻击,屡试不爽。”

  折跃棱镜这个花招让AlphaStar的追捕者大部队疲于奔命的同时,Komincz一边也在聚集自己的大军。然后他指挥这支部队朝着AlphaStar的巢穴直捣黄龙,攻击为AlphaStar的战争机器采集资源的探测器。AlphaStar用追捕者骚扰Komincz的部队,但Komincz设法保持队伍的阵型,最后,AlphaStar没有办法阻止Komincz给自己的基地造成了严重破坏。

  我们不知道Komincz在输掉之前的5场比赛之后究竟是如何赢得这场比赛的。似乎摄像头视图的限制无法直接解释AlphaStar不能对折跃棱镜的投放攻击做出有效响应。

  但是合理的推断是,摄像头视图的限制全面降低了AlphaStar的表现,阻止了它有效地炮制游戏单位,或者以开局时同样致命的精度来管理部队。这样也许就给了Komincz足够的喘息之机,去寻找AlphaStar战略意图的漏洞然后加以利用。

  最后看来,上次的演示引出的问题要比回答的要多。DeepMind称自己在短短一周的训练之后就看到AlphaStar的表现有了重大改良。如果这一进程延续下去的话,AlphaStar也许就能恢复对人类玩家的决定性优势,哪怕对其API施加新的限制。

  另一方面,尚不清楚引入的这个摄像头限制是否足以保证比赛的公平性。AlphaStar仍然可以通过特殊API获取游戏信息,这个跟人类玩家获得的信息是不一样的。这个API也许能让软件收集更多的信息,从而比人类玩家更迅速、更精确地发布指令。

  让比赛公平的终极方式是让AlphaStar使用跟人类玩家一样的用户界面。当然,这个界面可以是虚拟化的,但游戏应该是跟人类玩家一样的裸像素输入,而且应该要求利用一系列的鼠标移动和点击来输入指令——而且输入速度要限制到人类手的操作能达到的程度。这是唯一可以确保AlphaStar没有给予其软件不公平优势的办法。

本文来自: 36氪


科幻频道 footer