Alphabet旗下子公司DeepMind在训练一个人工智能模型掌握了国际象棋和围棋之后,开始了一个新项目:破解一款热门电子游戏的密码。研究人员将这款游戏视为人工智能的“重大挑战”之一。
该团队为《星际争霸2》(StarCraft II)建立了一个名为AlphaStar的深度学习系统,并在上周四晚间对该系统进行了详细介绍。
据称,该系统是迄今为止同类系统中最复杂的。在DeepMind上月举行的一系列比赛中,AlphaStar成为世界上第一个在没有任何游戏限制的情况下击败职业人类玩家的AI。
星际争霸2极其复杂,这次胜利是AI的一个重要的里程碑。与国际象棋和围棋不同的是,这款游戏提供了一个所谓的不完美的信息游戏环境,其中某些关键细节被隐藏。这使得它在概念上更类似于AI模型在用于实际应用程序时必须处理的任务。
星际争霸2有一个复杂的战略元素,可以进一步提升难度。比赛在三维空间中进行,两名对手各自收集资源,建造建筑,并集结虚拟军队,聚集各种力量试图战胜对方。
在这种条件下获胜需要AI掌握长期规划的能力,而这些技能对于一些现实世界的深度学习用例也是必要的。DeepMind的研究人员解释说:“就像许多现实世界中的问题一样,因果关系不是瞬间产生的。游戏也可能需要花费一小时时间才能完成,这意味着在游戏早期采取的行动可能在很长一段时间内都不会有回报。”
DeepMind分两个阶段训练AlphaStar。首先,它给AI播放人类玩家比赛的视频。随后让AlphaStar负责一个虚拟星际争霸II联盟,并让它产生一个AI竞争对手来相互竞争。
DeepMind的研究人员表示:“随着游戏的发展和新竞争对手的诞生,新的对抗策略出现了,它们能够击败之前的策略。虽然一些新的游戏选手执行的战略仅仅是对以前的策略的改进,其他选手却发现了全新的战略,包括全新的建设策略、单元组合和微观管理计划。”
在DeepMind上月举行的系列比赛中,AlphaStar的代理商以10比1击败了两名职业水平的人类棋手。Alphabet子公司计划在未来的一篇学术论文中,在更广泛的AI社区中分享这次胜利的方法,从而让DeepMind以外的研究人员能够在自己的项目中使用AlphaStar的训练技术。
原文链接:https://siliconangle.com/2019/01/25/deepmind-racks-another-ai-first-new-alphastar-system/