人类在 Dota2 国际大赛上打败 OpenAI，但 AI 赢回来也只是时间问题_谷歌话题

OpenAI 曾在 2017 年战胜 Dota2 世界顶级玩家 Dendi，本月初战胜了由职业选手和解说员组成的半职业战队，这一系列出彩的表现提升了人们对人工智能再次夺冠的期望。8 月 22 日在温哥华举行的 TI8 上，OpenAI 联合创始人兼 CTO 格雷格·布罗克曼（Greg Brockman）带着全新的 OpenAI Five 如期而至，却接连两场输给巴西站队和中国战队，据悉，巴西战队目前世界排名第 14 位，这至少说明一直想挑战人类「最强」的人工智能，目前还不能在 Dota2 电竞场上打败人类。

机器的短板

正如专注于游戏领域 AI 研究的迈克·库克在 Twitter 上所说，「机器人在即时即地的反应上做得很好，但宏观层面决策的表现却很糟糕。」Open AI 计划在当地时间周三、周四、周五连比三场，由于比赛采取三局两胜制，OpenAI 在输给中国战队之后，就结束 TI8 之旅。

两场比赛分别持续了 51 分钟和 45 分钟，从数据来看，OpenAI Five 在比赛开始的前 20-35 分钟内确实有很大的胜算。以 AI 的计算能力来看，OpenAI Five 不乏出彩的表现，比如「围剿」孤立的英雄，近距离进行技能释放，血量计算等。在与巴西战队 paiN 的较量中，AI 也拿到比对手更多的「人头」。毕竟，人工智能就是一台机器，可以获取游戏后端给予的精确的数字反馈，比如英雄状态和英雄间距离等信息。但是在战略上，人工智能远不及人类，执着于击打 Roshan、莫名其妙的在家、塔下插眼、在没有对手的时候放大收野。

这种精准的计算和不稳定的战略恰好反映了 AI 是如何学会打 Dota 的，OpenAI 使用强化学习训练 AI 从头自学，在一遍遍尝试中坚持下来有效的动作。因此也导致了 OpenAI Five 在面对训练中没有遇到的情况时束手无策，从事 OpenAI Dota 项目的软件工程师苏珊·张表示，「如果 AI 在比赛中遇见了之前从未有过的情况，很难立即调整。同时，在训练过程中，机器人在判断采取何种行动时，最多会提前 14 分钟。没有任何一种机制让机器人部署超过 14 分钟的长期战略。」所以，AI 的这一缺陷，在两场比赛中展露无遗。

查看原文