德扑 AI 之父托马斯·桑德霍姆：AI不只是深度学习，扑克 AI 与 AlphaGo 大不同_游戏话题

11 月 6 日，在今天举行的京东 JDD（京东金融全球数据探索者大会）大会上，卡耐基梅隆大学计算机系教授、德扑 AI 之父托马斯·桑德霍姆发表演讲，讲述了他们创造的人工智能冷扑大师 Libratus 背后的原理究竟是什么？并表示这种非完美信息的游戏 AI 也可以在经济生活带来广泛的应用。

卡耐基梅隆大学计算机系教授、德扑 AI 之父托马斯·桑德霍姆

演讲开始，桑德霍姆即透露，Libratus 和名噪一时的 AlphaGo 非常不同，后者是基于完美信息的游戏，前者则是非完美信息的游戏（imperfect-info games）。“在不完美信息的游戏里面，我们的挑战是不知道对手和他的行为或者是说他的行为可能性。那么对于他们以往做了些什么呢？我也不知道。”他说。

之后，他阐述了 Libratus 的基本原理，包含抽象化、子博弈解决器和自我改善模块三个部分，里面并没有用到深度学习。

桑德霍姆认为，人工智能不光是机器学习，“机器学习是关于过去，我们从过去的数据中学习，希望能够预测到未来或者是说在未来能够做到更多有益的东西，而战略性逻辑会关系到很多的可能性，是关于未来而推出的游戏”。

以下内容由雷锋网根据桑德霍姆的演讲速记整理，有不改变原意的删减。

今天我讲一下超人类的 AI 怎么做战略性的分析和推理，这里用扑克做例子，今天我们说的是不完美信息的游戏，也就是说整个对

查看原文