游戏

德扑 AI 之父托马斯·桑德霍姆:AI不只是深度学习,扑克 AI 与 AlphaGo 大不同

“人工智能不光是机器学习,机器学习是关于过去,我们从过去的数据中学习,希望能够预测到未来或者是说在未来能够做到更多有益的东西,而战略性逻辑会关系到很多的可能性,是关于未来而推出的游戏”。

11 月 6 日,在今天举行的京东 JDD(京东金融全球数据探索者大会)大会上,卡耐基梅隆大学计算机系教授、德扑 AI 之父托马斯·桑德霍姆发表演讲,讲述了他们创造的人工智能冷扑大师 Libratus 背后的原理究竟是什么?并表示这种非完美信息的游戏 AI 也可以在经济生活带来广泛的应用。

卡耐基梅隆大学计算机系教授、德扑 AI 之父托马斯·桑德霍姆

演讲开始,桑德霍姆即透露,Libratus 和名噪一时的 AlphaGo 非常不同,后者是基于完美信息的游戏,前者则是非完美信息的游戏(imperfect-info games)。“在不完美信息的游戏里面,我们的挑战是不知道对手和他的行为或者是说他的行为可能性。那么对于他们以往做了些什么呢?我也不知道。”他说。

之后,他阐述了 Libratus 的基本原理,包含抽象化、子博弈解决器和自我改善模块三个部分,里面并没有用到深度学习。

桑德霍姆认为,人工智能不光是机器学习,“机器学习是关于过去,我们从过去的数据中学习,希望能够预测到未来或者是说在未来能够做到更多有益的东西,而战略性逻辑会关系到很多的可能性,是关于未来而推出的游戏”。

以下内容由雷锋网根据桑德霍姆的演讲速记整理,有不改变原意的删减。

今天我讲一下超人类的 AI 怎么做战略性的分析和推理,这里用扑克做例子,今天我们说的是不完美信息的游戏,也就是说整个对

违法和不良信息举报电话:010-64158500-8113,18610056652    举报邮箱:infoweb@zero2ipo.com.cn    举报网上不良信息