“冷扑大师”是卡内基梅隆大学开发的无限德州扑克人工智能系统。今年1月,它击败了人类顶尖玩家。在这次比赛中,每当这些玩家发出一个动作,它就会被传送到卡内基梅隆大学的计算机服务器上。
中国“龙之队”华人顶尖牌手由2016年世界扑克大赛金手链冠军得主杜悦领军。杜悦估计,虽然“冷扑大师”是目前扑克界最强的人工智能,但人类顶尖牌手仍有10%的胜率。
创新工场CEO暨人工智能工程院院长李开复之所以发起这场扑克人机对战,和他1988年在母校卡内基梅隆大学开发“奥赛罗”的经历息息相关,后者成为第一个击败黑白棋世界冠军的人机对弈系统。
“德州扑克是创投圈人士爱玩的一项活动,AI更是创投圈近年来关注的重点,这次活动对AI的宣传和推动将起到重要作用。”赛事协办方春光里运营总监董冬则告诉科技日报记者。“我当然希望人类能赢,但‘冷扑大师’毕竟曾打败过美国顶尖的德扑选手。”董冬说。
人工智能专家一直将这些游戏作为开发和测试的工具,在此之前,计算机已经在国际象棋、西洋双陆棋中击败了人类,去年的AlphaGo更是名声大噪。“扑克则有些不同,因为你不知道你的对手拿的是什么牌。”作为德州扑克爱好者,董冬分析。
谈到与围棋比赛、AlphaGo的不同,李开复表示,德州扑克更接近人性,因为信息是有隐藏的,牌手可以诚实或欺骗地表达。这些种种的推敲,更像是人与人之间的商业、外交博弈,“冷扑大师”的技术都与这些因素相关。
通过对手的动作表情判断对手牌的强弱,是德州扑克相当重要的一种游戏技巧,而“冷扑大师”作为一个冷冰冰的人工智能系统,如何应对人类棋手复杂的心理战呢?
对此,李开复表示,对于“冷扑大师”来说,心理战其实是基于一个优化结果最大化的一个计算,它计算该怎样去做才能得到最多的积分牌。他说,扑克机器人的研发基于博弈论,并且结合了大量的数学和概率理论,扑克程序在赛前不曾研拟历史牌谱,直接在比赛同时动态优化胜率最高的数学模型,利用战略推理揭露玩家底牌的隐藏信息,从而建构出智能化的AI谈判策略套路。在技术研发的背后,其实电脑并不对人类玩家的心理战术进行任何模拟或分析,反倒以博弈论加上大量数学打败了顶尖牌手。
卡内基梅隆大学计算机学院院长安得烈·穆尔教授则认为,“冷扑大师”表面呈现的是扑克,背后实际是一个大型的谈判算法。扑克AI并没有用到神经网络和机器学习这两种技术,而是用了比较古典的线性规划。
李开复认为,现今这套人工智能扑克程序背后的模型,将适用于需要用到战略推理和多方谈判的场景。从企业谈判、商务谈判、外交谈判、甚至到生活方面的房屋买卖谈判,10年内都将会部分或全面被人工智能所取代。