邓侃评Nature封面论文：网络试验中，机器人搅局小淘气，反而促进人类协作？

2017年5月18日，Nature 发表封面论文，题为 “Locally noisy autonomous agents improve global human coordinationin network experiments”。

说得直白点，大意是 “在网络试验中，机器人搅局小淘气，反而促进人类协作”。

这篇论文提了一个好问题，机器人与人能否和谐相处？机器人的参与，是否能促进而不是破坏，人类的社会协作？

论文设计了一个交互行为被严格限定的游戏，来证实存在这么一种可能性：

在某些特定任务中，人与机器人，是可以和谐相处，并且相互促进的。

可能性固然重要，但是更重要的，是要找到一种方法，来教育机器人应该如何行动，才能帮助人与机器人组成的群体，实现整个群体的最优目标。以及为了实现全局最优，在什么情况下，机器人需要搅局，以牺牲局部收益为代价，打破僵局。

其实这个方法是现成的，这就是Reinforcement Learning （强化学习）。尤其值得关注的是，强化学习与深度学习的杂交，Deep Reinforcement Learning。

DeepMinders 用 Deep Reinforcement Learning 技术，在几十个游戏上，击败了人类玩家。

令人好奇的是，如果让机器人参与团队对战游戏，每个团队有多人组成。而且团队中不仅可以有人类玩家，也可以有机器人。

如果用深度强化学习技术来训练机器人，是否会提升人机团队的战绩？

遇到危险的时候，机器人是否会主动自我牺牲，以便保全人类玩家？

或者，机器人是否会以团队战绩为最高目标，不惜牺牲人类玩家，保全机器人，来取得整个团队的战绩？

先前人们普遍认为，机器人的行为取决于算法，而算法是人类编写的。所以，机器人的行为，完全是人类预先设定的。但是当机器人的行为是通过 “机器学习算法” 学习来的，机器人的行为，就不再那么严丝合缝地符合人类的预期了。

更进一步，不久的将来，机器将拥有 “Learn to learn” 的能力，届时，人类更无法准确地预期机器人的行为了。

除了玩游戏，机器学习技术，能够在现实生活中，发挥作用？

从技术方面讲，Chatbot 技术日臻完善，现在已经开发了不少客服机器人。节省人工，提高客服质量。如果机器对话的技术障碍解决了，下一个问题，是如何让机器人助力网上社区的运营。

客服与运营有很大不同。客服是一对一的对话，而运营的核心是群体的协调，包括挑起争论、幽默搞笑舒缓气氛、转移话题降温争吵，等等。运营中最难的又最重要的，是时事营销。人类编辑的反应速度，肯定比不上永远在线，永远不知疲倦的机器人。

互联网让人与人的交流更方便，同时互联网也产生了大量数据。如何挖掘这些数据，如何从中提炼出协调人群的有效算法，是大数据和机器学习的工作。

机器人参与人类社会的互动和协作，多半是从网络互动开始的。

机器人监管促进人类社会的协作，多半是从社区的运营开始的。