休息之余,为大家奉上过去一周引发 AI 开发者圈子关注的那些事儿。大伙儿泡杯茶,坐在摇椅上,一起来看看在埋头工作的这个星期,外面的世界又有哪些变化。
█ 微软发起 Minecraft AI 挑战赛
本周,基于 Minecraft 上的知名 AI 技术研究测试平台 Project Malmo,微软发起了一项 AI 协作挑战赛:The Malmo Collaborative AI Challenge,目前已经开始注册报名。
比赛要求每支参赛队伍(最多 3 名队员)开发并训练一个 AI 软件产品。然后通过该软件产品参加一个名为 Pig Chase (小猪快跑)的小游戏。该游戏在 Minecraft 环境中展开,每局游戏有两名参赛者,一方为参赛队伍开发的 AI 软件产品,另一方为系统随机分配的队友,有可能是人类选手,也有可能是另一个队伍开发的 AI 软件。游戏一开始,参赛双方都有 25 分的原始积分,比赛要求双方在 25 步之内将一只小猪抓住,每走一步会减掉 1 分,最终抓住小猪双方各得 25 分,每轮比赛 10 局,最终累计得分高者获胜。
目前,关于 Pig Chase 的样例代码和详细说明已经公开在 GitHub 上:
█ Keras 2 发布,无缝支持 TensorFlow
在本次版本更新中,最重要的一项内容就是增强了 Keras 与 TensorFlow 的逻辑一致性。按照 Keras 在博客中的说法:“这是将 Keras API 整合到 TensorFlow 核心的一个重要的准备步骤”。
实际上,从 2015 年 12 月的版本开始,Keras 就已经支持用户将 TensorFlow 作为运行后端(runtime backend),但此前,Keras 的 API 与 TensorFlow 的代码库尚处于相互隔离的状态。未来,从 TensorFlow 1.2 版本开始,Keras 2 API 将作为 TensorFlow 框架的一部分直接向用户提供支持,Keras 在博客中表示:“这是 TensorFlow 实现下一个百万用户级目标的关键”。
█ 谷歌升级语义理解框架 SyntaxNet
这是 SyntaxNet 自诞生以来的最重大升级。这建立在谷歌对各语言的语义理解研究基础之上。此次升级的核心是一项新技术:能对输入语句的多层表示进行很好的学习。具体来讲,它延伸了 TensorFlow,能对多层语言结构进行合成建模,还能够在语句或文件处理过程中,动态地生成神经网络架构。
谷歌同时发布了新的预训练过的模型 ParseySaurus。它使用了基于字母的输入表示,因此极大提升了预测新词语含义的能力。这是基于两个方面来实现:词汇的拼写和在语境中的使用方式。雷锋网了解到,ParseySaurus 的准确率远远超出 Parsey"s Cousins,错误率降低了 25%。由于语言的形态特性和其他属性,新模型在俄语、土耳其语、匈牙利语上的效果尤其好——这些语言中,同一个词汇有多种不同形态,其中许多形态从未在训练阶段出现过(即便是大型语料库)。
█ Cloudera 发布自助式数据开发工具
在圣何塞举行的 Strata+Hadoop World 大会上,美国大数据服务商 Cloudera 发布了 Cloudera Data Science Workbench —— 一个运行于 Cloudera Enterprise,自助式的数据科学开发环境。目前该全新研发的软件尚在 beta 内测阶段。
其相关技术来自于 Cloudera 去年收购的数据科学初创公司 Sense.io。该产品的最大特点是原生支持 Apache Spark、Hadoop 和 R、Python、Scala 等开发语言。 开发者能在 Cloudera 的企业平台上同时使用这些工具和语言,这将加速数据分析项目从研发到最终产品的过程。
推荐深度阅读
█ 用数据说话:把自拍照变成毕加索名画 哪种算法最高效?
有位外国开发者根据 fast.ai 平台开设的深度学习代码实践课程,亲手实现了一个照片风格转换器,并对几种常见的优化算法的性能进行了综合对比,最终以图表加博客的方式记录下来。
作者比较了基于 CNN 的六种优化算法:梯度下降、Adadel、RMSProp、Adam、L-BFGS 和 Adagrad。