【Build 2015】微软发布 Project Oxford，供 Azure 用户免费集成图像理解、人脸识别、语音识别...

贾伟中科院合肥 · 发表于 2015-5-1 13:25:22

微软 Project Oxford主页

https://www.projectoxford.ai/

【Build 2015】微软发布 Project Oxford，供 Azure 用户免费集成图像理解、人脸识别、语音识别、语音合成等功能

昨天 Build Day1 Keynote 一开始的时候，有人说它被红衣主教 Scott Guthrie 变成了 Azure 展销会，当然这么理解其实没什么问题。

后续的 Section 里，微软公开了 Project Oxford 服务，主要为 Azure 用户免费提供图像、语音识别等智能 REST API 和 SDK。

这一服务由微软研究院（MSR）主导开发，其为开发者提供的模型都由微软现有其它产品中使用的深度学习和机器学习技术训练得到。

Project Oxford 目前为止提供图像识别 API、人脸识别 API、语音识别/处理 API 和名为 "LUIS" 的语义识别服务四类功能。其中：

语音处理/识别 API 提供语音转文字和文字转语音两种服务。其后端与 Cortana 的识别引擎相同。发布之初语音转文字提供 7 种语言支持，文字转语音提供 17 种。

此前我们采访机器学习/深度学习界泰斗 Alan Yuille 时，他提到微软研究院是目前商业公司内几乎唯一一个纯以学术为目的的研究性机构，本次微软将 MSR 多年的积累提供给开发者，无疑是给创业公司们一个信号：别再折腾自己造轮子了，直接买个 Azure 然后专心做产品吧。