贾伟中科院合肥 发表于 2015-5-1 13:25:22

【Build 2015】微软发布 Project Oxford,供 Azure 用户免费集成图像理解、人脸识别、语音识别...



微软 Project Oxford主页

https://www.projectoxford.ai/

【Build 2015】微软发布 Project Oxford,供 Azure 用户免费集成图像理解、人脸识别、语音识别、语音合成等功能
昨天 Build Day1 Keynote 一开始的时候,有人说它被红衣主教 Scott Guthrie 变成了 Azure 展销会,当然这么理解其实没什么问题。后续的 Section 里,微软公开了 Project Oxford 服务,主要为 Azure 用户免费提供图像、语音识别等智能 REST API 和 SDK。这一服务由微软研究院(MSR)主导开发,其为开发者提供的模型都由微软现有其它产品中使用的深度学习和机器学习技术训练得到。Project Oxford 目前为止提供图像识别 API、人脸识别 API、语音识别/处理 API 和名为 "LUIS" 的语义识别服务四类功能。其中:http://a.36krcnd.com/nil_class/e42a2f0c-2894-4cab-8af8-d384f2b7255c/QQ__20150430145534.pnghttp://a.36krcnd.com/nil_class/f8ae3fce-7213-4a04-8b6c-dc15391be446/QQ__20150430145555.pnghttp://a.36krcnd.com/nil_class/7a0ef2d9-a82b-4bd4-a211-9ffedbc12534/QQ__20150430145615.png
[*]图像识别 API 提供图像分析、OCR 和智能缩略图获取(智能提取图片主体)等功能。
http://a.36krcnd.com/nil_class/a9e5b993-3b13-4640-83b4-c6053cee1464/QQ__20150430145912.pnghttp://a.36krcnd.com/nil_class/1e9ec1a9-edf8-49bd-8350-6cba9f2ceae9/QQ__20150430145931.pnghttp://a.36krcnd.com/nil_class/da1b5bda-82bb-48a6-901c-3db944472c55/QQ__20150430145952.pnghttp://a.36krcnd.com/nil_class/73fcefde-9165-4368-93ef-c5eaca2665a0/QQ__20150430150015.png
[*]人脸识别 API 则提供人脸检测、人脸验证、分组和身份认定等功能。
http://a.36krcnd.com/nil_class/4653a19a-7fe6-45a3-b9ce-8ad98e1b8b64/QQ__20150430151148.pnghttp://a.36krcnd.com/nil_class/4c17a9ac-6d34-4c89-ac8e-e24d353ef946/QQ__20150430151202.pnghttp://a.36krcnd.com/nil_class/a5aad21a-d921-4af7-b2a4-7f7fa1d4b601/QQ__20150430151218.png
[*]语音处理/识别 API 提供语音转文字和文字转语音两种服务。其后端与 Cortana 的识别引擎相同。发布之初语音转文字提供 7 种语言支持,文字转语音提供 17 种。
http://a.36krcnd.com/nil_class/cea24bc5-adab-42e7-928a-7c2cab7ce440/QQ__20150430151536.pnghttp://a.36krcnd.com/nil_class/690933bf-da9e-4bdb-9d1e-e51f0d4b097c/QQ__20150430151556.png
[*]LUIS (Language Understanding Intelligent Service)服务提供语义分析、实体检测和自学习模型特性。
此前我们采访机器学习/深度学习界泰斗 Alan Yuille 时,他提到微软研究院是目前商业公司内几乎唯一一个纯以学术为目的的研究性机构,本次微软将 MSR 多年的积累提供给开发者,无疑是给创业公司们一个信号:别再折腾自己造轮子了,直接买个 Azure 然后专心做产品吧。
页: [1]
查看完整版本: 【Build 2015】微软发布 Project Oxford,供 Azure 用户免费集成图像理解、人脸识别、语音识别...