Google如何利用GPU实现语音、视频、图像识别革命

贾伟中科院合肥 · 发表于 2015-4-9 23:05:02

Google如何利用GPU实现语音、视频、图像识别革命2015-04-01 NVIDIA [url=]英伟达NVIDIA中国[/url]

玩家们，你们要提高警惕了。因为Google利用一种叫做深度学习的最新技术制造了一台机器，它可以自己去玩多达50款的Atari电子游戏，而且玩得很好。

那么这台机器到底是怎样玩游戏的呢？Google高级研究员Jeff Dean在今年的GPU技术大会期间的主题演讲中解释道，Google正在用和驱动电子游戏相同的GPU技术做一些几乎所有人都认为现在不可能实现的事情。

Jeff Dean是Google核心工程师团队的一员，该团队成功开发了新一代技术，重新定义了支撑网络的基础架构。现在Dean和他的同事正在向新的领域进发，即语音、视觉、语言建模、用户预测和翻译，很多都是以前只在科幻小说里才有的东西。

构建数字“大脑”

这项工作的基础是以人类大脑为模型构建神经网络。不过，当今的数字大脑与人类大脑的相似程度，大概就跟受鸟类翅膀启发而创造出的飞机机翼差不多。

这种新型数字大脑以精密算法为基础，从头开始教会机器执行复杂任务，正如通过向小孩子展示很多示例，教会他识别不同种类的球的过程一样。

在训练好这些模型后就能实际应用它们。像是从2012年起，Google的Android系统智能手机软件就使用基于深度学习的预测性语音识别功能。目前，Google已在超过50款产品中使用了深度学习。

Google正在为推动深度学习的发展而努力。它的搜索业务使其可以拥有海量的文字和图片数据。Google还构建了巨大的分布式计算架构，使其有能力迅速处理数据。

现在，Google要将GPU加入这个架构中，赋予其训练神经网络的能力，以迅速处理各种各样的任务。如此一来，Google有能力完成过去几年还做不到的事情，比如房屋地址识别、照片分类和语音转换为文字。

以超越人类的水平打游戏

最精彩的演示当然离不开电子游戏。Google伦敦的一个小组建立了一套深度学习系统，并让它开始玩50款经典Atari电子游戏，并告诉它如何获得高分。

尽管机器在刚开始时履步维艰，但是经过数百次游戏的洗礼，它能表现出超出人类的能力。它既可以在《太空侵略者》中轻松消灭敌人，也可以在《摩托大战》中以专业手法通过高难度弯道