视觉技术与无人机

贾伟中科院合肥 · 发表于 2015-5-10 00:39:49

视觉技术与无人机
2015-05-07 无人机

不远的未来，我们头顶上的近空，或许将遍布着一架架无人机，就像陆地上的汽车一样。

“我认为未来5年，无人机的年销售数量将超过汽车。”Movidius首席执行官Remi El-Ouazzane对《第一财经周刊》说。这是一家研发图像处理芯片的公司，植入其芯片的摄像头拥有自行运算的能力，能够在拍摄图像时自行判断周遭环境，并据此进行导航、定位——显然，这种视觉技术很适合无人机。

对无人机的未来充满想象的不仅是El-Ouazzane，还有亚马逊总裁杰夫·贝索斯。而如果有了Movidius这样公司的帮助，他那个现在看起来有些不合时宜的想象或许就会更快成真了。

最近，亚马逊的无人机送货计划，终于有了一点转机。4月8日，美国联邦航空管理局（FAA）批准这家公司在华盛顿州一处指定区域，对新型无人机进行测试。

2013年，贝索斯在接受哥伦比亚广播公司《60分钟》节目访谈时，首次提及这一计划。他设想，通过其Prime Air无人机送货，客户最短半小时内就可收到购买的商品，配送成本也能够降至最低1美元。

但FAA在不到24小时的时间里就给贝索斯的“突发奇想”浇了冷水：“自控无人机运作不被允许”。直到今年年初，FAA公布的无人机管理新法草案中，仍然要求无人机必须在操作者视线内——当然，由于它上面装有摄像头，远程操作者也可以一直看着它。

FAA的谨慎可以理解。2014年，一位亚马逊的员工在测试一款四旋翼无人机时，就不小心撞上了西雅图的地标建筑太空针塔。今年1月和4月，美国白宫和日本首相官邸也相继发生了小型无人机坠落的事件。

虽然亚马逊等公司相信，现在的无人机技术已经成熟，但事实上，单就无人机避让障碍的方式来说，仍然相对初级。它主要通过摄像头进行图像拍摄，再将图像传给遥控者或控制中心进行识别和计算，随后遥控者或控制中心发出信号指导无人机进行避让——这种反馈机制导致无人机的反应时间较长，从而造成一些安全隐患。

据El-Ouazzane介绍，Movidius会让采集图像、识别图像、产生指令等流程都集中在一块芯片上，这相当于给摄像头装上了类似人类的眼睛，遇到障碍物时的反应时间就能大幅缩短。Oculus等增强现实设备其实也都使用了类似的技术。

Movidius 引起人注意，更多的是因为Google的Project Tango项目，它试图将人类对周围空间或运动的感知能力也赋予各种移动设备。2014年2月，该项目研发出的一款Android平板电脑原型机，就能实时为用户周围的环境进行3D建模，它搭载的芯片正是来自Movidius。

这款平板上有一款3D绘图应用Space Sketchr，用户可以在上面挑选不同颜色的画笔进行涂鸦。由于能够实现空间定位、追踪人的视觉和动作，并且识别周围场景，涂鸦形成的文字或图像可以随着设备的移动产生景深感，与周围环境融为一体。

在 El-Ouazzane看来，摄像技术在经历了胶卷摄像和数码摄像两个阶段后，正在过渡到计算摄像的阶段。“现在的智能手机设备，照相机模块只具有拍照的功能，它不能告诉你照的是什么。计算摄像指的就是在我们捕捉影像的同时，设备能够从中提取信息和知识，能够理解它所拍摄或者捕捉到的情景。”

如果真如他所说，包括摄像在内的各种视觉应用进入到了更聪明的第三阶段，那么很多行业——不仅仅是极客关心的无人机——会因此变得非常有趣。

比如家装领域。3D设计软件，再结合带有智能视觉技术的头戴式显示器Oculus Rift及动作追踪器Polhemus等设备，用户就可以在一幅自己新家的3D画面上自行设置虚拟家具和其他摆设，查看效果。事实上，家装公司DIRTT 已在尝试通过虚拟现实产品ICE帮助用户进行室内设计。

另一家在图像处理方面技术较领先的芯片公司英伟达则瞄准了汽车市场。

在今年年初举行的CES上，英伟达首席执行官黄仁勋发布了NVIDIA Drive CX车载系统、自动驾驶系统以及移动芯片Tegra X1，这几款产品的目标都是让汽车的“视觉”更加敏锐。

“正常行驶的汽车后面跟着另一辆车时，传感器可以立即知道后面出现了障碍物，大多数智能汽车方案止步于此，”黄仁勋说，“其实理解后面跟着的是什么车更重要，普通车辆和警车跟在后面，驾驶员需要作出完全不同的驾驶反应。”

运算能力的大幅提升是实现设备视觉系统智能化的重要原因。英伟达在Tegra X1上配备了256个GPU核以及8个CPU核。搭载两个Tegra X1处理器的自动驾驶汽车系统能够实时处理12个摄像头输出，并以每秒2.3万亿次的运算速度处理数据——2000年时，完成这样大规模的运算需要的处理器数量多达2.3万个。

英伟达现在的产品已经能够让汽车在一个陌生的停车场内自行寻找合适的车位。但在黄仁勋看来，智能视觉技术在汽车领域最大的作用并不是实现无人驾驶，而是保证行驶安全。比如当司机在驾车时偶尔回头没看见红灯，或者拐弯时没有看到盲区的行人，在这些紧急状况下，该技术能够帮助汽车更好地理解周边环境，推断将会发生什么，并化解风险。

根据数据公司IDC的估计，到2020年，全球物联网设备预计将达到300亿。

在El-Ouazzane的设想中，所有的物联网设备今后都应该具备准确识别周围环境的能力。“当你感觉到冷，想把壁炉打开，现在的云技术还没办法知道你的这个动作。我们的目标是通过智能的摄像技术给云也安装一个眼睛。”

不过，单单靠眼下的技术还无法支撑这些美妙的未来。行业内人士普遍认为，目前一些所谓的智能设备具有的视觉功能，只相当于一个两三岁小孩的识别能力。研究者们正在通过回旋式神经网络等技术，努力将智能设备的视觉提升到成人的水平。

现在，越来越多的普通人都希望拥有虚拟现实的娱乐设施，甚至想要个无人机或是机器人，而这些都与智能视觉技术密切相关。El-Ouazzane认为，需求的增长，很可能会使智能视觉技术的发展在2015年出现一些新的突破

视觉技术与无人机

相关帖子