脸盲救星来了：布拉德·皮特告诉你人脸识别究竟是怎么回事

贾伟中科院合肥 · 发表于 2015-4-11 12:29:54

脸盲救星来了：布拉德·皮特告诉你人脸识别究竟是怎么回事2014-12-10 湛庐文化 [url=]湛庐文化[/url]

有关感知心理学和脑科学的最新研究表明，我们的感官能够从周围世界里获得原本以为只有别的动物才会用到的信息。我们能够像蝙蝠一样利用声音，像狗一样利用气味，像昆虫一样利用触觉……这些隐藏在我们潜意识中的感知技艺被称为“感知力”，而视觉感知力是其中最核心的一部分。

在《返老还童》（《本杰明·巴顿奇事》）这部电影中，对由布拉德·皮特饰演的本杰明这一形象的塑造，很好的解释了视觉感知力的神奇力量。影片的动画制作团队是如何跨越“恐怖谷”，用视觉特效“还原”了一个最“真实”的老年皮特的？

《返老还童》剧照 · 由视觉特效合成的皮特老年时期的脸

“恐怖谷”现象：越逼真,越恐怖

史蒂夫•普里格本来对他承接的新项目并没有什么自信，可是他仍然决定接受这一挑战。“要是它成功了，就很有可能拿到奥斯卡奖了。”他解释说。事实证明他的确成功了——并且赢得了一座小金人。

不过，这条通往奥斯卡的路实在是漫长而又充满风险。视觉特效总监普里格和他所在的特效工作室所接受的挑战，是行业里从来都没有人成功做到的：用电脑动画画出一张看起来真正逼真的人脸。它不仅看起来要像人的脸，还需要在大屏幕上讲话并抒发情感，而且必须让观众相信这些都是真的。

这个动画合成的面孔和头部需要与真实拍摄、不停做着动作的演员的身体天衣无缝地结合在一起，更重要的是，它还不能是随便一张什么人的脸：看起来必须是布拉德•皮特——而且是他老年时期的样子。

当成功地拿到为电影《返老还童》做视觉特效的合同时，普里格对于自己是否能做出一个令人信服的、逼真的动画角色仍持怀疑态度。事实上，整个行业里的人都很怀疑。

为什么普里格和他的同事对制作人类面部的工作如此头疼？其实业内人士对这个问题都感到困扰：只要试图用动画合成写实的人脸，他们就都会落入同样糟糕的恶评当中。《贝奥武夫》和《生化危机》里的人物角色都被形容为怪诞得像僵尸一样。这一切似乎都是因为拟真的人类面孔才让它们显得恐怖，而对于不真实的、讽刺漫画那样的面孔就不成问题。大力水手波比和辛普森的卡通脸长期以来似乎一直生动形象、讨人喜欢，却没有人觉得诡异。只有当动画制作的人类面孔变得越来越逼真的时候，它们才会显得不对劲。

事实上这是一种著名的现象被称为“恐怖谷”，这一概念最初是由机器人设计师森政弘提出来的。它是指我们在看到与人类很相似、具有非常接近真人特点的物体形式（如机器人、动画人物）时所产生的自然反应。

如果一个机器人或一个动画人物，甚至是一个填充动物玩具身上具有某些人类的特征，那么它看起来会让人觉得亲切。而且它具备的人类特征越多，这种亲切感也会随之增强。然而，当这个机器人或是动画人物同真实人类的相似度变得非常高时，你对它的外貌接受度和亲切感就会在一瞬间突然下跌，对它的接受度也会骤降到一个“低谷”中让你突然觉得它很“诡异”。

这就是为什么在电影里，所有逼真的动画人物的面孔都会显得令人不安的原因。动画制作人员努力把动画人物做得和真人一样，但结果却把它们推向了另一个视角，在这个视角上人们只会更加关注它们所不具备的人类特征。也正是出于这个原因，史蒂夫•普里格以及整个行业的人都会对接手制作《返老还童》中的本杰明•巴顿感到忧心忡忡。就像普里格描述的那样：“是啊，虽然我最终还是蹚过了这道叫人求生不能求死不得的恐怖谷。”

《返老还童》获最佳视觉效果奖

人类对面部有着超强感知力

为什么恐怖谷的效应偏偏只发生在人类面部呢？最近的研究说明，这种现象源于我们在观看人类外形时运用的独特感知力。举例来说，当你看到一个很像人类的形象和一个机器形象做出相同动作时，大脑对两者做出的反应是完全不同的。也就是说，当你在观看一个很像人类的机器人在工厂流水线上重复做一个动作时，你大脑的一部分就会产生对这个人类动作的镜像反映。

无论何时，只要你留心观察一个人做某个动作，这些镜像神经元就会被激活。有趣的是，当你看到一个不像人类的机器人做同样的动作时，这些神经元就完全不会被激活。也许反射性镜像参与到面部的感知活动中，会使我们对面部形象的扭曲特别敏感。如果真是这样，恐怖谷的体验可能是你的大脑倾向于映射人类动作而导致的结果。

其他的一些与恐怖谷相关的研究关注的是，人们对面部扭曲的容忍程度。结果表明，用电脑动画合成的人脸越真实，人们就越会对诸多方面的细小偏差感到不能忍受，比如脸部的形状、五官的尺寸和位置。对于双眼的大小、位置及其他相关细节更是如此。据报道，人们认为在《极地特快》和《最终幻想》里剧中人物最恐怖的部位就包括眼睛。

从另一个角度来说，如果脸部用的不是那么写实的皮肤，人们就会对脸型和五官方面的细小偏差宽容许多。对于角色的动作也是一样：角色越逼真，人们就越会对那些不自然的动作百般挑剔。从这项研究中可以得出一个非黑即白的原则：如果脸部的任何特征都需要达到令人信服的逼真，那么所有其他特征都必须做得相当完美，否则就会显得特别诡异。

这也是普里格跟他的团队在接受《返老还童》任务时深刻意识到的事实。他们很清楚，要想把本杰明做成史上第一个越过恐怖谷的动画角色，他脸部的所有细节——脸型、皮肤、各种面部特征和表情，看上去就都需要是完美无瑕的，尤其是眼睛。

“一开始为了研究本杰明眼球的转动方式，我们特别用玻璃做的假眼睛来观察分析。接着，其中一位动画师拍了一组他自己眼球运动的高清特写镜头。在仔细地观察之后，我们发现了一些有趣的事情——当一个真正的眼球转动时，眼球表面覆盖着的那层湿润的薄膜会在眼球转动的方向变得更厚重一些，比如如果眼睛向右转动，则会使虹膜右边的薄膜比左边的更湿润。眼球两边不同的湿润度会带来不一样的光泽——正是这些不断变化的光泽，才让眼睛看起来自然而有灵魂。因此，我们在每一帧动画影片中都加入了这个细节。”

不过就像我们之前说的那样，恐怖谷非黑即白的特性决定了，若是某一处特点的真实性得到加强，只会意味着其他特点的真实性相对减弱。“我们不停地修正一个问题，紧接着又发现了其他的问题，这个过程无休无止。”

普里格的理论是正确的，每个人的确都是人脸专家，因为我们都会对包含丰富内容的细微之处特别留意。

潜意识里的面孔感知力

在感知世界里，人类脸部能够在短时间里传达出惊人的大量信息。你能够迅速地从一张脸上看出这个人的身份、性别、情绪、意图、基因、健康、生育能力、甚至是语言信息（通过唇读）。脸部还能传递出更加细微的性格特征。

正是出于这个原因，你会对脸部非常细微的变形相当敏感，特别是对你熟悉的脸部。假如把明星人物肖像里的眼睛距离缩短1%，然后让被试来看这幅肖像画，他们就会立即发现有些地方不太对劲。之所以能察觉出如此细微的变化，是因为他们对熟悉的人脸的记忆力好得惊人。

此外，你从各种地方辨识脸部图像的速度也快得吓人——几乎是识别非脸部图像速度的两倍。如果那张脸还有表情，你识别出它的速度就会更快。实际上让你完全忽略在视野中出现的人脸几乎是件不可能的事。

脸部是构成你整个生活世界的重要部分，你的大脑已经随时准备好从各种情境中看到它们，这就是为什么你会从很多物体身上看到脸部的形状的原因。云彩、岩石、山坡、天体，仿佛都会呈现出人脸的形象。

研究表明，大部分人都可以轻易地把汽车的车头看做是一张人脸：前车灯是眼睛，散热器护栅是嘴巴。我们还会对不同车型表现出来的“性格特点”具有惊人的一致感受。车头比较宽阔、前车灯和挡风玻璃比较狭窄的车，会被看做是富有男性化、自信、成熟的感觉，甚至还有一点儿愤怒；较窄的车头，较高的挡风玻璃，加上圆圆的前车灯，会带给你孩子气、顺从、快乐以及好脾气的感觉。如果身处黑暗的山谷中，我们似乎更愿意遇到一辆迷你库珀而不是兰博基尼。

即便是对于丧失了辨认人脸能力的人来说，他们也还是具有潜意识的面孔感知力。奥利弗•萨克斯曾在他的书《错把妻子当帽子》中提到，人脸失认症患者必须依靠除了人脸之外其他的线索才能辨认出他人，比如声音，身材还有衣服。虽然长期以来人们普遍认为人脸失认症是由于大脑受到损伤而引发的，但是有越来越多的证据表明，它仍可能有先天基础。

无论是什么原因，研究显示大多数的人脸失认症患者都能在潜意识的水平上辨别出人脸。尽管他们无法意识到自己的认知，但还是会在看到熟悉的面孔时产生皮肤湿润的生理反应。脸部的力量十分巨大，它甚至会渗透到人们的潜意识中，即使在大脑不允许它们有意识地去辨别脸部的情况下，这种能力也依然根深蒂固地存在着。

很多研究者认为，感知脸部要通过一种特殊的方式并使用特殊的策略和特殊的大脑机制来进行。另一些研究者争论说，面部本身并没有什么特殊之处，真正特殊的是我们会对辨别某一类视觉图像尤为擅长。我们都擅长辨认面孔，但是某些人还很擅长辨认其他的东西。饲养狗的人能看出同一血统、同一种族的狗狗们彼此之间细微的区别，其实，当这些人看到狗的图片时，他们表现出来的视觉效应（正向图像强化）和大脑反应与人们看到人类脸部图像时所表现出来的一模一样。

还有汽车设计师，他们看到汽车的图像时也会做出一样的反应。即便是一组普通的被试，在经过集训之后也能学会从视觉上分辨一套抽象物体，他们也显示出了同辨别脸部相关的感知反应和神经生理反应。虽然专家对人脸的感知力是不是真的特殊这个问题还没有一致的结论，但是大家都承认脸部对人的感觉刺激确实具有显著的效能。

汤姆·汉克斯还是皮特？要看它动起来更像谁

本杰明•巴顿脸部之所以如此真实，还应归功于一些新技术。其中有一种技术名叫轮廓真实捕获，它是一种复杂的动作截取系统，比《极地特快》中捕捉汤姆•汉克斯脸部的那种技术要复杂得多。普里格的团队人员必须先捕捉到布拉德•皮特具有个人风格的脸部动作，然后把这种风格放到动画制成的本杰明的脸上去。他们还做了一个布拉德•皮特的面部人偶，这样就可以随心所欲地操纵它了。

要想完成这项任务，需要皮特做出一整套标准化的动态表情，之后工作人员会对这些面部动作加以数码分析。“皮特花了6个月的时间练习了大约200个面部表情——他需要学会用非常精确的方式控制他的脸部，”普里格回忆道，然后技术人员在他脸上用特殊颜料画了一个会发亮的斑点，并用28台摄影机拍摄他做出的各种表情，以追踪到他面部成千上万个细微小点的运动轨迹。接下来，利用这些运动轨迹建立了一个动画程序，使动画人物的脸和皮特自己的脸按照一样的方式运动。我们注意到，皮特和我们所有人一样，某半边脸会比另外半边的动作更大一点点，保持这一类的缺憾也有助于让动画人物显得更加逼真。”

普里格的观点与关于感知方面的最新研究不谋而合。现在我们知道，你其实是通过观察面部动态的方式来辨认某张面孔的。

在走路、微笑以及打哈欠的时候，我们都会以独特的方式做出细微的脸部动作。过去年不断有研究证明，你能够用这些具有个人特色的运动信息来辨别不同的人，尤其是当面部图像被弱化的时候（弄模糊、变色、倒转），你只需看到脸部的运动就足以辨别熟人以及名人的脸。即使看到的是一张陌生脸孔的运动方式，这也有助于你更轻松地记住这张脸。4个月大的婴儿就可以仅仅凭借脸部的运动方式辨别不同的人。此外，陌生人的脸部动作还能传递出关于这个人的年龄、性别、表情甚至吸引力方面的信息。

在一项与恐怖谷相关的实验中，实验人员把一个人面部的运动方式安置在另一个人的面部结构上。一般来说，这一类的实验都要先捕捉到一个真人的面部运动轨迹，然后再把它安置到动画制作的脸部上。这种技术使研究者们能够研究面部结构（五官特征、组合、形状）与运动信息之间的相互关系。

设想一下，如果我们捕捉到布拉德•皮特的脸部动作，然后把它安置到计算机合成的汤姆•汉克斯的脸上。你看着这张脸动起来，可能仍然认得出这是汤姆•汉克斯，但是这会比认出他本人困难一些。现在请你再设想一下，有一张由两张脸共同合成的脸，它的脸型、五官特征和组合都介于汉克斯和皮特两者之间，那么，你会把这张脸认作是谁？实际上，这在很大程度上取决于它动起来是像汉克斯还是像皮特。

这些实验显示了面部动作足以影响我们对脸部的认知能力，而且它的影响不会因为图像模糊、倒置或者变成白点图而减弱。同时也说明，有特性的面部运动的效力足以强到展示出脸上的五官相貌与结构特征方面的信息。

现在，你已经了解了史蒂夫•普里格数字领域工作室的工作为什么会如此难。你对人们的面部极其敏感，而且有充分的理由。一张脸会传递出各种信息，关于一个人的生育能力、遗传状况、情绪状态、语言倾向、当然还有“这个人是谁”。

视觉感知力是人类7大感知力中最核心内容。我们如何用自己的脸去感知别人的表情？我们的表情如何影响心情？如何通过面部感知个性？美国著名心理学家劳伦斯•罗森布拉姆在《感知力：最重要的生存与最强大的影响力》一书中给出了深入的解读。更多内容请见第一章“看懂一张脸，得到千个信息”。

——部分节选自《感知力》

脸盲救星来了：布拉德·皮特告诉你人脸识别究竟是怎么回事

相关帖子