说谎的眼睛:根植于维多利亚时代面部识别

  • 当前已流行全球的监控技术建立在严重局限性甚至可能是错误的理论上,它意味着什么?

看这张脸 👇。你觉得这个人感觉如何?

什么样的经历会产生这种深渊的表情:大睁眼睛、眉头弯曲、下巴缩回、大张嘴巴,就像是从喉咙深部发出沉闷的尖叫?

Charles Darwin 在1872年的作品《人与动物的情感表达》中使用了这张图片(*改编* 自法国神经学家 Duchenne de Boulogne 的照片)来帮助说明他关于人类情感表达的进化起源的理论。

这本书将科学讨论的重心从面部表情学(对基础骨骼结构的研究)转向病理学方面(对面部活动的研究),从此为演化生物学范式打下了基础 —— 此范式自此以后一直主导着科学家对人脸的解释,直到如今

现在,我们可以 “读取” 面部,这通常被认为是理所当然的。在他人身上我们看到了肌肉收缩的特征性模式,可以直观地将其与特定的情感联系在一起:微笑意味着幸福、皱眉表示悲伤、立目表示愤怒 ……

这种简单的逻辑遍布人们谈论面孔的方式 —— 决定了人们认为面孔所示的含义以及它们的代表方式。

它还以自我合理化和量化的形式支撑了各种新的 “情感检测/监视” 系统,这些系统目前由 Emotient、Realeyes 和 Affectiva 等初创企业以及微软、亚马逊和IBM等寡头公司开发和销售

👉这些监视系统旨在通过分析人们面部的实时镜头来识别一个人的情绪状态。

广义上讲,它们通常通过绘制一系列面部 “标志”(嘴角、眼角、鼻尖)的相对位置,然后将它们与一组情感模板相匹配以进行标记。结果通常表示为概率百分比,这个百分比允许在单个面部案例中同时存在不同的甚至矛盾的 “情绪”。

例如,在任何给定的时刻,您的脸都会被视为 56%轻蔑、31%恐惧和13%的快乐。

如果这种情感上的演算看起来显然是荒谬的,人们应该提醒自己,从事制造和部署这些技术的开发人员、投资者和客户会造就非常严重的问题

⚠️这些技术已被广泛地应用于市场、工作场所管理、维稳异议和全民监视等各个领域,为独裁资本控制和从人体中提取价值,提供了新的途径。

👉 旅客因面部表情 “恶意” 而被拘留在机场安全部门,被认为对自动化面试官表现出焦虑或愤怒后,求职者被拒绝,服务人员因热情不足而受到制裁 …… 似乎看起来像资本主义反乌托邦的前沿,“自动面部分析” 最终也建立在相同的传统认知的基础上,即 笑脸代表快乐的个体。

但是,如果回到达尔文的《情感表达》,你就会发现,这些想法既不像最初看起来那样永恒,也并非不言而喻。实际上,在达尔文出现之前,有关情感表达的论点与他关于进化论的更为著名的著作一样,都是奇思妙想而已

直到19世纪初,几乎所有系统性的以整理人脸的含义为目标的研究都集中在潜在的骨骼结构上,这被认为可以表明一个人的一般性格。比如 突出的鼻子、意志力等等。

这就是相貌学的意思(就如中国的相面术),相貌学的起源可追溯到古希腊时代,在优生学和一系列制度化的种族意识形态领域非常顽固。如今,它还存在于一些监控技术中,这些技术不仅试图从人的面孔上检测情绪,还声称可以从面部形态上检测个人的性格特征或行为倾向。

对于像18世纪末的瑞士神学家 Johann Kaspar Lavater 这样的相面先生来说,脸部固定的轮廓为调节个体主观性提供了基本框架。诸如鼻子的大小或额头相对于下巴的角度之类的度量被认为是形而上学本质的外在表达、认为它定义了人的性格极限。

面部表情仅在此基础的确定背景中才有意义。例如,对于一个拥有坚挺、垂直的骨骼结构的人,Lavater 就会将其与精神上的贵族联系起来,认为这样的人会大笑或坦荡地微笑,但从来没有淫荡的笑容,因为淫荡简直超出了他们的骨骼结构所暗示的可能性范围。

Lavater 的目的是在极端的政治和社会动荡时期发明一种基于阶级的社会秩序的生物学基础(因此是不可变的),一种将个人组织成可以在视觉上读出阶层的方法,即使旧的封建等级标志正在消亡。

面孔的固定形式表示恶习和美德在各种 “人的秩序”中的永久分布,社会秩序的“理性”重组被限制而无法再进行。

相貌学家相信人类的本质是一成不变的,更不用说它在不断发展的解剖学、生物学和神经学学科中缺乏任何依据,而达尔文正是以此为依据的

因此,达尔文写表情的最直接的目标之一就是颠倒相貌学,声称主观性的深层结构不是在面部的坚硬基础中找到,而是在其活动的肌肉组织中找到的。

他绝不是第一个尝试这样做的人。在他的作品发表之前,Duchenne 等人和苏格兰通才 Charles Bell 爵士是达尔文最重要的影响者。然而,这些早期的病理学家也分裂为与达尔文理论不相容的立场,声称面部表情是人类的独特才能,是人类善意的创造者为了传达灵魂之物而授予的。

达尔文希望驳斥这种创造论者关于面部表情的描述,这驱使他采取了一种看似反直觉的修辞策略。

看起来他决心与设计论观点背道而驰,朝相反的方向进击,他声称面部表情可以更好地理解为进化世系中更早的“有用”行为的无用痕迹;“它们实质上是身体上的反射,植根于我们祖先应对原始环境挑战的方式”。

例如,通常与恐惧相关的张开嘴巴、睁大眼睛的表情仅仅是身体对感知到的威胁做出的更广泛生理反应的一部分,其中还包括诸如头发僵硬、心跳加快和呼吸加快等现象。 本质上,是战斗或逃跑的所有必要准备。

这些行为共同构成了后来的研究者所说的 “影响程序”,即 根据后达尔文主义进化心理学定义情绪的生理反应列表。

有人认为,情感程序和面部表情不会进化,因为它们的交流功能具有适应性优势。它们是史前人类的遗物,即使在塑造它们的暴力世界消失之后,也通过结社力量传承至今。

这种推理方式对如今人们如何看待情绪和面部表情的方式具有深远的意义 —— 一组*假设*已直接输入到当代情绪检测技术的设计中

A monitor displays the Omron Corp. Okao face and emotion detection technology during CES 2020 in Las Vegas, Nevada, U.S., on Wednesday, Jan. 8, 2020. Every year during the second week of January nearly 200,000 people gather in Las Vegas for the tech industry’s most-maligned, yet well-attended event: the consumer electronics show. Photographer: Bridget Bennett/Bloomberg

面部表情仅仅是情感程序的一个元素而已,但它是最可见且最容易识别的。因此,人们倾向于将面部表情视为 “稳定的” 情绪代码。

但至少达尔文对这种符号学大体上是试探性和谨慎的,然而,他的继任者几乎没有继承他的谨慎态度。

从1960年代起,自称为达尔文主义传统的继承人们一直在寻求建立与刻板印象化的面部表情相关的 “万用的” 或 “基本情感” 库。

该领域最有影响力的实证研究通常是向人们展示一张面孔的照片以及一系列预先选择的“情感词”,并要求他们选择最合适的匹配项,其结果通常以六个清单的形式呈现规范表达:幸福、悲伤、厌恶、恐惧、愤怒和惊奇。

该清单提供的就是当代情绪检测技术所基于的基本类别。

达尔文的工作极大地改变了人们对人脸与主观性之间关系的理解。人格不再以一系列道德特征(智慧、愚蠢、美德、邪恶)来描述,而是通过一系列情感状态的动态来描述;一个人的身份取决于此人的感受,而不是遗传性的和不变的形而上学本质。

从这个意义上讲,达尔文对情感的描述不仅构成了对相貌本质主义的拒绝,而且还有限地驳斥了19世纪末的优生主义者和种族科学家对相貌的等级世界图景进行重新定义的尝试。

但是,从长远来看,达尔文的思想只是将人类包裹在另一种形式中了。它将面部形态的决定性框架交换为一组据称是硬编码的情感程序集,被认为植根于人类的进化传承中。

由于在达尔文主义的观点中,情感及其相关的面部表情被视为反射、建立 “真实情感” 的绝对经验标准,其中包括由适当刺激触发的定型生理反应。结果就是,任何有意识地与他人交流情感状态的尝试都被隐含地理解为一种伪装的表演。

反过来,这种区别为纯粹根据情感显示的 “正确” 和 “错误” 的生理标记奠定了基础。

按照正确的训练,逻辑就可以了,客观的观察者可以从“假”表情中分辨出 “真诚” 的笑容。同时,受试者对自己的情感真诚度的感觉完全不重要。

决定一个人的感受的最高权力不在此人的经验范围内,而是超出了他们描述它的能力。无论他们是否喜欢,“真相” 都被认为写在此人的脸上

👉新一代的情绪检测技术将这一原理系统化了。如果充分扩展,它将有效地剥夺人们(无论是个人还是群体)叙述自己的情感经历的能力。

👉这种情感打击的不当后果已经可以被察觉到。例如,据报道,韩国的一些求职者已开始接受特殊培训,以学习如何才能表现出公司正在用来筛选潜在候选人的AI机器人所认为的 “正确” 情绪。

这些技术是否能 “准确地” 检测到情感的问题不在重点之列。重要的是,他们的裁决得到了在人们的日常生活中行使强制性权力的机构的认可

Demonstration of Facial Emotion Recognition on Real Time Video Using CNN : Python & Keras

达尔文及其继任者的工作目前为当今的情感分析技术提供了重要的理论基础和合法化的强大资源。但是,很少有人认识到达尔文的理论本身在其起源时就陷入了围绕19世纪革命性媒体形式摄影而传播的知识和权力的复杂纽带。

达尔文关于面部表情的想法从根本上是通过他对该技术的实验性和说明性使用而形成的。摄影是一种看似客观的表达方式,与惩戒权的行使密切相关。当今的面部情感分析运用了类似的客观性,并且再现了相同的社会政治盲点

情绪和面部表情都是持续的,并且会无限期地展现。然而,照片使脸部脱离了这种不稳定的时间性,而是将其呈现为点和轮廓的固定空间布局。

换句话说,达尔文主义病理学只有通过将其移动表达形式化为坚硬的静态几何体,才能将其转变为清晰的对象。事实证明面相学的幽灵不是那么容易驱除的。

在1870年代中期,摄影仍然是一种革命性的新技术,逐渐进入了文化主流。《情感表达》是第一本以英语出版的带有摄影插图的书籍之一。对于达尔文来说,这些插图提供了一定程度的细节和客观性。

这些图像缩小了论点的复杂性,有时缩小的是违反直觉的论点与这些论点所涉及的日常视觉体验之间的差距。

除了这种修辞功能外,摄影还具有重要的方法论作用。正如达尔文指出的那样,“对表情的研究很困难,因为动作通常非常轻微,而且瞬息万变。” 如果要在精细的细节和短暂的肌肉运动中发现面部表情所表述的重要意义,那么观察者必须拥有快速的视觉和超强的记忆才能将它们结合在一起。

这就如同赤手抓蝴蝶。但是摄影可能会抓住这种飘忽的东西,并在不到一秒的时间内将其捕捉起来。它捕获微小而短暂的肌肉收缩,并将其与背景环境分开。面孔最终可以以客观的形式来表达,似乎与欲望、记忆、痴迷和想象力的扭曲效应相分离,后者是早期复制形式的产物。

达尔文确实承认了面部表情会以使客观审查极为困难的方式影响人们。一张脸需要回应,无论是同情、恐惧还是令人反感,这种互动都会破坏客观性。

而且,他承认,我们从来没有简单地就面孔本身做判断,而背景因素不可避免地激发了对面孔的理解。面孔的含义取决于我们所遇到的人际关系、社会和文化条件。

从达尔文的角度来看,这个棘手的问题是:如果很难将面部表情与移情、互惠和社交的动力分开,那么面部表情可能不仅仅是简单的反射,而是人类互动的必然历史和社会产物?

但是,承认这种可能性将在深层次上干扰达尔文的理论。摄影再一次提供了*摆脱*看似无法解决的矛盾的方法。

通过将脸部呈现为陷在相框中的静态伪像,照片看上去似乎将脸部与其直接的社会情感环境隔离开来了,从而使达尔文可以纯粹从其物质结构方面对其进行研究。

通过摄影,达尔文可以将情感描绘为存在于面部 “内部” 的一种物质,等待细心的生理学家发现它。

当然,出于同样的原因,现代研究人员认为,他们可以从CCTV录像或网络摄像头中出现的面部表情中挖掘情感。

就像他的前任一样(更不用说他的继任者了),达尔文关于面部表情的想法既受到了他试图代表它们的媒介的束缚,又被其所支持。如果说相貌是线条、半身像和轮廓的哲学,那么病理学将是照片的科学。

但是,在摄影实践需要大量专业技能和设备的年代里,达尔文缺乏制作自己的影像的资金。因此,他在某种程度上依赖于法国神经学家 Duchenne du Boulogne。

本文最上面的那张图来自《Mechanism of Human Physiognomy》(1862)中包含的84张 Duchenne 照片中的一张,这些照片描绘了据称是不同情绪状态特征的各种面部表情。

他的作品集被证明对达尔文特别有用,一方面在于它的视觉清晰度,另方面是,他提供了同一主体的多幅图像,表现出各种情感,使它们之间的差异更易于识别。

Duchenne 面临着与达尔文几乎相同的问题 —— 如何将面部表情单独拿出来使其成为可分析的清晰对象?如何将表情从面对面的社会情感环境中提取出来?

摄影是解决方案的一部分,但 Duchenne 还运用了更多的技术创造力:他将这一过程称为“电生理学”。通过用电极附着在受试者脸上刺激肌肉,他发现可以重现笑容、皱眉、冷笑和其他许多特定的面部构造。

除了通过外力操纵面部肌肉的怪异感觉外,该过程是非侵入性的,并且据称基本上无痛。

然而,即使在使用法国同事的照片时,达尔文显然也打算淡化 Duchenne 的技术。在上面的图像中,电极被去掉了,看起来就好像是该人“自发地”表现出这种致命的恐惧

在其他情况下,达尔文使用 Duchenne 的原始照片时,会对其进行裁剪以使电极尽可能不显眼。另一方面,如果人们看着 Duchenne 的原始照片,那么它们的怪诞就变得不容忽视了。

一旦我们熟悉了 Duchenne 的技术,就可以理解上述图像的讽刺意味 —— 达尔文竭尽全力压制的悖论。

表现出这种 “恐怖” 表情的人极有可能只是轻度的不适。Duchenne 已经切断了面部肌肉、情绪和主观性之间的联系 —— 而达尔文的论点是情感和面部表情是反射性的回应。

电生理学的残酷景象也证明了摄影本身的强制性。

英澳学者 Sara Ahmed 认为,所有面对面的交流虽然不一定是敌对的,但不可避免地暗含着谈判、许诺、礼节和权力问题。并且在性别、种族、阶级和社会等级制度的形成方面也具有最广泛的意义,涉及谁看和谁被看的问题。

无论我们是看着挚爱的朋友还是凝视着街上的陌生人,都是如此。如果排除隐含的社会和政治动态的作用,就不可能理解一张面孔。

摄影之所以看起来就像具备开放性和易读性,但那只是脸部的基本属性,而不是特定社会关系的影响。但 Duchenne 的技术将这种被掩盖的过程返回到图像的表面。

查看他的一张照片可以清楚地看到,“可读” 的面孔并不是 “发现的对象”,而是更复杂的强制性的人工过程的结果。同样,当今的情绪分析技术所产生的读数仅仅是一系列复杂的社会遭遇的表层。

Duchenne 的研究是针对精神病或精神病患者进行的,这一事实极为重要。这些精神病患者无权反对或抵制 Duchenne 的实验,更不用说提供任何形式的知情同意了。

19世纪许多最著名的面部研究项目都是在制度化的机构和被剥夺权利的人中进行的。法国警察 Alphonse Bertillon 的人体测量学是针对被拘留的罪犯进行的,Lombroso 的犯罪学研究和 Galton 的 “综合肖像” 也是如此。

达尔文表达的另一个至关重要的资料来源是他分发给调查英国全球殖民地的各种科学家、冒险家、传教士、行政人员和警察的问卷。达尔文并没有认真考虑是在什么情况下记录了这些观察。

依赖算法的当代技术科学研究也是如此。

在每种情况下,强制性的社会关系都会将面孔带到镜头前。从这个意义上讲,在19世纪出现的清晰客观的面孔不仅是相机技术的影响,而且是福柯所说的 “惩教机构” 的发展力量 —— 监狱、工厂、医院、庇护所 —— 组织,合理化和工具化人体。

这种机构隔离人的能力、并将人们放置在镜头前,迫使他们将自己的脸暴露为静态物体,这产生了如今算法时代继承的情感识别观念

在某些方面,当代人脸研究的道德规范在某些方面也同样模糊。虽然现在要求实验室的实验参与者提供知情同意,但是,许多最新技术都依赖于上传到社交媒体网站的数据,自动抓取,发布者完全不知情

如今,可以以自己的脸来判断自己情绪的自由,已经完全被低估了。很快,我们所有人都可能会失去这种自由。⚪️

作者 Richard Woodall 是英国谢菲尔德的作家和研究员。他的研究主题包括视觉技术的历史和政治学,以及对数字资本主义的分析和批评。

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据