数百万照片数据库秘密聚集在美欧以开发面部识别:中国享用了多少?

  • 这是一个持续了十多年的大型监视证据,并且惊人地被很多国家的监视项目分享。但为什么,直到现在才报道?而且报道并不完整……

“纽约时报” 发布的一份报告显示,有数百万张面部照片来自隐藏的监视摄像头,一直被储存在用于人工智能(AI)研究和开发目的的数据库中,而且已经共享了十多年。

⚠️由名牌大学和科技公司秘密创建的该照片数据集一直以来被广泛用于面部识别和生物识别技术的研发,这些技术现在被全世界的警察和国家情报机构普遍使用。

⚠️这个大型数字脸部和“自拍”照片数据库来自网站、社交媒体、照片共享应用程序和在线约会平台,并没有经过授权,也包括被公共场所的监视相机拍摄到的图像 —— 该数据集已经被国家机构、软件工程师和研究人员使用人工智能算法和图像模式分析,以寻求创造更前沿的面部识别技术。

延伸:《你曾经在社交网络上发布过自己的照片?你危险了!

该报告很大程度上基于 Adam Harvey 和 Jules LaPlace 发表在 MegaPixels.cc 网站上的信息 —— 其中至少有30个面部图像数据集可以追溯到至少2007年。

Megapixels “精确定位了由微软、斯坦福大学和其他公司建造的这些存储库,其中一个存储了超过1000万个图像,而另一个存储超过200万个。”

⚠️“不仅包括公司和大学,还有澳大利亚、中国、印度、新加坡和瑞士的研究人员、政府和私营企业,广泛地分享了这些数据,用于培训人工智能……”。

关于这些数据集的使用者,纽约时报显然没有提到其中一个重量级的单位:美国政府和军事机构,他们一直在通过与私营公司和大学研究机构合作以进行测试和开发。

例如,2014年斯坦福大学和德国马克斯普朗克信息学研究所共同发起了一个名为 Brainwash 的项目,在旧金山市中心的 Brainwash 咖啡馆中部署了一个隐藏的网络摄像头。

斯坦福大学以其与美国军事情报界的密切联系而闻名。

谷歌就是在斯坦福大学开发的,由国防高级研究计划局(DARPA)和其他国家情报机构在20世纪90年代初提供的资金。

在这里看到具体介绍谷歌的真面目 — — They’re always watching

纽约时报显然也没有提及,马克斯普朗克研究所与德国政府有着长期的直接联系。

在为期三天的时间内,未经 BrainwashCafé 咖啡店同意,该监视项目共捕获了11,917个视频流,每个视频流100秒。

根据 MegaPixels 的说法,“没有任何普通的咖啡馆客户会想到他们的形象会最终出现在用于监控研究和开发的数据集中,但这正是旧金山 Brainwash Cafe 的客户身上所发生的事。”

MegaPixels 还表示,这些视频是来自 AngelCam 并被在线发布的,AngelCam 是一种网络流媒体服务,用于家庭监视目的,每月只需6美元。

⚠️Brainwash 数据库随后被用于中国、瑞士、荷兰、美国、印度和加拿大的 AI 研究目的

在另一个案例中,纽约时报说,杜克大学的研究人员于2014年在校园内使用八台摄像机启动了一个名为 Duke MTMC 的项目,构建面部图像数据库。

这些摄像机的下面贴有标志,上面有一个电话号码和电子邮件地址,供想要退出该研究的人使用。

该监视项目在14个小时内收集了大约2,700个人的200万个同步视频帧,其中大多数被拍到的人是学生。

纽约时报再次隐藏了有关美国政府使用杜克 MTMC 数据集的重要细节。

不过 MegaPixels 报道⚠️中国政府也使用了杜克大学的照片 —— 仅在2018年就有超过90个研究项目 —— 用于监视目的

Harvey 和 LaPlace 还解释说,该数据集的最初创建“部分得到了美国陆军研究实验室的支持”,并用于“监视目的自动分析人群和社交聚会”

此外,MegaPixels 报告称,“来自美国和欧洲的案例显示出与中国相似的趋势,包括美国国土安全部、IARPA、IBM、为ICE提供监视技术的 Microsoft、以及与英国国防部合作的 Vision Semantics。

时报还回顾了2016年创建的名为 MS Celeb 的微软数据集,该数据集包含1000万张图像,这些图像来自“表面上是名人数据库”的网站。

但是,这可不仅仅是“名人”,许多其他人的名字和图片都包含在数据库中。

纽约时报还没有提到,⚠️MegaPixels 在 MS Celeb 数据库中发布了24个名单,其中包括作者、记者、电影制作人、博主和数字权利活动家。

尤其还包括杰里米·斯卡希尔(Jeremy Scahill),他是 Intercept 的记者和编辑,曾广泛撰写有关战争罪的文章,并为维基解密编辑朱利安·阿桑奇(Julian Assange)辩护,反对美国的监禁和引渡

MS Celeb 数据集包含200张 Scahill 的面部照片。

延伸:《美国黑客团队和阿联酋间谍合作计划攻击报道斯诺登文件的媒体机构 TheIntercept》。

MS Celeb 数据集的目标是针对100万人,并包括另外 900,000 个没有附加图像的名称。其中 10万人的数据集已被十几个国家访问。

MegaPixels 网站显示,⚠️2018年在全球发生的124个研究项目中使用了 MS Celeb 数据集,其中大部分位于中国(47)和美国(42)

MegaPixels 网站上还有两个图像数据库未被“纽约时报”报道,其中一个来自牛津大学,另一个来自科罗拉多大学。

牛津中心数据集包含自2007年起从英国牛津 Cornmarket 街和市场街拐角处安装的监控摄像头拍摄到的2,200人的视频。

该监视项目由牛津大学在一项名为 Project HERMES 的欧盟人工智能计划的支持下进行。

MegaPixels 报告说,该图像数据集已被广泛分享,提供给来自世界各地的80个研究项目使用

根据 MegaPixels 的说法,最终的数据集来自科罗拉多大学科罗拉多斯普林斯分校,其中1,700名学生和其他行人“在他们不知情的情况下被使用远程高分辨率监控摄像机拍摄”。

这些照片是在2012–2013学年春季学期在科罗拉多校区西草坪上拍摄的,并且是在学生们在课间休息时。

MegaPixels 报道,毫无约束的脸部数据集 “为研究人员提供了真实的监控图像,以帮助构建面向国防、情报和商业合作伙伴的人脸识别系统。”

总的来说,MegaPixels 在30个公开可用的人脸识别和面部分析数据集中找到了2400万张“非合作的,非自愿被拍摄的照片”,这些照片是在没有任何明确同意的情况下被收集的,这是一种研究人员称之为“在野”的面部图像。

每张图片至少包含一张脸,许多照片包含多张脸。在所有2400万张图片中,大约有100万个独特的身份。“

软件公司 Clarifai 收集了一个面部数据库,其中包含来自约会网站 OKCupid 的图片。

Clarifai 的首席执行官 Matthew Zeiler 告诉“纽约时报”,他有权访问 OKCupid 图片,因为“一些约会网站的创始人投资了他的公司。”

Zeiler 还表示,⚠️他与一家大型未透露名字的社交媒体公司签署了一项协议,“将其图像完全用于训练人脸识别模型”

猜猜看,这家“大型”社交媒体公司,是谁?

Clarifai 使用 OKCupid 照片开发面部识别软件,可以识别分析面部的年龄、性别和种族。

当被问及意图时,Zeiler 说:⚠️“如果情况合适,Clarifai 会将其面部识别技术出售给外国政府、军事行动和警察部门。”

欧洲和美国大学以及硅谷科技公司十多年来一直参与收集“非合作、非自愿照片”,用于研究目的,此揭露再次表明,实施面部识别和生物识别技术的国家监视工作进展顺利。

这些组织秘密创建和分享用于人工智能开发的面部图像之内幕也暴露了学术界和企业界明显参与了攻击基本民主权利的交易

尽管 Adam Harvey 和 Jules LaPlace 在 MegaPixels 上发布的信息得到了 Mozilla 开源社区的支持,但自2017年11月开始提供以来,包括纽约时报在内的企业媒体一直没有报道,直到现在。

现在报道这件事是因为美国公众对地方、州和联邦警察机构对整个社会进行面部识别和生物识别监视的反对意识和愤怒日益增加。简单说,目前报道它能获得更多点击量。⚪️

Massive photo databases secretly gathered in US and Europe to develop facial recognition

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据