中国AI巨头让监视如此容易

  • 在美国,有 Alexa 和 Siri 时刻监视着你;在中国,语音计算公司 iFlytek 也构建了类似的所谓智能助手,受到用户的喜爱。它的技术也正在帮助政府窃听你的意见 ……

1937年,也就是乔治·奥威尔在西班牙与法西斯分子作战时脖子中弹的那一年,Julian Chen 出生在上海。他的父母是音乐教师和化学家,让他在一所由基督教传教士开办的学校就读,和奥威尔一样,他也被语言所吸引。

他学习英语、俄语和普通话,而在家里说上海话。后来他又学习了法语、德语和日语。

1949年,也就是毛泽东上台和奥威尔出版《1984》的那一年,学习外语在中国变得很危险。在50年代末的大清洗中,知识分子被告发、送进劳改营,甚至被处决。当时还是著名的北京大学学生的陈,被流放到北京玻璃厂。

陈的工作是把煤和灰从工厂的炉子里拉出来。他通过听同事说话来保持头脑的灵活。晚上,在工人宿舍里,他为北京方言编纂了一本语言民族学。1960年前后,他完成了这本书。不久,共产党的爪牙就把书没收了。

毛泽东死后,他的命运有所好转,因为共产党的领导人意识到中国的经济需要知识分子才能发展。1979年,42岁的陈老回到学校,他的成绩为他赢得了几十年来第一批出国研究生的名额。

他移居美国,在哥伦比亚大学获得物理学博士学位。当时,美国提供了比中国更多的机会,和许多同龄人一样,陈毕业后留了下来,在IBM找到了一份工作,从事物理科学研究。

IBM曾开发出世界上第一款语音识别软件,让专业人士不用接触键盘就能口述信息,1994年,该公司开始找人把它改编成普通话。这不是陈的领域,但他急切地自告奋勇。

陈马上意识到,在中国,语音识别软件能提供的远远不止是办公人员的听写工具,他相信它将彻底改变母语的交流方式。

作为计算机时代的书面语言,中文长期以来一直面临着一个独特的挑战:没有明显的方法在 QWERTY 键盘上输入5万多个字符。

到了20世纪80年代,随着中国第一台个人电脑的到来,程序员们想出了几种变通的方法。最常见的方法是使用拼音。使用这种方法,写 “猫” 时,你会输入 “m-a-o”,然后从一个下拉菜单中选择猫这个字,这个下拉菜单还包括 “贸” 和 “帽” 等等同音字,以及毛泽东的姓氏。由于普通话的同音字太多,打字成了一种低效的选字练习。

为了建立他的听写引擎,陈将普通话分解成最小的元素,即音素。然后,他招募了54名居住在纽约的中国人,并记录他们阅读《人民日报》的文章。

IBM在北京的研究实验室又增加了300名发言者的样本。1996年10月,在他测试了这个系统后,陈飞到中国,在一次语音技术会议上展示了这个名为 ViaVoice 的软件。

在一间挤满了人的房间里,贴着艳丽的墙纸,陈大声朗读着当天的报纸。在他面前,短暂的延迟后他的话就出现在大屏幕上。他读完后,环顾四周,见人们都盯着他,张口结舌。一个研究员举起手来,说要试一试。他把话筒递了过去,人群中一阵议论。ViaVoice 也准确地显示出了那个人的话。

1997年,ViaVoice 首次在中国亮相,包装盒上写着:“电脑能听懂普通话! 解放双手,你的思想就会活起来”。

同年,江泽民坐镇演示。很快,全中国的PC制造商 —— 包括IBM的竞争对手 —— 都在他们的设备上预装了该软件。

与电脑自由对话的时代还很遥远,ViaVoice 也有它的局限性,但该软件缓解了令人头疼的中文文字输入,并在中国的专业阶层中流行起来。“它成了当时唯一的游戏”,陈回忆说。

但对于一些留在中国的学者来说,一个为美国公司工作的研究人员,却为征服汉语迈出了第一步,这让他们感到刺痛。他们觉得,中国需要与陈的所作所为 “相匹配”。

在IBM的 “胜利” 激励下,合肥著名的中国科技大学语音识别实验室里,26岁的博士生刘庆峰也在其中。

1999年,还在科大时,刘庆峰就创办了一家名为 iFlytek 的语音技术公司。当时的目标,似乎不仅仅是与IBM和其他外国公司竞争,而是要创造出能收回中国人骄傲的产品。

早期,刘和他的同事们在科大校园里工作。后来,他们搬到了合肥的其他地方。那是一个二线城市 —— 科技大学在文革期间被搬迁到那里 —— 但留在合肥意味着 iFlytek 接近了大学的知识人才。

当刘向当时的微软亚洲研究部负责人李开复解释他的商业理念时,李开复警告说,要想赶上美国的语音识别巨头是不可能的。在美国,这个行业除了IBM和微软之外,还有多家强大的公司,包括 BellSouth、Dragon 和最近从非营利性研究实验室 SRI International 分拆出来的 Nuance Communications。这些公司陷入了克服2000年早期计算的局限性建立一个不令用户气愤的声机界面的苦战中,但他们远远领先于中国的竞争对手。

刘没有听从李的警告。即使语音界面技术是一个拥挤的、不光彩的小众领域,刘的雄心壮志也让它有了高高在上的道德紧迫感。

“语音是文化的基础,也是一个国家的象征”,他后来在讲述 iFlytek 的起源故事时说,“很多人认为他们” —— 指的是外国公司 —— “掐住了我们的喉咙”。当他团队的一些成员建议公司多元化发展,进军房地产时,刘态度坚决:任何不相信语音技术的人都可以离开了。

美国的 Nuance 正在帮助企业客户开始自动化其呼叫中心,用语音激活的电话菜单(“要付款,说‘付款’)取代人工总机操作员。iFlytek 通过为电信公司华为做同样的工作而起步。

iFlytek 于2008年上市,并在2010年推出了一款重要的消费级产品 —— 应用 iFlytek Input。同年,苹果的 iPhone 开始搭载由SRI国际公司开发并被苹果收购的 Siri。

但 Siri 是一个所谓的 “个人助理” —— 一个会说话的数字礼宾员,可以回答问题,而 iFlytek Input 则更专注。它允许人们在手机上的任何地方听写文字:在电子邮件中,在网络搜索中,或者在微信上,这个在中国工作和娱乐中占主导地位的超级应用。

就像任何在与人类语音交互上训练出来的技术一样,Input 在一开始也是不精确的。“该产品的第一个版本,用户体验并不是那么好,”负责监督该应用技术开发的科技大学科学家 Jun Du 说。但随着实际用户与应用的交互数据开始大量涌入,Input 在语音转文字方面的准确度得到了大幅提升。

恰好,在即将到来的成熟语音界面技术的冲击中,Siri 和 Input 是相对较早开始的先行产品。先是微软的 Cortana,然后是亚马逊的 Alexa,然后是谷歌助手。当 iFlytek 在2012年推出第一代虚拟助手 Yudian时,该公司很快就将其大部分AI火力训练在另一个挑战上:提供实时翻译,帮助用户与其他方言和语言的使用者交流。

后来版本的 Input 允许人们翻译面对面的对话,并获得23种中国方言和4种外国语言的手机闭合式字幕。如果结合中国庞大的人口,对翻译的重视让该公司收集到了海量的数据

美国人可能会轻点 Alexa 或谷歌助手来提出具体要求,而在中国,人们经常使用 Input 来浏览整个对话。“iFlytek Input” 的数据隐私协议允许它为所谓的 “国家安全和国防安全” 收集和使用个人信息,而无需用户同意。”

杜说,“在中国,我们与用户签订一些合同,我们就可以使用他们的数据。” 在中国,语音数据可能会泄露。例如,数据经纪人 Data Tang 在其网站上描述了具体的数据集,其中包括一个包含近10万个3到5岁儿童的语音样本。

2017年,《麻省理工科技评论》将 iFlytek 评选为全球50家最智能公司,中国政府也在其精心挑选的国家 “人工智能团队” 中给了它一个令人羡慕的名额。当年入选的其他公司是平台巨头百度、阿里巴巴和腾讯。

不久之后,iFlytek 与麻省理工学院计算机科学与人工智能实验室(CSAIL)签署了为期五年的合作协议,该实验室是人工智能领域的领军实验室。该公司的翻译技术被西班牙足球俱乐部 RCD Espanyol 使用,并签署了一份独家协议,为2022年北京冬奥会提供自动翻译。

截至4月中旬,iFlytek 在深交所的估值为108亿美元,它声称拥有中国语音市场70%的份额,拥有7亿终端用户。同期,Nuance 的估值为53亿美元。在中国,该公司在语音计算领域的其他主要竞争对手主要是阿里巴巴和百度等平台。

在 Julian Chen 意识到计算机语音技术将彻底改变中国人与电脑的交互方式的二十年后,它在中国的影响确实是巨大的。根据2017年的数据,每天,微信用户都会发送约60亿条语音短信,这些随意的口语信息比一般的语音邮件更亲密、更即时。由于微信的信息以一分钟为上限,人们往往一发就是一长串,iFlytek 制造了一款能自动笔记商务会议的平板电脑,一款能即时生成抄写文本的数码录音机,还有一款安装在全国各地汽车上的语音助手。

消费者对 iFlytek 来说很重要,但其约 60% 的利润都来自公司2019年半年报中所说的 “涉及政府补贴的项目”。其中包括 “智能刑侦辅助系统”,以及上海市政府的大数据支持。这类项目带来的是大量数据的获取。

牛津大学人类未来研究所研究中国人工智能治理的学者 Jeffrey Ding 说:“这可能是法庭程序中记录的所有内容,呼叫中心数据以及大量安全信息”。iFlytek 的创始人兼首席执行官 Liu 是中国橡皮图章议会 —— 全国人民代表大会 —— 的代表。“他与政府的关系非常好”,杜说。

去年秋天,我测试了一个最新款的 Translator,这是由 iFlytek 生产的即时翻译设备,和一个我叫他 Al Cheng 的人。Translator 是一款采用高通公司 Snapdragon 芯片的设备,可以离线使用,对世界主要语言都可用。

程和他的妻子住在中国南方一个拥挤的城市,但每隔一年他们就会去中西部探亲。为了锻炼身体,他们每天早上都要步行半英里去商场。但喜欢用普通话、粤语和客家话来阐述艺术和文化的程不会说英语。在美国的很多时候,他都不高兴地保持着沉默。他正是那种需要 Translator 这类东西的人。

有一天早上,我在商场中央庭见到了程,他在一辆古董雪佛兰皮卡附近,皮卡上放着干草和鲜花。(“是菊花”,程赞许地指出。) 当我告诉他 Translator 的价格(约400美元)时,他持怀疑态度。

“太贵了”,他摇摇头说。但当我们在 Caribou Coffee 外面坐下来把玩它时,他的怀疑态度已经让位于钦佩。

我们把这个设备和他手机上的百度翻译应用放在一起比较,轮流说各种语言的短语,尝试翻译。在普通话中,Translator 听懂了程的口音 “mingnisuda” 是明尼苏达。它也听懂了我的名字,尽管程的发音是 “Mala”。

当我说英语的时候,两个翻译工具都能处理好 “I’m feeling blue” 这个比喻,但只有 Translator 明白,“I got up on the wrong side of the bed” 这句话是在描述我的心情,而不是起床。

最神奇的时刻来了,程朗诵了八世纪诗人张九龄的一副对联。百度翻译无厘头地把这句话翻译成 “At sea, the moon and the moon are at this time”。而 Translator 提供了一个准确的、真正有诗意的翻译:

As the bright moon shines over the sea; / From far away you share this moment with me.

当程改用广东话时,结果更加复杂了。 (Translator 将 “英语” 理解成了 “养鸡场”。)但设备支持广东话的事实使他印象深刻。

iFlytek 的翻译使命远不止帮助旅行者、商务人士和城市精英。它还帮了少数民族和农村地区的人们很大的忙,因为那里很多人不会说普通话,它还在不断改进对方言的处理。

2017年,它推出了所谓的方言保护计划。当我第一次看到有关它的新闻报道时,我被这个奥妙的名字逗得哈哈大笑。中共花了几十年的时间,一个名词一个名词地攻击语言,一个动词一个动词地审查它认为危险的一切术语,破坏方言和少数民族语言,推广意识形态驱动的普通话。中国文化评论家李陀将这种笨拙的措辞称为 “毛语言”(Maospeak),指的是1984中的 “新语”)。科技公司在攻击语言的过程中提供了帮助。

iFlytek 发言人在一封电子邮件中表示,该公司在方言方面的工作目标是 “保护我们的交流方式”。iFlytek 对维吾尔语和藏语给予了特别关注,这些少数民族的语言一直被中国政府重点迫害。中国日报报道说,在方言保护计划的一次促销活动中,高管鼓励 iFlytek 的用户录制自己说母语的声音,以换取赢得 iPhone 的机会。

iFlytek 公司的园区位于合肥市中心之外,在一条街道上,两旁是普通的公寓楼,近半数的11000名员工在占地31亩的大院里工作。公司 11,000 名员工中,有近一半在这个占地31英亩的大院里工作。其余的员工分散在中国各地的办公室,还有一些在世界其他地方。

像硅谷的科技公司一样,iFlytek 为员工提供大巴车,提供食物和娱乐,并标榜自己的崇高使命。园区内随处可见的墙壁、商品、甚至蹲厕的档门上都有 “用人工智能赋能世界 “的标语。去年春天,当我来到那里时,迎接我的是一张习近平的照片。

iFlytek 在其网站上没有列出任何媒体联系人,而我是在花了几个小时拨打该公司的客户服务热线后才安排到这次访问的。几经周折后,一位代理帮我联系到了发言人,他接受了我的访问请求。另一位发言人后来回复了一份发给 Chartwell Strategy Group 的问题清单,Chartwell Strategy Group 是一家位于华盛顿的游说公司,iFlytek 聘请该公司管理其在美国的关系

我一边啜饮着奶茶一边听主持人解释公司的消费级产品。她穿着一件宽松的衬衫,高跟鞋,戴着吊坠耳环 —— 这身打扮反映了 iFlytek 的审美,即 可爱、奇异甚至愚蠢。

其儿童伴侣机器人 Alpha Egg 的一个版本,有圆点和小天线,用卡通式的外星人声音说话。它为司机提供的虚拟助手 “飞鱼 Flying Fish”在广告中被描绘成一条戴着潜水面具的可爱鲨鱼。

它向医院推销的协助病人问诊的机器人,看起来就像 C-3PO 和 EVE(动画片 WALL-E 中的机器)的爱子。( “也许比世界上任何一个国家都要多”,帮助开发医疗助手的实验室科技大学人工智能研究中心主任陈小平说,中国人 “真的很喜欢机器人” )。正如发言人所解释的那样,iFlytek 的产品都是为所谓的方便和有趣服务的。

在中国,趣味也是一种颠覆的手段,尤其是在语言方面。在2000年代初,由于网络审查员禁止某些字符,电脑用户通过改用同音字来绕过审查。为了嘲讽 “和谐社会” 的概念,这是胡锦涛执政期间流行的一句毛语,中国人拿甲壳类动物开玩笑 —— 河蟹,与和谐的发音相似。“为人民服务” 变成了 “为人民服雾”。两者都含有 “wu” 的字音。

中央政府对网络讽刺的泛滥感到震惊,甚至开始禁止同音字和其他文字游戏。于是,持不同政见者转而使用其他传播手段。

“活动家们在视频中看到了新的机会,因为用摄像机和手机录制、观看以及传播视频变得更容易、更便宜,” 伦敦的西藏人权活动家 Dechen Pemba 说,他是 “High Peaks Pure Earth” 网站的编辑。但到了上世纪末,共产党已经开始寻求掌握语音技术 —— 这与 iFlytek 作为消费级语音公司的发展同步。

2009年,中国公安部部长孟建柱前往合肥,参观了 iFlytek 的总部。根据中央政府网站上发布的一份报告,他在那里谈到,“公安机关要与科技公司密切合作”,建立 “防控体系”。随着中共在过去十年中加大了监控能力,安装了数百万个摄像头,推出了电子身份证和网上实名登记,并建设了科技驱动的所谓 “智能” 城市。人权观察称,iFlytek 的技术帮助政府将音频信号整合到这个数字监控网络中。

这家公司是中国政府一项名为 “军民融合” 的更广泛努力的象征,该努力旨在利用中国科技领域的进步为军事力量服务。简称:公私监控伙伴关系。在列表-2 中看到同名板块

“iFlytek 为军民融合做出了相当积极的贡献”,华盛顿特区新美国安全中心研究员 Elsa Kania 说,她研究中国的人工智能。“该公司有追求消费者应用的元素,但面向公共安全、治安和国防的应用似乎也很重要。”

根据 Kania 去年向国会提交的证词,该公司曾向人民解放军推广其产品。她补充说,“不清楚消费级应用和其他面向国家的应用之间是否存在防火墙或类似的划分”。(通过 Chartwell Strategy Group 发言人表示,iFlytek 并不开发军事技术,也不会对该公司的安全工作或通过 iFlytek 的消费产品收集的数据是否与其政府项目有防火墙进行评论。)

对中共来说,监控言论似乎不仅仅是审查。“语音和视频数据的收集有助于识别人、网络、人们如何说话、他们关心什么、以及倾向是什么”,堪培拉的澳大利亚战略政策研究所网络中心的分析师 Samantha Hoffman 说。

iFlytek 已经申请了一个系统的专利,该系统可以筛选大量的音频和视频,以识别被复制或转贴的文件 —— 该专利解释为 “在信息安全和监控舆情方面非常重要” 的部分操作。 iFlytek 回应称,”分析音频和视频数据可以有很多潜在的应用,包括识别流行歌曲、检测垃圾电话等。”

但 iFlytek 确实可以实现维稳工作。早在2012年公安部就从 iFlytek 购买了专注于智能语音技术的机器。公安部选择了安徽省(iFlytek 总部所在地)作为语音模式数据库的试点之一 —— 这是一个人们独特的语音的目录,可以让当局通过声音识别说话人。

该项目依托于 iFlytek 公司的一款名为 “取证智能音频工作室” 的产品,这是一款包括扬声器、麦克风和桌面的工作站。根据2016年当地政府的采购公告,该设备的售价约为1700美元,它可以根据声音的独特特征来识别人的身份。

2013年上传至网上的 iFlytek 白皮书将声纹或说话人识别宣传为 “唯一可以远程操作的生物识别方法”,并指出 “在国防领域,声纹识别技术可以检测电话对话中是否有目标说话人,然后追踪对话内容”。白皮书称,工作站可以采集一段音频,与200名发言者的声音进行对比,并在两秒内挑出说话的人

其他国家也将声纹识别用于情报目的。根据斯诺登泄露的机密文件,国家安全局长期以来一直使用该工具监控目标人。联邦调查局也有一个专门研究该技术的部门。

Nuance 曾经出售过一款名为 “Nuance Identifier” 的系统,据说该系统可以让执法部门 “在几秒钟内针对数百万个声音指纹进行搜索”。据报道,美国监狱管理局收集并存储囚犯的声纹,以便监控他们的电话通话。

2017年,人权观察组织发表了一份报告,详细介绍了 iFlytek 的政府工作。该公司的工具是执政党 “建立数字极权国家” 计划的重要组成部分(该公司称这一指控 “毫无根据且荒谬”)。“iFlytek 的语音生物识别技术使 “追踪和识别个人成为可能”,人权观察说。在某些时候,保留汉语、方便交流的崇高努力与控制汉语的努力变得不可同日而语。

与许多美国科技公司一样,该公司坚持认为其技术 “与最终用途无关”。

在对党的统治构成威胁的任何地区,iFlytek 的工作受到了特别的怀疑。其中一个重点是西藏地区,这是中国西部文化独特的地区,人们长期以来一直在为主权而战。

在拉萨,iFlytek 在西藏大学联合成立了一个实验室,专注于语音和信息技术。该公司表示,该实验室的目标是 “保护和更多地了解少数民族方言,帮助保护藏族文化”。该公司还制作了一款名为 “Dungkar “的藏文应用,意为 “海螺壳”,在藏传佛教中是一种吉祥的象征。

根据人权观察组织的说法,iFlytek 的技术似乎可以实现对新疆的监控,新疆是中国西北部一个以穆斯林维吾尔族为主的少数民族群体居住的地区。近年来,中国政府加强了对维吾尔族人的控制,将100多万人关押在拘留营,并将其他人驱赶到工厂作为强迫劳动。

居民被要求在手机上安装监视应用程序,在安检站提供生物识别数据,并在家中接待文化检查员。在官方材料中,这些检查员被称为 “大姐姐和大哥哥”,甚至没有明显的讽刺意味。

喀什是丝绸之路上的古城,曾经是游客的主要目的地,现在至少有十几个拘留营,喀什的被打击力度可能最大。2016年,喀什警方与 iFlytek 子公司签订合同,采购了25台声纹终端

根据采购协议,该技术将用于收集语音样本,用于生物识别档案,其中还包括照片、指纹和DNA样本

根据该子公司的网站,他们帮助喀什大学整合了校园大数据,目的是确保其在 “多民族” 环境下 “安全稳定运行”。

2016年5月,iFlytek 与在新疆运营监狱的机构签署了战略合作协议。目前尚不清楚 iFlytek 的技术在此背景下的具体应用情况,但在中国平台搜狐上的一篇文章称,iFlytek 的工作将 “确保监狱的安全和稳定”。

去年夏天,一群美国学者在北京会见了 iFlytek 的一位领导层成员,并向他推销该公司在新疆的工作:“他将其描述为:‘我们通过提供这些语言能力,帮助政府更好地了解维吾尔族人’”,一位当时在场的安全分析师告诉我。

人权观察组织的 Wang 表示,iFlytek 构建的 “既是良性的商业应用,也是监控应用,这恰恰是他们非常有问题的地方”。iFlytek 来自政府项目的数据很可能被用来改进其消费级产品,反之亦然。

“他们可以在大量数据样本上训练和完善他们的人工智能系统,这些样本不仅是通过他们的商业化应用收集的,也是通过他们的军事和警务应用收集的。”

每次旅客对着 Translator 说话时,他们的话都会反馈给一个算法黑匣子。总而言之,iFlytek 的技术有望极大地重塑中国和其他地区人们的生活,将个人的声音变成一个关键的身份标志。

近年来,iFlytek 进入了国际扩张阶段,与加拿大、新西兰和美国的大学建立了研究伙伴关系。在与麻省理工学院 CSAIL 达成协议之际,实验室主任 Daniela Rus 表示,双方的合作将专注于解决 “21世纪最大的挑战”,“找到更好地利用人类和人工智能的优势的方法”。

对这一合作关系的批评者称:iFlytek 给出了一笔未公开的资金,以换取MIT品牌的声望。

这一消息是在人权观察组织曝光 iFlytek 在新疆的工作8个月后宣布的,随着对拘留营的认识的传播,一些麻省理工学院的研究人员开始感到震惊。

CSAIL的研究生 Alan Lundgard 告诉我,他是在实验室开始工作后才得知自己的工作将得到 iFlytek 的资助。当他给CSAIL的一位管理员发邮件解释说,他在道德上反对接受该公司的资金时,该管理员回复说,他可以为自己的工作找到其他资金。他说,如果他不这样做,Lundgard 将不得不退还他已经收到的款项。

去年夏天,在媒体报道披露性犯罪者杰弗里·爱泼斯坦和沙特国家资助麻省理工学院的其他实验室后,学生和工作人员举行了一系列抗议活动,CSAIL与中国科技公司的协议也被推到了聚光灯下。

“对中国监控活动的担忧是非常真实的,” 麻省理工学院计算机语言学实验室主任 Roger Levy 说。“麻省理工学院需要非常认真地对待,当我们与另一个实体达成协议时,我们是在借给它一种信誉。”

10月,美国商务部将 iFlytek列入美国政府限制出口公司的实体名单。作为回应,刘庆峰在 iFlytek 的网站上用中文发布了一篇抗议短文,但这对消除人们对其与政府关系密切的看法并没有什么帮助。

“没有革命先烈的流血牺牲,就没有今天的现代中国”,他写道,“没有现代中国的繁荣与发展,就没有 iFlytek 在工业舞台上的亮相 …… 没有任何力量可以阻挡我们用人工智能建设美好世界的信心和步伐!”

第二天,美国国务卿迈克·蓬佩奥在演讲中提到了新疆的镇压问题。他说:“乔治·奥威尔的《一九八四》的书页正在那里栩栩如生”。

去年秋天,CSAIL 发言人在回答电子邮件问题时表示,iFlytek 被列入黑名单已经触发了麻省理工学院的审查,但在此期间 CSAIL 将继续保持合作关系。4月,在WIRED发出更多询问后,MIT宣布已于2月终止合作关系。校方不愿透露理由。至于 Lundgard 的资金问题,发言人回应说:“研究所必须在开展研究的资金和研究人员的个人喜好之间取得平衡。”

中国的监控状态有时会涉及到学者 Jathan Sadowski 所说的 “Potemkin AI” —— 这种技术看似无所不能,实则不然。但从实际层面来看,技术是否如宣传的那样准确,差别不大。当人们有这样的印象 即 国家可以在几秒钟的时间内截获音频来定位他们时,他们就会开始自我审查。老大哥被内化了。

去年4月,我在访问上海时反思了这个问题。一天,我乘地铁来到位于城市西部的大型国家会展中心,iFlytek 是参展商之一,当我到达其展位时,大屏幕上正在播放一段视频。视频中,一个清秀的年轻人坐上了一辆红色轿车的驾驶座。“嗨,Peter!”一个声音说,连接到仪表板上的屏幕闪现出他的照片。Peter 面带微笑,仿佛他一生都在等待他的车能认出他来。

一位叫邢晓玲的销售人员带领我去了一个小车站,亲自为我试用汽车助手。我们戴上耳机。 “飞鱼,你好!”她说,屏幕醒了。

“我想听一首歌”,邢说,一首流行音乐在我耳边响起。她向我展示了如何用简单的语音提示购买去北京的飞机票,这是用户连接支付宝或微信支付账户后可以使用的功能。邢还说,飞鱼随时都在准备着。(也就是说,任何时候都在听着你)

iFlytek 的虚拟助手经常被称为 “中国的Siri”,但邢认为这种比较对公司不利。“用Siri,你每次都要说 ‘嘿,Siri’,这很机械。” 在美国,像苹果这样的公司一直在努力狡辩说他们的设备没有一直在听。但在中国,这甚至是一个卖点。“你只需要唤醒它一次,它就一直醒着”,邢就这样评价飞鱼。

我用我的数码录音机录下了这段对话,并在她说话时做了笔记。当我回过头来看屏幕时,却发现我并不是唯一一个做了记录的人 —— 就在那里,在未来的智能交互式自动系统上,完整地记录了我们所有的话。⚪️

How a Chinese AI Giant Made Chatting — and Surveillance — Easy

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据