【Maja Pantic】:(翻译室没有声音)所以机器能够有能力去做相应的反应,我们也管它叫做人工智能,首先来看人脸的识别,其实我们也是看到,当你看到一些人的时候,你通过它脸部的一些特征来去识别它,同时要看到年龄、性别、是否长的很漂亮,甚至可以通过人脸一些特征判断一些它的特点。这里我们可以看到是我们自己大脑里面去识别的,可以看到它的态度,看到人的特征。
这是在人脑中来进行一个处理,我们可以看到这种人脸一个识别,它的意义是什么?我们完全可以用到知识,用到很多的方面。我们可以知道人们在反应中,尤其对各种刺激有不同的反应。
我们其实在这方面做了很长时间的学习和研究,我们也取得了一些进步,尤其就这个人脸识别方面。我们希望能够进行一个交换,例如说可以和车、机器人进行交互,任何一个机器人可以进行时时的交互。我们可以看到这些结果,它可能是相当的复杂。
正是我们目前做的这些工作,人的这些表征,我们其实过去二十年做这方面的研究,你可以看到我们有不同的方式可以做人脸的识别,最先进一个技术,我们能够去识别人们的人脸的图片。同时得到一些相应的信息,并且我们可以看到这样一个配比率可以达到98%。同时最难的是这样的行为模式,也就是说你通过识别人脸一些特征识别它的性格,这个是很难。你可以任何一个人脸的表述,可以知道它的喜好,我们怎么样人工智能提高这方面的准确率,这也是要求相应一个技术,你可以我们在这里,包括像一些面具的测试。我们可以看到有不同的结果反馈和不同的教会,有不同的特征去进行验证。
我们可以看到这里人脸识别(图片),首先你能够在屏幕中锁定这个人脸,你可以看到它的一些特征,尤其是显著特征。比如说我们可以看到像脸、眉毛、鼻子特征,我们可以看到其他的特征,如果想进入深入学习,你可以看到它的一些额外的细节的捕捉,你追踪所有的特征,你可以看到这些特征有什么变化,尤其做不同表情的时候,我们分类这些所有的表情的变数。
我们可以看到这些不同步骤,我们追踪了很长时间,这是不同的追踪器,这是最成功的应用。可以看到右边这块,通过追踪器,它能够在不同的光线下面,也能够去识别人类的表情。那么我们在左边这个角落,这个是非常受欢迎的,你可以看到它的应用很广泛。你可以看到最右边下面是我们最准确地一步,它现在也上市了。你可以看到它的追踪器和我们的摄影机是相连的,你可以用到很多方面。
那么,这样我们要把追踪谱或者这些变化把他们应用起来,我们喜欢的方法就是说,我们对他们的脸部肌肉进行捕捉,有43种动作单元,我们可以脸部肌肉可以生成42种动作,比如说额头上有一个长肌肉,你让中部激活,我们称为动作一,它会造成我们的眉毛上扬,实际上你对这个肌肉外部进行激活,你会看到你的外部眉毛上扬,把整个肌肉激活让你造成1+2这个动作。问题在于我们有一万多种表情,这是我们的面部表情,实际上每天用到上千种表情。比如说从一万到七千种表情,降到42个动作组合,实际上把这些动作,它的强弱程度加到系统当中去,我们就会生成复杂的系统。
比如说在每一个表情当中,我们都可以生成面部表情编码系统,这个是我们对表情自动识别系统隐性的方法。左边是动作一,它是针对内部眉毛,你看到在很多情况下,这种惊讶,或者是我们想强调的时候,我们可以用上内部眼毛的肌肉,还有下巴上扬,我们在怀疑的时候,欧洲人怀疑的时候会抬起下巴。另外是4号这个动作,这个就是皱毛,就是生气的时候有的表情,而且有压力,我们也会用眉毛动作表现出来。
我们用两种方法来识别自动表情识别系统,比如说通用型这种表达。我们有人类学家告诉我们,这个世界上每个人展现出同样的表情,而且另外一个人在manbetx app苹果 都能普遍出表情,但是实际上有人说,在不同文化背景来的人,他们识别表情方式是不一样的。比如说拿南欧人,北欧人也有差异,更不用说亚洲人,欧洲人表情差异。我们常用的两种方法就是这个表情是正面的,还是负面的,另外一个维度它是否激动。
我们把这些表情放在维度上面,你可以看到多出这些表情,一般来说都是占了维度的四分之一。那么就是说生活当中,还是表现出各种各样的表情,但是你可以看到表情集中这里面的四分之一。
我们为了识别这些表情,我们需要用表情判断他们的行为。一个就是我们的这种兴趣的唤起,比如说当判断人们如何对一种故事作出反应的时候,我们会用这种兴趣表情来进行判断,你可以看到左边的视频,就是说我们可以时时去分析一种冲突,或者冲突的升级。在这里面我们有三个政客在讨论一个问题,他们都有自己很鲜明的观点,你可以看到一开始的时候,一个人在说话,后来他的声音越来越响,然后开始做一些表情,其他政客开始作出了反应,他们开始同时说话,一般来说这就是冲突很明显的表现。
实际上这里有很多的应用环境,一个非常成功的应用环境就是市场分析。比如说我们和一个公司合作了一个项目,这个想法就是用表情判断这个产品或者人们对这个产品的反应,就是说我们有这个大市场的分析,我们把这个产品呈现给不同的人,我们在观察这些人对产品的反应,一般来说80%情况下,一般来说他们就没有什么反应,但是在20%情况下,你会看到有一些反应。这些就是给我们带来好的销量这样一个机会。我看一下这里的20%的机会,这就是给我们带来销量的机会。
另外一个项目关于研究人们兴趣,我们在线上进行医生和病人之间一种远程的诊疗。他们讨论病人病情。因为这是我们的远程诊疗,我们用摄象头来拍病人的表情,也拍下病人额外的表情,比如说痛苦,女士可能是肩膀疼,医生问他,你能不能把胳膊抬起来,想看看肩膀多疼,他想这么做,我们就可以去平衡,我们可以测量痛苦的程度,还有就是抑郁症。西方国家有很严重的抑郁症的问题,尤其是老年当中,抑郁症甚至影响35%老年人口。还有更大问题是工作人口,在西方国家实际上给我们带来上千亿美金的损失。一般大家不愿意讨论自己的抑郁的病情。
比如说我们老年人口比较多,接下来二十年当中,老年人他们痴呆也是越来越严重,我们用这个系统帮助我们应对这些老年人的病情。我们想用对他们表情的判断他们的病情,这种判断比人类自己判断准的多。偶然差多在每一秒可以观察到18到20贞这样一些信号,很多是微妙的信号。我们通过微妙信号判断他们的抑郁,或者是痴呆病情。有时候看他们微笑的质量而不是数量,一般来说他们往往微笑完了之后,一般来说他们微笑面孔突然耷拉下来,我们就是用耷拉机会拿来分析他们的病情。实际上这种系统可以做到非常准确地判断。
说到对痴呆的判断,我们一般会观察他们眼睛的变化。我们人眼是观察不到细微信号。我们就是用摄象头来拍下人们眼部的变化。我们在每一秒可以观察到40贞微妙的信号,当然有的时候看网速。
你可以看到CBS在伦敦,这是我们另外做的工作,你可以看到我们之间分析他们脸部特征,我们研究他们的表情,我们可以看到他们在老年人家中,让他们照顾年幼的孩子,看到他们的反应,通过我们这样一个软件,可以客观分析他们的反应,同时通过这种客观的分析,我们让他们先去看,可以看到他们的结果,我们可以看到基本上,我们的准确率可以达到90%。这个是做了三个星期,我们可以看到两位年老人士他们的反应,我觉得他们的表情还是比较明显的。
你可以看到有一个是有抑郁症,另外个是没有的。你可以看到下面这位女士是有抑郁症?,上面这个是抑郁症吗?这两个女士哪一个有抑郁症?上面的女士反应比较消极,他们看有意思的影片,他们的表情告诉我们他们的状况。这是我们做的另外一个项目,这是关于发展孩子的艺术天赋,你可以看到鉴别特别特征和反应的时候,我们去分析,我们通过机器和软件能够去教他们,其实我们所有的软件是很稳定的。当我们看到这些孩子很开心的时候,尤其挥动他们的手的时候,他们就是表达他们很开心。我们可以看到他们很开心。这个时候表情是笑的,我们能够去强调它这样表贞的变化,像头的动作,或者眉毛的动作,都能够预测你的表情。这些表情是脸上各个部位共同去运作,不光眉毛能够表达一种表情,我们通过这些机器人就能够教这些孩子特定的表情和表述。
我们现在目前有不少项目,这个是来针对手机一些数据,你可以看到拿着手机做脸部的识别,我们还有不同的这些条件分析,你可以看到有反光,包括可能有一些噪音的数据。
这些都是很难的,我们希望解决这些问题。另外一个就是自动嘎是得应用。我们知道在特斯拉里面,实际上有很多外部的传感器,但是车内没有传感器,因为实际上我们想要至少要知道驾驶员是不是看着路,实际上我们目前内部并没有传感器能够捕捉到这些信息,去年特斯拉请我们给他们提供这样一种在车内使用的识别技术。这个是也是非常重要的。
就是基于摄象头这种咨询,我们可以用在很多环境下,比如说培训人们谈判技术,面试的时候也可以使用这样的技术,我们对会议进行分析,我们觉得这个报告很重要。就是亲密关系的识别或者友好关系的识别非常重要。我们知道75%病人,他们在投诉医生的时候主要是投诉医生对他们不够友好,因此这种和谐友好关系的识别也很重要。
【提问】:你的这个演讲非常有意思,作为一个外行,我特别喜欢看电视,我想起了电视《对我说谎》,我觉得这种识别技术很重要应用环节就是执法,警察想知道你是不是在说谎,或者说实话,这个会影响一些法律的问题,你们这个研究有没有达到这个层面,有没有考虑执法方面使用?
【嘉宾】:大家都想知道对方是不是在说谎,我们并没有这样的数据,我们也不会有这样的数据。问题在于人类,实际上专家可以判断对方是不是在说谎,它的判断准确率才是60%,还有就是生理层面,我们判断这个人是不是说谎话或者准确率,从生理层面才有70%,我不想在这个领域进行开发,因为准确率是不太高的。谢谢!