依赖于LipPass解读用户说话时嘴部运动方式的微妙差异差异

[复制链接]
查看1128 | 回复0 | 2022-12-8 16:01:43 | 显示全部楼层 |阅读模式
就像经典间谍电影中那样,有人可能会使用指纹胶片或语音录音来绕过手机上的指纹或声纹安全措施。但是不要害怕——你最深最隐蔽的秘密将来可能不那么容易受到黑客的攻击,这要归功于一种新的用于手机的用户验证技术,这种技术不依赖于生物因素,而是依赖于行为因素。

这个名为LipPass的新平台能以90.2%的准确率解读用户说话时嘴部运动方式的微妙而明显的差异,并能以93.1%的准确率检测出欺骗者。

上海交通大学的俞嘉地副教授说:“为了抵御攻击,现有的解决方案要么使用专门的基础设施,如Apple FaceID,要么要求用户进行额外的操作,如眨眼,这需要用户付出额外的成本和精力,并进一步降低用户体验。”

相反,俞和他的团队开发了一个新的用户验证平台,该平台依赖于手机中的现有基础设施来检测每个人说话时嘴巴运动的独特方式。1月23日发表在IEEE / ACM Transactions on Networking上的题为“Lip Reading-Based User Authentication Through Acoustic Sensing on Smartphones”的论文介绍了他们的新唇读方法。

研究人员意识到,智能手机上的音频组件可以通过分析用户脸部反射的声音信号来描绘用户嘴巴的运动。由于每个人都表现出独特的说话行为——比如嘴唇的凸起和闭合、舌头的伸展和收缩,以及下颌的角度变化等——这创造了一个独一无二的多普勒效应轮廓,这轮廓能够用手机检测到。

然后,该平台使用一种深度学习算法,在用户说话时从用户的多普勒轮廓中提取显著的特征。接下来,应用一种基于二叉树的方法来辨别是新用户的轮廓还是以前注册的用户的轮廓,这也有助于在合法用户身份和欺骗者之间做出辨别。

俞和他的同事们做了一些列的试验,在四款不同的智能手机上测试了LipPass:Nexus 6P, Galaxy S6, Galaxy Note 5和华为Honor 8。志愿者们在四种不同的环境(从明亮、安静的实验室到昏暗、嘈杂的酒吧)中使用该平台。



在受控制的实验室环境下,LipPass的整体识别准确率达到95.3%,与研究中分析的其他两个平台微信和支付宝的认证准确率相当:微信的声纹识别准确率为96.1%,支付宝的人脸识别准确率为97.2%。然而,值得注意的是,LipPass的识别准确性在各种环境下保持相对稳定,而在嘈杂环境中微信的识别准确率下降到21.3%,而在黑暗环境中支付宝的识别准确率降至20.4%。

研究人员还评估了LipPass辨识出欺骗者的能力,这些欺骗者以三种不同的方式试图非法进入系统:通过音频回放,模仿合法用户的嘴巴动作,以及记录来自用户嘴巴的反射声频信号(这很难在用户没有注意到的情况下实现)。

综合所有类型的环境和所有类型的攻击,总体成功率不到10%,尽管使用第三种方法(记录用户的多普勒轮廓)的攻击在受控的实验室环境下成功的几率接近20%。然而,俞指出,攻击者必须在非常近的距离内(近至50厘米),才能以足够高的质量记录某人的多普勒轮廓以用于入侵目的。

俞的团队正在考虑将这项技术用于智能家居和智能手机。他说,“我们还计划将基于唇读的用户身份验证扩展用于智能扬声器,智能扬声器(如Amazon Echo和Google Home)是智能家居的核心指挥官。”

点击
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则