由阿里巴巴安全部主办的“阿里聚安全攻防挑战赛”决战日12月28日即将到来,许多参赛的小伙伴都发现了此次比赛与以往的攻防大赛有很大的不同。就是参赛者可以尝试用声音攻击一套声纹验证系统,通过设计攻击用的音频骗过声纹验证系统,让系统验证成功。
赛事官方网址:https://tianchi.shuju.aliyun.com/mini/aliJuActivity.htm
声纹识别作为一种安全身份认证手段,不可避免的要面临非法用户的攻击风险。声纹识别算法目前技术水平有限,很难识别声音十分相似的两人:现在大部分的算法都可以控制在误识率在千分之一,即随机1000个不同人的刻意攻击,有可能会有一个人因声音过于相似而通过。
如熟人模仿攻击,你身边熟悉你的人模仿你的声音,去攻击你的声纹账户,通过的概率比上述随机攻击会更大一些。当然,人与人之间的声音本身有本质的不同,即便人耳不一定能听出来,声纹识别系统对这种差异是非常敏感的,模仿很难成功攻击。
重放攻击,如果你的声音被某些别有用心的人录下来,然后在声纹登录时播放你的声音。当前,技术上对这种攻击可以有两种防范手段:活体检测和随机内容声纹,活体检测技术可以有效的识别出当前认证的声音来自于真人还是录音设备,而随机内容声纹在每次登录的时候会提示用户必须说随机显示出来的内容,只要说的内容不一致,认证就会失败,这样,让提前录好的声音失效。
特定人声音合成或声音转换。利用机器学习、深度学习等技术,通过对目标人的一段录音进行建模,学习出目标人的声音特质并将其参数化,然后将非目标人的声音合成并转化为目标人的声音进行攻击;在深度学习技术流行之前,传统的机器学习技术合成的声音在真实度上比较差,但是近年类似google的WavNet,以及Adobe Project VoCo等技术,极大的提高了声音合成的真实度,对声纹识别算法造成了潜在的威胁。
声纹识别技术使用便捷,受限制较少。硬件设备简单,只需要有麦克风即可;不受语种、方言、性别和年龄的影响。并且适合远程使用,可适用于远程控制与识别领域;在用户正常说话中,即可后台远程进行声纹识别。用户接受程度高:不易遗忘,防伪性能好、不易伪造或被盗。随身“携带”,随时随地使用。
但是它同样也有一些缺点,比如同一个人的声音具有易变性,易受身体状况、年龄、情绪等的影响。不同的麦克风和信道对识别性能有影响,环境噪音和混合说话人对识别有干扰,部分公共场合,用户不方便说话。
目前看来声纹识别技术是未来的发展趋势,随着声音合成技术的发展,对声音活体检测技术也提出了更高的要求。在大数据条件下,利用部分准确或不准确的说话人标注,自动建立说话人模型,具有重要的实际应用意义。随着数据资源的增多,对声纹识别系统的检索要求的相应时间也越来越短。充分利用移动互联网时代产生的大量语音数据,发挥深度学习的数据驱动威力,可以将声纹识别算法的准确率和鲁棒性大幅提升。
作者:王炎@阿里聚安全,更多挑战赛赛事信息,请关注攻防挑战赛赛事官网