防骚扰诈骗的重要技术是依靠大数据?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

10月8日探讨了内蒙古“诈骗电话预警系统”,系统基于中国移动的“提醒彩印”业务,目前全国共有11个省份的试点地区实现了这项业务的全量开通。另外,中国联通也有“防骚扰电话提醒服务”。

我国手机用户超过13亿,还有相当大的一部分人群,在使用手机软件的防骚扰诈骗功能。不论是运营商还是手机软件商,防骚扰诈骗的重要技术基础就是依靠大数据。大数据怎么来的?如何用大数据来预防电信诈骗?请看中国之声系列调查《机防骗真的难吗?》第二篇:“大数据的防骗术”。

大数据,这个时髦的词儿,成为预防电信诈骗的重要技术手段。给内蒙古“诈骗电话预警系统”提供大数据支持的,是2400公里之外,福建厦门中国移动下属的咪咕动漫公司。该公司研发的“反电信诈骗数据平台”,有被标记骚扰诈骗电话4亿多条。咪咕动漫公司副总经理向黎生表示:“我们有一个大数据库,有6000万的用户,有高危人群的号库,各种黑名单,通过他们之间的呼叫和关联做自动匹配和自动筛选,人工的全网10086的客服几十万人接到的投诉数据也可以实时录入,这样就保证了它可以得到实现。”

大数据,同样在手机软件中发挥作用。随着苹果系统升级,一批手机软件获得iOS安全权限,软件的防诈骗骚扰功能,已经可以在安卓和苹果系统都发挥作用,当用户拨打或接听骚扰诈骗电话时,相关软件就会提示。

骚扰拦截,是腾讯手机管家的主要功能之一。今年上半年,帮助用户提示了3.23亿次骚扰电话,其中包括0.9亿次诈骗电话,占比27.37%。用户在软件上标记,是手机软件数据的重要来源。腾讯手机管家安全专家陆兆华表示,当用户接到一个电话,如果说这个电话是骚扰,或者是诈骗,用户就会做标记。

包括腾讯旗下的QQ、微信、腾讯游戏在内,一切和电话号码相关的平台,都能做数据分析。

陆兆华表示,腾讯内部的大数据,不仅仅是手机管家的数据,还包括跟电话号码相关业务方面的数据,把这些来源的数据整合之后,会用手机管家的大数据后台,做数据上的训练、建模和挖掘,最后得出整个诈骗电话的库。

记者向腾讯手机管家、百度手机卫士、360手机卫士三家索取软件装机量的数据,显示在6亿到9亿之间,可以说,海量用户给手机软件提供了宝贵的数据。除此之外,警方、银行以及其他互联网公司,也为软件大数据提供来源。360手机卫士安全专家葛健表示:“一方面标注,一方面还有共享。比如我们会跟58、淘宝这种企业(合作),他们可能会有一些诈骗来源也会和我们共享,还有移动运营商、公安等,他们把涉嫌违法的号码给我们提供。”

没想到,平时听起来“高大上”的大数据,就在手机里有这么多的应用。大数据如何甄别诈骗电话?运营商和手机软件的服务,又有什么不同?

骚扰诈骗电话,有一定的特征。中国移动下属的咪咕动漫公司技术人员介绍,通过对通话模型的比对,就能把涉骗号码揪出来。一般来讲,呼叫时间短、呼叫频次集中、来电号段是170、171、境外来电、改号来电都是被特别监控的。“从海量的通话记录里把疑似号码找出来。我们建了一个疑似号码的通话模型,这个模型包括他的通话频次,拨打对象,离散度,拨打的时长,来话是不是国际来话,一些号段,这个模型把它的特征都包括进去了。”

通过这样的数据分析,也能把误标记、恶意标记筛选出来。当然,大数据目前并不是百分之百能识别诈骗电话,在一项统计中,手机软件对于骚扰诈骗电话的识别率能达到90%以上,但对于骗子新使用的号码,尚无法识别。腾讯手机管家安全专家陆兆华介绍,现在的骗子会不断拿一些新的号码去诈骗,新的诈骗号码,必然需要有一些行为,才能分析出来,漏的主要是很新的一些号码。

对比内蒙古的“诈骗电话预警系统”和手机软件厂商,运营商和手机软件,都能提示骚扰诈骗电话,数据也可以共享,在准确性和提示的功能方面有重合。在内蒙古,这套移动的提醒系统已经跟警方深度合作。内蒙古公安厅反诈骗中心工作人员介绍,把设备和功能放在运营商那,在最前端进行防范和预警,最终会把结果反馈给公安机关,后面会把相关的东西反馈给公安机关,公安机关在做更深层次的工作。

而腾讯公司也已和公安部合作,推出“鹰眼系统”,在部分地区已经使电信诈骗的发案率大幅下降。

运营商提供的这项服务仍和手机软件有区别,中国移动的“彩印提醒”服务,能够帮助非智能手机用户识别诈骗骚扰电话。向黎生表示:“信息我们是免费的,不用安装App,也不收流量费。可以跨终端,跨网络,这是我们的特点。”

中国移动提供的这项服务针对11个试点地区,还要不少没有覆盖。手机软件虽然需要下载客户端,但没有地区限制。手机软件除了能拦截电话,还能拦截短信等。360手机卫士安全专家葛健称,除了电话还有短信防护,现在会有一些伪基站的诈骗,冒充该一些运营商或者银行,比如10086或95588,发送一些带有钓鱼网址的短信,比如积分兑换,这是诈骗短信。还有伪基站发的骚扰垃圾短信,办发票这种。“对于这种伪基站的拦截是有专门的防护,我们的识别量也很高。”

在提醒界面上,手机软件在客户端进行统一的提示,而移动的彩印提醒在各地区都不同,提示的方式有信息提示和通话界面提示,提示的时间也有所不同。

既然都是预防电信诈骗的大数据技术,是否运营商和互联网公司能够联手,互补?实际上,双方数据的共享和合作已经展开。但各地方移动公司目前是分兵作战,各自试点,而几个手机软件巨头之间也存在竞争。全国目前没有统一推行的手机端反诈骗服务,也没有相关的行业标准。当然,在现阶段下,竞争并不是坏事。内蒙古移动信息安全管理部总经理孙卫国认为,预防电信诈骗这事儿,不管黑猫白猫,抓到老鼠就是好猫。

孙卫国表示没有统一的可能,“可能没有一种方式是对所有用户都能实现的,而且必须竞争,看哪种方式最好。”


本文作者:佚名
来源:51CTO
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 分布式计算 Hadoop
从“笨重大象”到“敏捷火花”:Hadoop与Spark的大数据技术进化之路
从“笨重大象”到“敏捷火花”:Hadoop与Spark的大数据技术进化之路
164 79
|
17天前
|
数据采集 分布式计算 数据可视化
大数据项目成功的秘诀——不只是技术,更是方法论!
大数据项目成功的秘诀——不只是技术,更是方法论!
58 8
大数据项目成功的秘诀——不只是技术,更是方法论!
|
10天前
|
存储 搜索推荐 算法
大数据在电子健康记录中的潜力与挑战:一次技术和伦理的深度碰撞
大数据在电子健康记录中的潜力与挑战:一次技术和伦理的深度碰撞
49 12
|
1月前
|
安全 大数据 虚拟化
随着云计算和大数据技术的发展,Hyper-V在虚拟化领域的地位日益凸显
随着云计算和大数据技术的发展,Hyper-V在虚拟化领域的地位日益凸显。作为Windows Server的核心组件,Hyper-V具备卓越的技术性能,支持高可用性、动态迁移等功能,确保虚拟机稳定高效运行。它与Windows深度集成,管理便捷,支持远程管理和自动化部署,降低管理成本。内置防火墙、RBAC等安全功能,提供全方位安全保障。作为内置组件,Hyper-V无需额外购买软件,降低成本。其广泛的生态系统支持和持续增长的市场需求,使其成为企业虚拟化解决方案的首选。
|
2月前
|
机器学习/深度学习 运维 算法
大数据基础工程技术团队4篇论文入选ICLR,ICDE,WWW
大数据基础工程技术团队4篇论文入选ICLR,ICDE,WWW
|
4月前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
175 2
|
4月前
|
SQL 运维 大数据
轻量级的大数据处理技术
现代大数据应用架构中,数据中心作为核心,连接数据源与应用,承担着数据处理与服务的重要角色。然而,随着数据量的激增,数据中心面临运维复杂、体系封闭及应用间耦合性高等挑战。为缓解这些问题,一种轻量级的解决方案——esProc SPL应运而生。esProc SPL通过集成性、开放性、高性能、数据路由和敏捷性等特性,有效解决了现有架构的不足,实现了灵活高效的数据处理,特别适用于应用端的前置计算,降低了整体成本和复杂度。
|
5月前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
334 4
|
5月前
|
机器学习/深度学习 存储 大数据
云计算与大数据技术的融合应用
云计算与大数据技术的融合应用
|
5月前
|
SQL 存储 大数据
单机顶集群的大数据技术来了
大数据时代,分布式数仓如MPP成为热门技术,但其高昂的成本让人望而却步。对于多数任务,数据量并未达到PB级,单体数据库即可胜任。然而,由于SQL语法的局限性和计算任务的复杂性,分布式解决方案显得更为必要。esProc SPL作为一种开源轻量级计算引擎,通过高效的算法和存储机制,实现了单机性能超越集群的效果,为低成本、高效能的数据处理提供了新选择。

热门文章

最新文章