网络诈骗是大数据的“原罪”吗?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

大数据时代刚刚来临,本应造福人类的大数据技术却被诈骗分子利用,屡屡成为诈骗利器。山东临沂学生徐玉玉事件让网络诈骗浮出水面,成为新闻热点;清华大学教师被骗1760万元,则说明无论年龄老少、学历高低,都有可能成为网络诈骗的受害者。诈骗分子利用大数据按“数”索骥,实现了对受害人的精准诈骗。于是,不少人将罪恶归之于大数据技术,认为隐私泄漏、网络诈骗是大数据的“原罪”。网络诈骗是大数据的“原罪”吗?我们又该如何让大数据成为造福人类、防止诈骗的利器呢?

大数据时代,犯罪分子通过挖掘网上公开数据和购买黑市数据,预先对诈骗对象进行数据分析,以实行精准诈骗

首先我们必须了解,诈骗者究竟是如何利用大数据实现精准诈骗的。

数据是大数据时代最重要的资源,也是构成大数据的基础。诈骗者要成功实现诈骗,第一步就必须拥有数据资源,必须解决数据源的问题。诈骗者的数据来自哪里呢?无非两条路径,要么利用网上公开数据,要么购买黑市数据。

一条途径是挖掘网上公开数据。大数据时代的各种智能系统能够自动记录、采集、存储、处理和传输各种数据,我们的一举一动都被记录在案,例如照片视频、行动路径、上网足迹、聊天记录、文字档案等等,一切所思所想所为都变成了数据,各种数据汇聚网络,积聚为海量的大数据。我们在不知不觉的情况下留下了一条几乎不间断的数据足迹,更为重要的是这种数据足迹还存于网络,永不消逝。他人只要有心掌握我们的行踪,只要循着数据足迹,我们的一切就了如指掌。诈骗者有些信息就是利用网上的这类公开数据,只要对这些网上数据进行汇聚和挖掘,他们就可以找到许多所需要的数据。

另一条更重要的途径是购买黑市数据。大数据时代虽然时时处处产生数据,但这些数据往往被少量部门垄断,作为数据生产者的个人并不拥有自己的数据。特别是一些重要数据往往被政府部门、个别公司所掌控。例如移动、联通、电信三大公司垄断了电话语音和短信数据,教育部门垄断了学生数据,医院掌握了医疗数据,腾讯掌控了社交数据,淘宝、京东掌控了各类商业数据。这些数据被少量部门掌控,本来应该是比较安全的,但是,因为这些数据蕴含大量信息,存在权力寻租的空间,于是被部门内部人员非法售卖,大量蕴含个人信息的数据被流入黑市,因此诈骗者通过购买黑市数据轻松掌握了大量的个人信息。

诈骗者找到个人信息大数据后,必须进行数据挖掘,比如分类、筛选、聚集等,从中挖掘出诈骗对象。网上公开数据虽然蕴藏着丰富的个人信息,但信息不太集中,挖掘难度较大,对于文化程度不高的诈骗者来说,利用具有一定的难度。但是,部门垄断信息比起网上公开数据来说,信息更加集中,具有更大的针对性和精准性,诈骗者不需要掌握高深的数据挖掘技术,只要进行简单分类、聚集,就可以进行精准诈骗。更可怕的是,如果将内部的部门数据与公开的网上数据相结合,则可以对诈骗对象进行更加全面的分析、掌控,被诈骗者则成了透明的裸奔者。因此,在大数据时代,犯罪分子如果要对一般群众(特别是学生、老年人等)实行诈骗,早已经对诈骗对象进行了数据分析,以便实行精准诈骗。

数据的公开、共享、透明,是大数据的基本精神;问题是我们尚未做好准备,世界却已透明

既然大数据时代的许多数据都是公开透明,为什么诈骗者已经瞄准了自己,而我们却浑然不知,乖乖成为诈骗者的猎物呢?简单说来,在刚刚到来的大数据时代,我们为什么这么容易被骗呢?我们是如何上当受骗的?

首先,我们的一切信息都几乎存于网络空间,成了公开透明的信息,因此容易被骗。大数据技术已经把我们的一切都变成了数据,无论我们愿意与否,也不管我们是否知晓,这些数据都永久存储于网络云端。我们的一举一动其实都透露了自己的信息,大数据时代成了没有隐私的时代,一切都被暴露于光天化日之下,我们成了裸奔者。当然,数据的公开、共享、透明,是大数据的基本精神。如果一切都藏而不显,则不可能形成大数据,更不可能进入大数据时代,因此数据公开透明并不是大数据时代的错误,更不是大数据技术的原罪。但我们尚未做好准备,世界却已透明,我们就容易成为诈骗者的猎物,成为大数据时代的牺牲品。

其次,许多关键数据无奈被他人记录和转卖,因此容易被骗。我们经常被要求填写各种表格,其中有不少重要信息,比如姓名、身份证、手机号、银行卡号、家庭住址、家庭成员等等。这些重要数据本来因特殊用途而被少数部门采集和拥有,被采集者也没曾想这些数据会被用做他途,因此被采集者往往懵然不知自己的重要数据已经被他人掌握。拥有数据的少量部门日积月累拥有了大数据,其间有时是因为管理不当而外泄,有时是少数人为了个人利益暗中出售数据,于是诈骗者就轻松掌握了信息更加集中、更加重要的个人数据。诈骗者只要简单挑选就可以精准定位诈骗对象。

再次,数据单向透明,信息不对称,因此容易上当受骗。在大数据时代,我们每个人都时时刻刻在生产着数据,但这些数据并不被数据生产者所拥有和支配,而是被某些部门所垄断,并形成各种数据孤岛,对我们自己来说是一个个数据黑箱。但是,骗子们却通过数据挖掘或黑市购买,拥有了海量的个人数据,并细心研究揣摩,所需数据一应俱全。数据的单向透明现象就像单向透视玻璃,我们看不到骗子,而骗子却清清楚楚地能看见我们,因此我们往往已进入各种骗局而浑然不知。

最后,从数据能力来看,我们也因能力不对称而处于劣势,因而容易上当受骗。在大数据时代,数据成了一种新资源,其中蕴含着无尽的价值。然而,面对数据宝藏,不同的人由于挖掘能力不同,数据的价值也就不同。例如,我们普通人面对各种个人数据,并不能变为金钱,然而骗子们却看出了其中的机会。这种数据认知和挖掘的能力,我们可称之为数据能力。从数据能力来看,由于刚刚迈入大数据时代,人们还停留在原处,尚未具备数据能力,因此不但没有用数据识别各类骗局,甚至无法保护自己的数据。但是,骗子们早就曾利用传统小数据进行过各种骗局,进入大数据时代后则更加如鱼得水,而且骗子们往往以集群方式,整村、整乡甚至整县,全部从事一种诈骗活动,相互传授经验,实现数据共享,于是数据能力突飞猛进。由此可见,民众与骗子的数据能力完全不对等,民众处于劣势,上当受骗在所难免。

面对大数据洪流,我们的思维不能停留在小数据时代,把一切都封闭了事;而应抓紧数据立法、提高数据能力,利用大数据技术实现对犯罪分子的精准打击

那么,在这大数据时代里,我们应该采取哪些措施来治理网络诈骗呢?我们又该怎样反其道而行之,将大数据变为治理网络诈骗的利器呢?笔者认为,主要有以下四条途径。

抓紧数据立法。我们的时代虽然已经开始迈入大数据时代,然而我们的立法却总是滞后一步,仍然停留在小数据时代。面对滚滚的大数据洪流,数据立法成了迫在眉睫的大事。如何立法呢?如果完全按照小数据时代的思维,把一切都封闭了事,那肯定行不通。根据大数据时代的特点,不同的数据类别应该有不同的法律应对。对网络公共数据,如果完全禁止挖掘、使用,那就与大数据的时代精神相背离,应该允许挖掘、使用,但数据使用者必须承担相应责任,谁挖掘使用谁负责,政府应立法规范使用者,并负责追责、惩戒。对被少数部门掌握的专有数据,国家立法应该强调收集、储存者的责任,即谁收集存储,谁承担相应的保护责任,一旦泄露则一追到底。因此,专有数据应该强调数据源头的责任,当然也同样要追究挖掘使用者的责任。

实现双向透明。数据的单向透明让我们处于不利地位,要防止上当受骗,就必须实现数据双向透明,做到信息完全对称。为此,我们可以通过严格实名制、消灭数据孤岛、提高数据能力来实现。作为大众的我们,基本上实现了处处实名,然而目前尚有部分手机号段尚未实名,银行开户也有逃避实名的,这样公安机关对诈骗者就无法掌握其数据足迹,诈骗者就没有在阳光下透明,因此一旦案发就无法追查。如果严格实名制,诈骗者就暴露在阳光下,他们的一切行为就可以处于监控之下。目前大数据库分属不同部门,形成数据孤岛,这对公安等部门跟踪、打击诈骗者很不利。要实现连续跟踪、轨迹不断,就必须消灭数据孤岛,实现开放、共享、透明。

提高数据能力。数据能力应该成为大数据时代人们必备的基本能力。虽然我们不可能人人都成为数据挖掘专家,但应该转变数据意识,提高基本的数据能力。首先应该树立数据资源意识,因为在大数据时代,万物皆变成数据,而任何数据皆有其价值,都是资源,因此应该重视数据资源。其次应该树立数据保护意识,因为数据成为资源之后,就有许多眼睛盯着我们留下的数据轨迹,因此我们应该有数据保护意识,能不留痕迹的地方尽量不留,能不上网的信息尽量不上传网络。最后要提高数据甄别意识,对陌生短信、电话、微信等信息保持高度警惕,不贪图便宜,不害怕敲诈恐吓,对各种信息小心甄别。

打击数据犯罪。公安机关应该提高数据挖掘、处理能力,对各种诈骗行为实行智能跟踪、警报,一旦发现异常,立即启动相关措施。应建立反诈骗数据库,对有过诈骗行为的人员进行跟踪监控。网警应该把反诈骗列入自己的工作议程。一般警察机关也应该提高数据意识和数据能力。一旦发生诈骗案例,公安机关应能够根据诈骗者的数据轨迹,利用大数据工具进行跟踪、挖掘,实行精准打击,并坚决打击数据买卖行为。如此,我们就能利用大数据技术,让一切犯罪行为变成公开透明、无处可藏,让大数据技术从诈骗者的工具变成诈骗者的克星。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
网络协议 大数据 数据挖掘
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)
|
2月前
|
分布式计算 运维 API
针对MaxCompute经典网络域名下线,Dataphin应对策略的公告
针对MaxCompute经典网络域名下线,Dataphin应对策略的公告
295 7
|
5月前
|
大数据 RDMA
神龙大数据加速引擎MRACC问题之MRACC-Spark利用eRDMA近网络优化插件来提升性能如何解决
神龙大数据加速引擎MRACC问题之MRACC-Spark利用eRDMA近网络优化插件来提升性能如何解决
57 0
|
7月前
|
分布式计算 NoSQL 大数据
MaxCompute产品使用合集之自定义udf连接云上vpc网络的redis获取数据的步骤是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
数据可视化 大数据 数据挖掘
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)
|
8月前
|
分布式计算 DataWorks NoSQL
MaxCompute资源问题之网络不通如何解决
DataWorks数据集是指在阿里云DataWorks平台内创建、管理的数据集合;本合集将介绍DataWorks数据集的创建和使用方法,以及常见的配置问题和解决方法。
|
8月前
|
分布式计算 网络协议 Hadoop
大数据成长之路------hadoop集群的部署 配置系统网络(静态) 新增集群(三台)
大数据成长之路------hadoop集群的部署 配置系统网络(静态) 新增集群(三台)
106 0
|
2月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
518 7
|
2月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
65 2
|
9天前
|
分布式计算 Shell MaxCompute
odps测试表及大量数据构建测试
odps测试表及大量数据构建测试