不需神化大数据,更不必妖魔化!

简介:

近日,一篇题为《 15家数据公司被调查,数据行业面临大清洗? 》的微信文章刷爆朋友圈,短短几日,平均阅读1w+的公众号“一本财经”打造出一款10w+的爆文;从该文评论也可以看出大众的不忿和担忧,不知从什么时候开始,我们很难想象“大数据”这个充满科技感的名词会触及到我们的个人隐私。在大数据时代,我们真的还有隐私可言吗?

试想一个场景;“当你在网上购物的时候,你的信息已经悄然地被存储起来、当你在微信里刷朋友圈的时候,你的活动已经被跟踪、当你敲击电脑键盘的时候,电脑程序记录下你的键盘操控过程、当你走在大街上的时候,有无数监控摄像头正冷冷地盯着你....”我们可以想的更加大胆一些;当你一直不清在酒酣耳热之后讲的那些愚蠢的话,转眼间就会在网络上被人疯传。我的天啊!!!如果这一天真的来到,我恐怕只能安慰自己说“你的隐私只剩零了,想开点吧。”

难道“大数据”就真的这么恐怖?我不否认现在很多大数据公司,披着大数据的外衣,干着倒卖个人信息的勾当。“在2016年8月,山东考生徐玉玉遭遇电信诈骗,9900元学费被骗走后不幸离世、2017年2月16日,信息贩子公然叫嚣,只要一个手机号码就能查到最私密的个人信息,且范围覆盖全国。”这类现象比比皆是,社会舆论直指个人信息泄露。

当社会对大数据公司开始慢慢地妖魔化,我想这未免对这个大数据行业有了很深的误解。社会大众可能并不知道大数据公司到底在做什么?上面提到的隐私泄露、黑市交易等现象都不是真正意义上的大数据公司。

大数据公司究竟在做什么?

对于“大数据”,研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。维基百科的定义,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。简单来说,大数据具有4个特点特点:大量、高速、多样、价值。

可能抽象的定义很难去理解大数据,至于大数据公司究竟是干什么的更是没有明确的定义。下面是利用“大数据”去分析的一个小案例。在这一场景下,我们根本不会涉及到个人信息。

这是“一本财经”在黑市内发现的车管所数据,我们一起大胆猜想一下这些数据有哪些用途:保险公司会定时给你推销各种品类的保险;销售公司会判断你大概什么时间要换车了,时间一到,立马会为你推销汽车广告;中介可以将数据卖给征信风控企业等一系列个人信息被泄露的现象。这些是某些大数据公司披着大数据的外衣,干着倒卖个人信息的勾当。这是个别的特例,是整个大数据行业所鄙视的行为。

一家大数据公司真正做的是把车主的信息进行脱敏处理的,我们不需车主的姓名,身份信息,手机号,保险到期时间等关键信息,只通过车辆型号,所有者年龄、性别等信息,利用大数据技术得到车主的整体画像。

如上,我们得出的数据分析报告是某个时间段内自主品牌汽车行业的相关情况,完全不会涉及侵犯个人隐私。我们利用“脱敏后的数据”进行分析,得到的是整个宏观的数据分析结果,这个数据报告将会对汽车厂商的设计、生产、营销推广均有不同程度的指导作用。

通过上面两个图片的对比,我们不难看出,利用大数据做的是一个不断优化的生态系统,大数据的真正价值在于挖掘,也就是洞察数据之间的关联,通过对比、交叉、相关、聚类等等方法,得出可视化的分析结果。基于结果洞察到新的机会点、预测未来趋势,得出一套科学合理的解决方案”。

所以开篇所提到的那15家数据公司所做的“公民隐私信息交易问题”,在整个数据分析中是根本不会涉及的。我们利用大数据想要的是一个宏观的趋势,而不是仅仅局限在个人的隐私上面。我相信在《网络安全法》正式实施之后,数据行业的风气将为之一新,以往在“灰色”领域不具备竞争优势的企业,将会脱颖而出,迎来绝佳的发展机会。

数据安全

“随着物联网的发展,在未来一切东西都会智能化、都在线上,社会上对于数据安全的呼声越来越高,需求也是越来越强烈。”今年5月,新型“蠕虫”式勒索病毒席卷全球,网络安全已成为政府部门、企业机构、社会大众共同关注的热点话题。27日,“大数据网络应用安全技术高峰论坛”在贵阳国际生态会议中心举行。业界专家大咖汇聚一堂,聚焦大数据基础系统,为营造安全和谐的网络环境建言献策。

6月1日,《中华人民共和国网络安全法》的正式实施,成为我国网络空间法治建设的重要里程碑,在确立安全在整个信息系统建设中的核心和关键地位的同时,对保护公众个人信息安全也起到积极作用。

由此可见,不管是从国家层面,还是个人层面,数据安全问题都是发展的核心问题。在风起云涌的大数据时代,我们每个人都很难做到独善其身,在推动数据应用时所面临的风险与挑战,需要国家和企业一起努力。

大数据浪潮势不可挡

数据已成为国家基础性战略资源和商业创新源泉,深化大数据应用成为世界各国和产业界的一致选择。全球数据规模持续迅猛增长,数据被认为是新时代基础生活资料与市场生产要素,成为了全球“互联网+”变革浪潮下的基础“能源”,战略价值不亚于工业社会的石油。

工信部发布的《中国大数据发展调查报告(2017年)》中显示,2016年中国大数据市场整体规模为168.0亿元,较2015年增速达45%,预计2017-2020年增速将保持在30%以上,意味着在未来3年,我国大数据市场的整体规模将来到500亿。

同样在报告的调查中显示,59.2%的受访企业已成立数据分析相关部门,35.1%的企业已经应用了大数据,大数据应用得到进一步普及;目前大数据应用最为广泛的三个领域分别为营销分析、客户分析和内部运营管理。

目前,我国大数据市场的供给结构已经初步形成,大数据创新应用深入经济社会各领域。大数据成为服务经济社会民生的重要支撑和引领产业转型升级的核心力量。在广大现有和新兴细分市场中,大数据市场融合技术与服务,正形成迅猛的发展势头。未来几年大数据市场仍将呈现强劲的增长,风头势不可挡。

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
存储 Oracle 大数据
带你读《数据资产》第二章数据资产的相关概念2.4 大数据时代的到来和兴起(一)
带你读《数据资产》第二章数据资产的相关概念2.4 大数据时代的到来和兴起(一)
|
数据可视化 大数据 数据管理
带你读《数据资产》第二章数据资产的相关概念2.4 大数据时代的到来和兴起(一)
带你读《数据资产》第二章数据资产的相关概念2.4 大数据时代的到来和兴起
|
存储 安全 网络协议
大数据正在从根本上改变文件传输安全
大数据如今正在改变文件传输技术的性质。大数据既带来了新的挑战,也创造了新的机遇。
|
大数据 架构师 网络架构
构建大数据网络 需要重视这五个地方
在人们考虑大数据时,人们留意到了“大”这一个字,可是在投建基础架构时,人们还应当留意“分布式”。 实际上,大数据的应用程序需要处理大量信息,并且在出自弹性的考虑将数据拷贝到多个部位时,信息的规模变得越来越大。
1137 0