自拍有风险!大数据在用什么姿势“出卖”你?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:
  史上最昂贵的 自拍 照,诞生于2007年。两名美国大兵在伊拉克的军营中玩自拍并且传到了社交网络上。结果几天之后,这个秘密的驻扎地就遭到了恐怖分子火箭弹的袭击。四架“阿帕奇”直升机惨遭“爆菊”,两亿美金灰飞烟灭。美军情报部门“百思不得姐”,最后才发现:原来是大兵的自拍照中附带了经纬度信息,让“好友”轻易掌握了他们的位置。

而就在几个月前,某ISIS成员在其“总部大楼”自拍,并且在社交网络上大肆吹嘘这里的指挥能力有多么“炸裂”。结果一语成谶,22小时之后,这幢大楼就被美军三枚导弹“强拆”了,“炸裂”得粉身碎骨。

自拍有风险!大数据在用什么姿势“出卖”你?

【恐怖分子也是自拍爱好者(图文无关)】

虽然这张照片没有直接透露出经纬度信息,不过根据美军361号情报小组对照片“元数据”的分析,结合所掌握的大数据,很快就定位到了这个建筑。正所谓君子报仇,“八”年不晚。(只是这些恐怖分子已经不是当年的那拨了)

美军“自拍战”的故事告诉我们,照片能够泄露的信息,远比你想象得要多。只要采取正确的姿势“拷问”大数据,它什么都会交代。所以,每小时发10张自拍到各种社交媒体的妹子们,祝你们安全。

然而,这里不是动不动就抽刀拔枪的中东。在安定团结的天朝,你的大数据究竟被怎么玩呢?

万能的电信运营商

你站在空无一人的公交站台上,百无聊赖地抬头看到电子广告牌,那是一款志玲姐姐代言的内衣。你决定掏出手机。此刻,你将要为大数据做出贡献了。

  • 如果你开始在网页上搜索内衣的品牌,那么运营商会把这个动作记录在案,告诉广告主:有人对你的产品感兴趣。


  • 如果你进一步进入了品牌官网,甚至开始查看内衣型号,那么这个动作也将被记录,广告主会得知:有生意要上门了!


  • 如果你凝视广告牌许久,然后在搜索框中默默输入:“志玲姐姐 胸”,那么,广告主会得知:死宅男,浪费老子广告费!

这是联通公司凭借其运营商的特别地位提供的户外媒体指数。当然以上的信息都会以指数的形式呈现,除了联通公司,并没有人掌握你和搜索动作的对应关系。

当然,联通可以获得的信息还远不止搜索行为这一项。甚至你是否去了内衣专卖店,是否拨打了品牌的服务电话,都会被汇总,以指数或者报告的形式反映出来。

自拍有风险!大数据在用什么姿势“出卖”你?

【此处应有林志玲】

同样,联通旗下还有“投资指数”,通过侦测某App在各个手机上的活跃度,来给投资机构判断这个App是否值得投资。另外,还有“旅游指数”,可以判断每一个进入景区的游客用的是多少钱的话费套餐、属于高富帅还是屌丝、平常喜欢在网上买什么,从而判断这些游客消费能力如何,给旅游局等部门提供参考。(相信黑导游一定喜欢这样的数据)

这样的指数还有很多很多,几乎你和手机有关的一切行为都会成为大数据的一部分。而且建立在中国庞大的人口基数之上的,是庞大的手机数量和基站数量。各大运营商的基站都配有太阳能板,如果把这些太阳能板接受日光强度的变化进行汇总,加上各大基站都会配备的温度湿度传感器反馈的信息,最了解中国气象全局的就不是中央气象局了,而是电信运营商。

有了运营商的大数据版“天气预报”,原来提前三天才能预测的雾霾,现在提前十天就可以预测啦!这样,帝都的小伙伴们就可以——提前做好受难的心理准备了。。。

自拍有风险!大数据在用什么姿势“出卖”你?

【蔡元培像被戴上口罩】

如此说来,中国最精确统计常住人口的机构也许还是运营商,因为昂贵的漫游费逼你要买本地电话卡。而精确地知道居民住址的,也许是教育局,因为为了孩子的安全你一定会把你的真实地址报告给学校。

脚印是最早的“大数据”

你生活的痕迹就是大数据。如果有一种技术可以轻易地记下你的脚印,那么你的爱好、习惯、职业、经济状况、婚姻状况都可以通过你去的地方精确展现出来。只不过问题在于,脚印这种数据非常难以记录。

在BDTC(大数据技术大会)上,阿里巴巴集团CTO王坚做了这样的类比:

大部分大数据都留存在基础设施之上,而互联网和高速公路都是基础设施。在这两者之上记录的数据都是大数据,只不过高速公路上的信息很难沉淀为社会财富,只有破案或者发生车祸的时候才会有人去查看车辙。而互联网有一个天然的优势,就是数据可以低成本地被记录下来。

于是,人在网上的一举一动都可以被记录在案。这些记录在案的数据,一定会以某种形式还原出事件的真相——人们的行为、机器的运行、建筑的状态。从这一点上来看,数据是物理世界在网络空间投射的DNA。

利用数据的“姿势”很重要

曾经有一起金融诈骗案,主犯注册了一家煤炭公司,然后利用自己亲属、朋友的名字注册了诸多金融公司,以煤炭公司的名义和中国神华进行了一些小的业务往来。进而以此为噱头,利用金融公司做担保,向银行骗贷。涉案数亿元。

在整个案件中,主犯的数据、他亲友的数据都是公开可查询的,而却没有一家银行识破这些人的关联关系。关键的问题就在于这些数据是独立分散的,没有一个“柯南”或者“黑猫警长”把这些信息整合起来。

而当年美国航天飞机挑战者号升空爆炸之后,半小时内,和挑战者号关联的四个公司股价都强烈下挫,而三个小时之后,三家公司的股价都企稳,只有一家公司持续下跌,根据后来总统专家委员会调查的研究报告现实,正是这家公司的燃料系统出现问题,才直接导致了灾难的发生。实际上,在这三小时之内,信息已经在投资者圈内流传,而且非常准确。如果当时有一种更加快速的方式传递信息,NASA甚至就可以根据大数据迅速判断航天飞机失事的真实原因。

自拍有风险!大数据在用什么姿势“出卖”你?

【挑战者号爆炸的瞬间,看台上的观众甚至没有明白发生了什么】

而以上两个故事的关键都在于,我们对大数据的处理能力还像小学生一样薄弱。然而,看不懂天书,并不是天书的错。练不成葵花宝典,要从自己身上找原因。大数据就像是土地,你在上面种粮食还是盖房子,得到的收益是不一样的。

说到对于大数据的采集,微软算是先驱。当初微软每年卖掉几亿份拷贝的Windows,却硬是无法知道用户在家究竟是怎么使用这个系统的。于是他们便对用户的鼠标点击数据进行收集,给Windows升级提供依据。这就是最早的“用户体验改善计划”。而同样是收集用户的点击数据,谷歌却做到了知晓用户的性格和爱好,从而实现精准的广告投放,产生了远大于微软的商业价值。

你的数据就是你的“互联网肖像权”

说到大数据最成功的“商业运用”,莫过于如鬼魅一般的骚扰电话了。向妈妈推荐母婴用品,向房主推荐抵押贷款,向赌徒推荐澳门博彩,向色狼推荐特殊服务。在不胜其烦的同时,也不得不佩服其定位的精准。

相比倒卖个人信息的“黑色产业”,电信运营商合法取得你的通话、浏览、位置等数据,也让很多人感觉胆战心惊。专门研究大数据的律师王新锐说:“从商业上来讲,越是隐私的数据价值就越大。”

那么问题来了,在隐私和服务之间,究竟法律的界限如何划分呢?

王新锐告诉雷锋网(公众号:雷锋网)

根据法律,判断数据的收集是否合法,很重要的一点就是看数据有没有被转移。如果运营商直接把个人的大数据提供给第三方,就侵犯了个人隐私。如果跟第三方合作,由运营商根据他人的要求自己做查询判断,或者做抽象的总结,则是可以的。

形象来说,个人的数据就像互联网版的肖像权,财产权,人格权一样,权利属于个人,但是从众多数据中升华判断出的新价值,就属于服务提供商了。而服务提供商把数据放在黑箱里(脱敏)再和第三方进行交付,则是它的权利。

这就像新闻镜头一样,如果镜头里只展现了两个人:你拉着别人的女朋友,那么这个镜头无疑侵犯了你的隐私,如果此刻将镜头拉远,包含了无数路人,也包含了你们俩,也许还包含了跟踪已久正在远处磨刀霍霍的你的正牌女友,所有的人都是模糊不清的。这个时候大数据则并不侵犯你的隐私,只是总结道:此处有杀气。

自拍有风险!大数据在用什么姿势“出卖”你?

BDTC 中国大数据技术大会(Big Data Technology Conference,BDTC)是目前国内最具影响、规模最大的大数据领域的技术盛会。  
   
   
 
  本文作者: 史中

本文转自雷锋网禁止二次转载, 原文链接
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
机器学习/深度学习 大数据
机器学习lgb全国大数据创新应用大赛用户贷款风险预测 完整代码数据 可直接运行
机器学习lgb全国大数据创新应用大赛用户贷款风险预测 完整代码数据 可直接运行
156 0
|
存储 监控 安全
5最糟糕的大数据隐私风险(以及如何防范)
5最糟糕的大数据隐私风险(以及如何防范)
|
存储 安全 算法
大数据蕴含“高风险”:市场需要何种企业级协作平台
大数据蕴含“高风险”:市场需要何种企业级协作平台
220 0
大数据蕴含“高风险”:市场需要何种企业级协作平台
|
安全 数据中心 分布式计算
如何有效降低大数据平台安全风险
在2019杭州云栖大会大数据企业级服务专场,由阿里云智能计算平台事业部资深技术专家李雪峰带来以“如何有效降低大数据平台安全风险”为题的演讲。本文首先概括了企业在大数据上云过程中会产生的安全顾虑。接着,在大数据平台中要处理的安全风险中,对数据中心物理安全与网络安全、大数据平台系统安全以及数据应用安全三部分做了详细的介绍。最后,描述了阿里云飞天大数据平台的安全体系。
13784 1
如何有效降低大数据平台安全风险
|
Web App开发 安全 大数据