大数据时代,没人知道哪些数据会成为重点

简介:

相信很多智能手机用户不太明白,为什么我只是想下载个手电筒应用而已,这个应用为什么要看我装了其他什么应用,我现在位置是哪里,我通讯录里有什么人,相册里有什么照片?而且还要求打电话和发短信的权限,要知道这些权限我女朋友都没有好不好!

一个手电筒应用的要求比女朋友还多,是不是太过分了?我们都知道,在其位不谋其政的人基本上都不是好家伙,一个手电筒应用想看我的位置通讯录照片,目的肯定也不是识别谁是女朋友,然后将屏幕亮成爱你的形状然后彩信发给女朋友逗她开心。

新华网的记者做了一次小测试:他手上的一款 Android 手机上有 61 款应用,所有的应用都有 “读取已安装应用列表” 权限,由此可以了解用户的行为习惯及分析同行情况;第二受关注的权限就是 “读取本机识别码”,这是用于确定用户,因为每个手机识别码都是独一无二的;第三则是 “读取位置信息” 权限,以此可搜集用户的活动范围。

以名声在外的百度全家桶为例,百度新闻默认获取存储、位置、电话、相机、短信、通讯录、麦克风这 7 项权限,但是这个看新闻的应用完全用不着相机和电话的权限。而百度网盘似乎对读取已安装应用列表有着近乎疯狂的执念:爱范儿(微信号:ifanr)评测用的某新机才装上百度网盘才三天,它就尝试访问该权限 200 多次。

从事互联网安全的 GeekPwn Lab 刚刚发布的《App 个人隐私研究报告》显示,超功能范围申请、收集、上传用户信息仍是目前手机应用存在的普遍现象。

比如 GeekPwn Lab 研究发现,近 70% 的应用申请获取短信权限,但是只有 30% 出头的应用真正用到了短信权限。他们对一款提供驾考汽车信息的应用代码进行了深入分析,发现该应用申请并调用了 “读取通话记录” 的权限,并直接将该信息上传至厂商服务器。

对此,一位匿名业内认识这么说互联网厂商滥用权限的问题:

搜集的数据多一点,营销价值就会提升很多。大数据时代,没人知道哪些数据会成为重点,足够多的数据才是重点。

拿大量用户数据卖钱,拿更精准的用户数据卖定位更准的广告,总之用户的信息就是变现的金矿,越隐私的信息价值可能就越高。

当然,除了疯狂的要权限和访问权限之外,一些应用植入恶意代码、后台下载、偷跑流量、对齐唤醒早已经是智能手机生态中的毒瘤。

在《自动驾驶汽车和隐私的终结》一文中,我们谈到,在一个到处都是摄像头的世界里,数据追踪完全是离线的。从你出门那一刻开始,你所有的行动都被打上时间戳、进行定位、添加到你的电子简介并记录进数据库。你无法默认选“否”。

事实上,无论是为了推动技术进步,我们被动地放弃个人信息隐私也好,还是互联网厂商为了利益私下倒卖我们的隐私信息也好,个人隐私的保护战一直在持续攻防,但仍是呈现节节败退之势。





 


  

本文转自d1net(转载)


相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
47 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
2月前
|
分布式计算 关系型数据库 MySQL
MaxCompute问题之数据归属分区如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
35 0
|
3月前
|
机器学习/深度学习 存储 分布式计算
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
|
2月前
|
分布式计算 DataWorks BI
MaxCompute数据问题之运行报错如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 1
|
4月前
|
存储 SQL 大数据
dataCompare大数据对比之异源数据对比
dataCompare大数据对比之异源数据对比
109 0
|
2月前
|
分布式计算 关系型数据库 数据库连接
MaxCompute数据问题之数据迁移如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
35 0
|
2月前
|
分布式计算 Cloud Native MaxCompute
MaxCompute数据问题之没有访问权限如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
10天前
|
数据采集 搜索推荐 大数据
大数据中的人为数据
【4月更文挑战第11天】人为数据,源于人类活动,如在线行为和社交互动,是大数据的关键部分,用于理解人类行为、预测趋势和策略制定。数据具多样性、实时性和动态性,广泛应用于市场营销和社交媒体分析。然而,数据真实性、用户隐私和处理复杂性构成挑战。解决策略包括数据质量控制、采用先进技术、强化数据安全和培养专业人才,以充分发挥其潜力。
13 3
|
12天前
|
运维 供应链 大数据
数据之势丨从“看数”到“用数”,百年制造企业用大数据实现“降本增效”
目前,松下中国旗下的64家法人公司已经有21家加入了新的IT架构中,为松下集团在中国及东北亚地区节约了超过30%的总成本,减少了近50%的交付时间,同时,大幅降低了系统的故障率。