《位置大数据隐私管理》—— 第1章 位置信息与隐私保护 1.1 位置大数据

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 移动通信和传感设备等位置感知技术的发展将人和事物的地理位置数据化。移动对象的传感芯片以直接或间接的方式收集移动对象的位置数据,其自动采集位置信息的速度和规模远远超过现有系统的处理能力。据统计,每个移动对象平均15 s提交一次当前位置,这样算来,全球上亿手机、车载导航设备等移动对象每秒提交的位置信息将超过一亿条[3]。

本节书摘来自华章出版社《位置大数据隐私管理》一 书中的第1章,第1.1节,作者潘晓、霍 峥、孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第1章 位置信息与隐私保护

1.1 位置大数据

     移动通信和传感设备等位置感知技术的发展将人和事物的地理位置数据化。移动对象的传感芯片以直接或间接的方式收集移动对象的位置数据,其自动采集位置信息的速度和规模远远超过现有系统的处理能力。据统计,每个移动对象平均15 s提交一次当前位置,这样算来,全球上亿手机、车载导航设备等移动对象每秒提交的位置信息将超过一亿条[3]。未来移动传感设备的进步和通信技术的提升将使位置信息的产生更频繁。这类具有规模大、产生速度快、蕴含价值高等特点的位置数据被称为位置大数据[23,24]。位置大数据具有以下4个特征。

  • 数据规模大:数据规模大小决定了数据价值和潜在信息。据统计,Facebook提供的Places功能,每天处理的签到(check-in)信息近200万条,具有位置标签的文本信息约为2 000万条。再如,北京有60 000辆出租车,每辆汽车每10 s进行一次位置更新,每天工作10 h,1天将产生5 GB的位置数据[23]。
  • 产生速
    度快:由于位置“实时”更新,位置数据更新具有数据流的特点。例如,某著名手机的定位服务中,与运动相关的应用记录了用户每天的锻炼数据,包括行走步数、跑步距离等,一天当中的所有行踪无一遗漏被记录。再如,全球最大的社区化交通导航应用程序Waze,通过实时收集用户遇到的警察、事故、交通堵塞等交通道路信息,为用户规划最佳行驶路线。该应用拥有5 000多万用户,其中每天150万用户实时在线。
  • 数据类型多样:位置信息的表现形式包括数字、文本、图片等。具体来说,位置可以以经纬度坐标等数字形式呈现;可能是街道名、城市名、邮编等文本信息;抑或是蕴含于用户在社交媒体网站上发布和共享的照片或视频中。
  • 数据不确定性:位置数据在收集、处理和建模等方面均具有不确定特点。例如,受位置收集精度所限,数据收集之初就是粗粒度位置。有些应用仅要求用户提供所在城市,而无须具体到经纬度。在连续收集用户轨迹过程中,由于中途设备故障或障碍等原因,可能导致部分位置信息缺失。另外,某些位置数据的不确定是由人为错误造成的,如用户在填写与位置相关的信息时,故意给出错误国家或城市。

     位置大数据为人们的生活、企业的运作以及科学研究带来巨大的变革。从个人生活层面上讲,通过推测一个人居住的地点和每天常去的地方,可以为用户提供更便捷的服务。例如,总部位于亚特兰大的AirSage公司每天通过处理来自上百万手机用户的150亿条位置信息,为美国超过100个城市提供实时交通信息。从企业角度来看,位置大数据改变了企业商业运作方式,促进了新型市场的形成与增长。例如,Pyramid Research的调查报告显示,2010年诸如导航或移动社交网络等基于位置的服务已具有28亿美元的市场。据瑞典市场研究公司Berg Insight发布的最新报告,预测全球LBS市场规模到2020年将达到348亿欧元。联合包裹运输公司(UPS)收集自己旗下运输车辆的行驶信息为它们提供最佳行车路线以减少燃油、故障成本,在商业模式上取得了巨大成功。从科学发展的角度看,位置大数据为科学研究提供了新的方法。例如,无线数据科技公司Jana使用大约35亿人口的手机数据试图回答疾病如何传播以及城市如何繁荣这些重大科学问题,该数据来自100多个国家,超过200个无线运营商,覆盖拉丁美洲、非洲、欧洲。
     位置大数据在带给人们巨大收益的同时,也带来了个人信息泄露的危害。位置大数据既直接包含用户的隐私信息,又隐含了用户的个性习惯、健康状况、社会地位等其他敏感信息。位置大数据的不当使用,会给用户各方面的隐私带来严重威胁。例如,某知名移动应用由于不注意保护位置信息,导致根据三角测量方法可以推断出用户的家庭住址等敏感位置,已引发了多起犯罪案件。2014年,iPhone用户隐私泄露事件披露出苹果公司曾私自记录用户每次使用LBS(基于位置的信息服务)应用时的位置信息,从而造成用户的大量位置信息泄露。来自微软的一项调查报告显示,有一半以上的用户担心自己在使用基于位置的服务时泄露自己的隐私。因此,在用户使用LBS应用时,如何保护用户的个人隐私成为一个亟待解决的问题。
     本书给出了传统位置隐私管理中的位置隐私等相关概念,介绍了典型的隐私保护技术,总结归纳了传统位置隐私保护研究中经典的攻击模型和隐私保护模型,并利用一些简单例子说明不同攻击模型的经典保护方法,其中重点讲解了基于数据失真的保护方法(第3~5章)和基于数据加密的方法(第6章)。接下来,本书从需要用到的概念和定义开始阐述。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
存储 机器学习/深度学习 大数据
量子计算与大数据:处理海量信息的新方法
量子计算作为革命性的计算范式,凭借量子比特和量子门的独特优势,展现出在大数据处理中的巨大潜力。本文探讨了量子计算的基本原理、在大数据处理中的应用及面临的挑战与前景,展望了其在金融、医疗和物流等领域的广泛应用。
|
2月前
|
存储 安全 大数据
大数据隐私保护:用户数据的安全之道
【10月更文挑战第31天】在大数据时代,数据的价值日益凸显,但用户隐私保护问题也愈发严峻。本文探讨了大数据隐私保护的重要性、面临的挑战及有效解决方案,旨在为企业和社会提供用户数据安全的指导。通过加强透明度、采用加密技术、实施数据最小化原则、加强访问控制、采用隐私保护技术和提升用户意识,共同推动大数据隐私保护的发展。
|
3月前
|
存储 机器学习/深度学习 大数据
量子计算与大数据:处理海量信息的新方法
【10月更文挑战第31天】量子计算凭借其独特的量子比特和量子门技术,为大数据处理带来了革命性的变革。相比传统计算机,量子计算在计算效率、存储容量及并行处理能力上具有显著优势,能有效应对信息爆炸带来的挑战。本文探讨了量子计算如何通过量子叠加和纠缠等原理,加速数据处理过程,提升计算效率,特别是在金融、医疗和物流等领域中的具体应用案例,同时也指出了量子计算目前面临的挑战及其未来的发展方向。
|
2月前
|
存储 安全 大数据
|
6月前
|
SQL 机器学习/深度学习 分布式计算
MaxCompute产品使用合集之怎么使用SQL查询来获取ODPS中所有的表及字段信息
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
158 7
|
6月前
|
存储 分布式计算 DataWorks
MaxCompute产品使用合集之表被删除重建后如何查到之前的权限信息
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
6月前
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之如何查询MaxCompute项目中的所有表及其字段信息
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
6月前
|
机器学习/深度学习 分布式计算 DataWorks
MaxCompute产品使用合集之使用临时查询创建的表,在表管理和公共表没有找到,是什么原因
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
122 0
|
6月前
|
机器学习/深度学习 分布式计算 大数据
MaxCompute产品使用合集之怎么查看表的时区信息
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
6月前
|
分布式计算 DataWorks NoSQL
MaxCompute产品使用合集之如何操作和管理节点
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
164 0

热门文章

最新文章