《位置大数据隐私管理》—— 第1章 位置信息与隐私保护 1.1 位置大数据

简介: 移动通信和传感设备等位置感知技术的发展将人和事物的地理位置数据化。移动对象的传感芯片以直接或间接的方式收集移动对象的位置数据,其自动采集位置信息的速度和规模远远超过现有系统的处理能力。据统计,每个移动对象平均15 s提交一次当前位置,这样算来,全球上亿手机、车载导航设备等移动对象每秒提交的位置信息将超过一亿条[3]。

本节书摘来自华章出版社《位置大数据隐私管理》一 书中的第1章,第1.1节,作者潘晓、霍 峥、孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第1章 位置信息与隐私保护

1.1 位置大数据

     移动通信和传感设备等位置感知技术的发展将人和事物的地理位置数据化。移动对象的传感芯片以直接或间接的方式收集移动对象的位置数据,其自动采集位置信息的速度和规模远远超过现有系统的处理能力。据统计,每个移动对象平均15 s提交一次当前位置,这样算来,全球上亿手机、车载导航设备等移动对象每秒提交的位置信息将超过一亿条[3]。未来移动传感设备的进步和通信技术的提升将使位置信息的产生更频繁。这类具有规模大、产生速度快、蕴含价值高等特点的位置数据被称为位置大数据[23,24]。位置大数据具有以下4个特征。

  • 数据规模大:数据规模大小决定了数据价值和潜在信息。据统计,Facebook提供的Places功能,每天处理的签到(check-in)信息近200万条,具有位置标签的文本信息约为2 000万条。再如,北京有60 000辆出租车,每辆汽车每10 s进行一次位置更新,每天工作10 h,1天将产生5 GB的位置数据[23]。
  • 产生速
    度快:由于位置“实时”更新,位置数据更新具有数据流的特点。例如,某著名手机的定位服务中,与运动相关的应用记录了用户每天的锻炼数据,包括行走步数、跑步距离等,一天当中的所有行踪无一遗漏被记录。再如,全球最大的社区化交通导航应用程序Waze,通过实时收集用户遇到的警察、事故、交通堵塞等交通道路信息,为用户规划最佳行驶路线。该应用拥有5 000多万用户,其中每天150万用户实时在线。
  • 数据类型多样:位置信息的表现形式包括数字、文本、图片等。具体来说,位置可以以经纬度坐标等数字形式呈现;可能是街道名、城市名、邮编等文本信息;抑或是蕴含于用户在社交媒体网站上发布和共享的照片或视频中。
  • 数据不确定性:位置数据在收集、处理和建模等方面均具有不确定特点。例如,受位置收集精度所限,数据收集之初就是粗粒度位置。有些应用仅要求用户提供所在城市,而无须具体到经纬度。在连续收集用户轨迹过程中,由于中途设备故障或障碍等原因,可能导致部分位置信息缺失。另外,某些位置数据的不确定是由人为错误造成的,如用户在填写与位置相关的信息时,故意给出错误国家或城市。

     位置大数据为人们的生活、企业的运作以及科学研究带来巨大的变革。从个人生活层面上讲,通过推测一个人居住的地点和每天常去的地方,可以为用户提供更便捷的服务。例如,总部位于亚特兰大的AirSage公司每天通过处理来自上百万手机用户的150亿条位置信息,为美国超过100个城市提供实时交通信息。从企业角度来看,位置大数据改变了企业商业运作方式,促进了新型市场的形成与增长。例如,Pyramid Research的调查报告显示,2010年诸如导航或移动社交网络等基于位置的服务已具有28亿美元的市场。据瑞典市场研究公司Berg Insight发布的最新报告,预测全球LBS市场规模到2020年将达到348亿欧元。联合包裹运输公司(UPS)收集自己旗下运输车辆的行驶信息为它们提供最佳行车路线以减少燃油、故障成本,在商业模式上取得了巨大成功。从科学发展的角度看,位置大数据为科学研究提供了新的方法。例如,无线数据科技公司Jana使用大约35亿人口的手机数据试图回答疾病如何传播以及城市如何繁荣这些重大科学问题,该数据来自100多个国家,超过200个无线运营商,覆盖拉丁美洲、非洲、欧洲。
     位置大数据在带给人们巨大收益的同时,也带来了个人信息泄露的危害。位置大数据既直接包含用户的隐私信息,又隐含了用户的个性习惯、健康状况、社会地位等其他敏感信息。位置大数据的不当使用,会给用户各方面的隐私带来严重威胁。例如,某知名移动应用由于不注意保护位置信息,导致根据三角测量方法可以推断出用户的家庭住址等敏感位置,已引发了多起犯罪案件。2014年,iPhone用户隐私泄露事件披露出苹果公司曾私自记录用户每次使用LBS(基于位置的信息服务)应用时的位置信息,从而造成用户的大量位置信息泄露。来自微软的一项调查报告显示,有一半以上的用户担心自己在使用基于位置的服务时泄露自己的隐私。因此,在用户使用LBS应用时,如何保护用户的个人隐私成为一个亟待解决的问题。
     本书给出了传统位置隐私管理中的位置隐私等相关概念,介绍了典型的隐私保护技术,总结归纳了传统位置隐私保护研究中经典的攻击模型和隐私保护模型,并利用一些简单例子说明不同攻击模型的经典保护方法,其中重点讲解了基于数据失真的保护方法(第3~5章)和基于数据加密的方法(第6章)。接下来,本书从需要用到的概念和定义开始阐述。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
29天前
|
存储 大数据 API
大数据隐私保护策略:加密、脱敏与访问控制实践
【4月更文挑战第9天】本文探讨了大数据隐私保护的三大策略:数据加密、数据脱敏和访问控制。数据加密通过加密技术保护静态和传输中的数据,密钥管理确保密钥安全;数据脱敏通过替换、遮蔽和泛化方法降低敏感信息的敏感度;访问控制则通过用户身份验证和权限设置限制数据访问。示例代码展示了数据库、文件系统和API访问控制的实施方式,强调了在实际应用中需结合业务场景和平台特性定制部署。
58 0
|
4月前
|
机器学习/深度学习 人工智能 运维
大数据分析:探索信息世界的钥匙
在当今信息爆炸的时代,大数据分析成为挖掘宝藏般的技术和方法。本文将介绍大数据分析的基本概念、技术与方法,并探讨其在商业、科学和社会领域中的广泛应用。从数据收集和预处理到模型构建和结果解读,大数据分析为我们揭示了信息世界的钥匙,为决策者提供了有力的支持。
|
3月前
|
SQL 分布式计算 MaxCompute
maxcompute之配置报错如何解决
MaxCompute配置是指在使用阿里云MaxCompute服务时对项目设置、计算资源、存储空间等进行的各项调整;本合集将提供MaxCompute配置的指南和建议,帮助用户根据数据处理需求优化其MaxCompute环境。
40 0
|
3月前
|
SQL 存储 分布式计算
maxcompute配置问题之配置mc内容如何解决
MaxCompute配置是指在使用阿里云MaxCompute服务时对项目设置、计算资源、存储空间等进行的各项调整;本合集将提供MaxCompute配置的指南和建议,帮助用户根据数据处理需求优化其MaxCompute环境。
35 1
|
12天前
|
分布式计算 IDE 大数据
MaxCompute产品使用合集之有多人调用大数据计算MaxCompute,我需要给他们每个人都生成ak信息吗
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
11天前
|
分布式计算 DataWorks 调度
DataWorks产品使用合集之DataWorks中,填写ODPS SQL任务中的参数和分区信息如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
25 0
|
11天前
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之DataWorks基础属性:调度参数典型场景配置示例如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
26 0
|
11天前
|
分布式计算 DataWorks 数据处理
DataWorks产品使用合集之在DataWorks中管理MaxCompute模块的步骤如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
21 0
|
12天前
|
分布式计算 DataWorks 安全
DataWorks产品使用合集之DataWorks创建 MaxCompute 资源背景信息如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
26 5
|
12天前
|
分布式计算 DataWorks Java
DataWorks操作报错合集之dataworks 同步es数据到maxcompute 遇到报错:获取表列信息失败如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
23 0

热门文章

最新文章