《位置大数据隐私管理》—— 1.2 概念与定义

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 位置通常由三元组(x, y, t)表示,其中(x, y)表示移动对象所在的经纬度或者在某个参考坐标系(如UTM坐标系)下的坐标值,t表示时刻。表1-1展示移动对象O1、O2、O3在t1、t2、t3时刻的位置。

本节书摘来自华章出版社《位置大数据隐私管理》一 书中的第1章,第1.2节,作者潘晓、霍 峥、孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.2 概念与定义

1.2.1 位置表示与定位技术

位置通常由三元组(x, y, t)表示,其中(x, y)表示移动对象所在的经纬度或者在某个参考坐标系(如UTM坐标系)下的坐标值,t表示时刻。表1-1展示移动对象O1、O2、O3在t1、t2、t3时刻的位置。以O1为例,在t1时刻,O1的位置坐标是(1, 2);在t2时刻,O1的位置坐标是(3, 3)等。
一个用户在不同时刻的位置组成该用户的轨迹。轨迹是移动对象的位置信息按时间排序形成的序列。通常情况下,一条轨迹可表示为:

c11bd260494f091f16e6225f498b3cfb46fdf6c7

其中,id是轨迹标识,它通常代表某个移动对象、某个个体或使用某种服务的用户。如表1-1中对象O1的轨迹可以表示为{O1, (1, 2, t1), (3, 3, t2), (5, 3, t3)}。一般情况下,被收集到的轨迹数据是静态的,也就是离线数据,若移动对象仍在运行中,那么轨迹就是增量更新的动态数据,也即在线数据。

9413d395d8526d84070618fa78368545a3c0d6ec
文献[34]总结了目前常用的5种定位方法。

1)全球定位系统(Global Positioning System,GPS)。通过卫星与移动设备通信,根据多个卫星与同一移动设备之间的通信延迟,使用三角测量方法获得移动物体的经纬度,精度可达5 m以下。GPS定位是目前最为精准的经纬度定位方法。但是,该方法的缺陷是无法实现室内定位。
2)WiFi定位。建立WiFi访问点与它们的准确位置之间的对应关系并事先存于数据库。当移动对象连接到某个WiFi访问点时,用户的位置可以通过访问数据库中相对应的表查出较精确的经纬度,如Google WiFi定位。WiFi定位的精度在1~10 m范围内。
3)三角测量法。三角测量在三角学与几何学上是借由测量目标点与固定基准线的已知端点的角度,测量目标距离的方法。当移动设备位于3个手机基站的信号范围内时,三角测量可以获得用户的经纬度。三角测量法和WiFi定位避免了GPS系统无法在室内进行定位的缺点。
4)IP地址定位。移动设备接入互联网时会被分配一个IP地址,IP地址的分配是与地域有关的。利用已有的IP地址与地区之间的映射关系,可以将移动对象的位置定位到一个城市大小的地域。
5)其他定位方法。最近的研究显示,通过传感器捕获的加速度、光学影像等信息,可以用于识别用户的位置信息[32,35,1]。

1.2.2 基于位置服务

获得移动对象的位置后,用户可以提出与位置相关的查询,即基于位置的信息服务(Location Based Services,LBS)。基于位置的信息服务是将一个移动设备的位置或者坐标和其他信息整合起来,为用户提供增值服务。从定义可以看出,用户位置是该服务中一个重要因素。
LBS最初应用于军事领域,美国国防部利用GPS全球卫星定位系统对锁定目标进行跟踪、监控。其真正得到发展是在1996年,美国联邦通信委员会(FCC)公布了E911定位需求,要求网络运营商必须能对发出E911紧急呼叫的移动设备用户提供精度定位服务。后来,欧洲和日本也提出了类似的要求,最终促成了LBS的出现。随后,定位系统、通信和GIS领域的快速发展刺激了该行业从业者对LBS的想象力,各商业公司开始广泛利用该项服务,依照移动用户的地理位置为其提供量身定制的服务,包括定位、追踪和导航等。
按照服务面向的对象,LBS可以分为面向用户和面向设备两类[33]。两类服务的主要区别在于:面向用户的LBS,被定位用户对服务拥有主控权;面向设备的LBS,被定位用户或物品属于被动定位,其对服务无主控权。按照服务的推送方式,LBS应用可以分为Push服务和Pull服务。前者是被动接受,后者是主动请求。以4个例子说明上述分类,如表1-2所示。当你进入某城市时接到欢迎信息属于面向用户(你)的Push服务(欢迎信息被主动推送到你的移动设备上);而你在该城市主动提出寻找最近餐馆属于面向用户(你)的Pull服务;假如你是某物流公司老板,当你的公司负责运输的货物偏离预计轨道时将向你发出警报信息,这属于面向设备(货物)的Push服务(消息被推送到物流公司老板的移动设备上);如果你主动请求察看货物运送卡车目前所在位置属于面向设备(货物)的Pull服务。

cf26724b158c2378ac66de43216f9e3d2712be1b
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
存储 分布式计算 大数据
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
78 3
|
3月前
|
消息中间件 分布式计算 大数据
大数据-123 - Flink 并行度 相关概念 全局、作业、算子、Slot并行度 Flink并行度设置与测试
大数据-123 - Flink 并行度 相关概念 全局、作业、算子、Slot并行度 Flink并行度设置与测试
171 0
|
3月前
|
数据采集 数据可视化 大数据
大数据体系知识学习(三):数据清洗_箱线图的概念以及代码实现
这篇文章介绍了如何使用Python中的matplotlib和numpy库来创建箱线图,以检测和处理数据集中的异常值。
72 1
大数据体系知识学习(三):数据清洗_箱线图的概念以及代码实现
|
2月前
|
存储 大数据
究竟什么是大数据,大数据具体应该怎么定义
【10月更文挑战第29天】大数据是指那些传统资料处理技术无法应对的海量数字信息,包括文本、音视频、电子邮件等多类型数据。它涉及数据的获取、分析、存储与传输,需借助专门的技术手段。大数据分析能够帮助企业洞察消费者行为、预测市场趋势,从而实现业务增长。随着数字化进程加快,高效管理与利用大数据成为企业面临的重大挑战。
134 2
|
3月前
|
SQL 分布式计算 NoSQL
大数据-164 Apache Kylin Cube优化 案例1 定义衍生维度与对比 超详细
大数据-164 Apache Kylin Cube优化 案例1 定义衍生维度与对比 超详细
43 1
大数据-164 Apache Kylin Cube优化 案例1 定义衍生维度与对比 超详细
|
2月前
|
数据采集 大数据 数据安全/隐私保护
大数据列表删除的定义
【10月更文挑战第23天】
48 1
|
3月前
|
机器学习/深度学习 XML 分布式计算
大数据的概念
【10月更文挑战第16天】
135 4
|
3月前
|
存储 大数据 分布式数据库
大数据-165 Apache Kylin Cube优化 案例 2 定义衍生维度及对比 & 聚合组 & RowKeys
大数据-165 Apache Kylin Cube优化 案例 2 定义衍生维度及对比 & 聚合组 & RowKeys
53 1
|
3月前
|
消息中间件 NoSQL 大数据
大数据-77 Kafka 高级特性-稳定性-延时队列、重试队列 概念学习 JavaAPI实现(一)
大数据-77 Kafka 高级特性-稳定性-延时队列、重试队列 概念学习 JavaAPI实现(一)
52 1
|
3月前
|
消息中间件 NoSQL Kafka
大数据-116 - Flink DataStream Sink 原理、概念、常见Sink类型 配置与使用 附带案例1:消费Kafka写到Redis
大数据-116 - Flink DataStream Sink 原理、概念、常见Sink类型 配置与使用 附带案例1:消费Kafka写到Redis
219 0