漫谈大数据时代的个人信息安全(一)——“按图索骥”

简介: 漫谈大数据时代的个人信息安全(一)——“按图索骥”


互联网就像公路,用户使用它,就会留下脚印。

每个人都在无时不刻的产生数据,在消费数据的同时,也在被数据消费。

近日,某高校毕业生在校期间窃取学校内网数据,收集全校学生个人隐私信息的新闻引发了人们对大数据时代个人信息安全问题的再度关注。在大数据时代,推荐算法、AIGC更是对个人信息安全提出了新的挑战。

一、寻找王珞丹

2010年,王珞丹在微博上发出了以下两张照片:

这两张照片表面上看极为普通,但当时有网友根据这两张照片40分钟推理出了王珞丹的居住位置,轰动全网。

下面我们来回溯一下整个过程。

步骤一:区域划分

步骤二:区域筛选

分析王珞丹的微博内容,获取到以下有价值信息:

以上两条微博说明:

  • 下午一点五十左右堵在四环,说明她家不在四环以里。在她另一条微博里,她提到演出这么多年,自己还没有在北京中心地带买一套房子,便是佐证。因此排除E区域。
  • “都开到中关村了”说明平时他们居住的地区离中关村较远,并且对中关村一带不熟悉。因此排除中关村所在的区域D。同时,排除关联区域A也,因为从区域A进城就势必要途径中关村。

此外,由于北京南城开发较晚,多为新建高层小区商品房,且配套交通均不便利,当红明星一般很少居住在此,排除G、H、I;B区域为昌平区域,拥有回龙观、天通苑等大型居民小区,同样不符合当红明星定位,排除B。

目前剩下区域C、D,考虑到D同样离中心城区较近,因此大概率在区域C。

步骤三:特征排查

分析王珞丹微博发的两张照片

  • 首先,所在小区为西式风格,但是从她家的玻璃来看,玻璃框发黄而且有不可擦出的污垢,说明该小区已建成有一段时间。
  • 第二,从房间正对的大楼来看,她住顶层。
  • 第三,从第一张照片中可以看到小区中间有两个正方形的花坛,从第二张照片可以看到被挡住的第三个正方形花坛,地势由高到低,阶梯排布。也就是说,合在一起考虑,从俯视图上看,小区在一条直线上至少有三个一样大小的正方形花坛。这一点很重要
  • 第四,这三个花坛不尽相同,左数第一个和第三个是里面外面都有植被,中间那个里面没有植被只有外面有,也就是讲,如果我们从空中俯视,我们将看到在一片较为空旷的区域的一条直线上,看到三个正方形边框,其中两个被绿色包围、填充,中间那个被绿色包围,中间有投射下的部分阴影。
  • 第五,正方形连线的一段是一个俯视图为长方形的拱门建筑。

在地图上针对相关特征的小区开展逐个排查,发现某小区图片中间左部的三个正方形区域,再加上正方形区域边上的那个长方形区域,从而锁定了王珞丹所在小区。

步骤四:实地验证

最后以小区现场拍摄照片与王珞丹所拍照片进行比较,从而确认这就是所寻找的目标小区。

二、啥是Exif ?

  • 吃完一顿大餐后,在微信上与好友分享一张美食照片的原图或者美图后的照片,对方下载保存后,立马可以显示该照片的拍摄位置。
  • 点开苹果手机相册,点击详细信息,这张照片的地点信息则更精确,具体到哪条路及其门牌号,还可显示附近照片,曾经拍摄过的照片一一出现在对应的地理坐标上。
  • 使用苹果6S以上手机的用户,如开启“livephoto”,将拍摄的照片传到微博上,任何人都可能从照片中知道你的地址。
  • 在微博上随机搜索到几张动态照片,下载保存至手机。进入手机相册,点开“详细信息”,即可显示位置信息。但如果下载的是普通照片,则不会显示位置信息。只要上传的动态照片有完整的位置信息,无论下载方是否开启定位功能,都不会影响图片显示位置信息的功能。

任何智能手机拍摄的照片都含有Exif 参数Exif(Exchangeable Image File)是一种可交换图像文件格式,包含:

  • 图像信息:像素、光圈、快门、焦距、日期时间等
  • 设备信息:相机品牌、型号等
  • GPS全球定位系统数据

拍摄照片时,手机会调用GPS全球定位系统数据,从而在照片中记录下位置、时间等信息,当原始图片被发送,其附带的信息也就一并发出去了,用任何传输工具都是如此。陌生人也能知道你的坐标轨迹,住在哪里,单位地址,什么时候去哪里玩过。

有专门的Exif viewer可查看相关信息

三、个人信息保护小贴士

  • 将相机定位功能关掉,设置-隐私 -定位服务-相机 ( 照片 ) 设置成“永不”

  • 照片原图传到电脑上,右键点击属性,再点击“删除属性和个人信息”。

  • 关闭APP不必要的位置访问权限

  • 慎重上传分享涉及家庭住址、单位地址的照片
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4天前
|
人工智能 安全 算法
AI与大数据:智慧城市安全的护航者与变革引擎
AI与大数据:智慧城市安全的护航者与变革引擎
38 1
|
4天前
|
人工智能 安全 数据挖掘
AI大数据分析对安全隐私的保护
AI大数据分析对安全隐私的保护非常重要。随着大数据技术和人工智能的发展,个人和企业的数据越来越容易被收集和分析。这种数据分析可以为企业提供有价值的洞察和决策支持,但同时也带来了安全隐私的风险。
|
4天前
|
安全 算法 大数据
漫谈大数据时代的个人信息安全(四)——“位所欲为”
漫谈大数据时代的个人信息安全(四)——“位所欲为”
|
4天前
|
安全 算法 大数据
漫谈大数据时代的个人信息安全(三)——“点赞之交”
漫谈大数据时代的个人信息安全(三)——“点赞之交”
|
4天前
|
机器学习/深度学习 人工智能 安全
漫谈大数据时代的个人信息安全(二)——“逢脸造戏”
漫谈大数据时代的个人信息安全(二)——“逢脸造戏”
|
4天前
|
人工智能 安全 数据库
AI大数据分析对个人安全隐私的保护非常重要
随着AI和大数据分析的迅速发展,个人安全隐私的保护变得越来越重要。
|
4天前
|
存储 人工智能 安全
AI大数据分析对企业安全隐私的保护非常重要
AI大数据分析在提供企业发展和决策支持的同时,也涉及到大量的企业数据和用户隐私信息。因此,保护企业安全隐私是非常重要的。
|
4天前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
4天前
|
SQL 分布式计算 大数据
MaxCompute产品使用合集之怎样可以将大数据计算MaxCompute表的数据可以导出为本地文件
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
4天前
|
分布式计算 DataWorks 数据库
DataWorks操作报错合集之DataWorks使用数据集成整库全增量同步oceanbase数据到odps的时候,遇到报错,该怎么处理
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
25 0

热门文章

最新文章