斯诺登最新泄露文件披露GCHQ数据挖掘技术

简介:

日前,Boing Boing在网上发布了一份长达96页关于英国情报机构GCHQ数据挖掘技术的电子书—《数据挖掘研究问题书(Data Mining Research Problem Book)》。据悉,这份文件最早由爱德华·斯诺登获得。

 

http://static.cnbetacdn.com/article/2016/0207/898da6cba06faa3.png

 

Boing Boing为这本电子书打上了一个“可能发生的最糟糕的情况是什么?”的副标题,并对其进行以下描述:一种为想要利用恶意软件寻找许可、感染敌人电脑或网络的间谍所使用的清单。

从电子书中了解到,这份数据挖掘手册由来自海尔布隆数学研究所的研究人员和GCHQ和布里斯托尔大学的研究人员联合编写。据Boing Boing披露,相关人员一半的时间花在公共研究工作上,而另外一半时间则用在政府的秘密项目开发上。

手册为GCHQ数据挖掘工作提供了非常具有价值的见解,至少在2011年9月编写完成的时候是非常有用的。那个时候,一些“传输者”—互联网连接—其速度为10 gigabits/s。而手册中写道:“一个10G的传输者可以生产巨大的数据。为了让它们变得可管理,首先要做的就是丢掉大部分我们看得到的数据包。”

然而重要的是,其实被丢掉的只是内容,而非源数据。这也就证实了GCHQ在对源数据监控中所扮演的中心角色,换句话说,这个机构甚至有可能在《监听者宪章(Snooper Charter)》到来之前就已经开始数据收集了。

还有值得注意的部分则是隐写术—将信息隐藏在另外一个文件中,其中一个常用的办法就是通过对JPEG图像系数的修改将数据藏在里边,与此同时,对图片的改变则要尽量保持最小化。

不过手册中大部分内容都集中在GCHQ大规模源数据储存的审查上。

当有外媒就这一份文件真实性向GCHQ求证时,该机构发言人称:“我们不对此做评论,”仅简单地提供了一个非常官方的回应。


本文转自d1net(转载)

相关文章
|
机器学习/深度学习 数据可视化 数据挖掘
探索大数据时代的关键技术:数据挖掘、可视化和数据仓库
探索大数据时代的关键技术:数据挖掘、可视化和数据仓库
1284 0
|
数据采集 数据可视化 数据挖掘
爬虫技术对携程网旅游景点和酒店信息的数据挖掘和分析应用
爬虫技术是一种通过网络爬取目标网站的数据并进行分析的技术,它可以用于各种领域,如电子商务、社交媒体、新闻、教育等。本文将介绍如何使用爬虫技术对携程网旅游景点和酒店信息进行数据挖掘和分析,以及如何利用Selenium库和代理IP技术实现爬虫程序
1384 0
|
存储 监控 数据挖掘
【计算机三级数据库技术】第14章 数据仓库与数据挖掘-
文章概述了数据仓库和数据挖掘技术的基本概念、决策支持系统的发展、数据仓库的设计与建造、运行与维护,以及联机分析处理(OLAP)与多维数据模型和数据挖掘技术的步骤及常见任务。
210 3
|
机器学习/深度学习 分布式计算 数据挖掘
数据仓库与数据挖掘技术的结合应用
【7月更文挑战第30天】数据仓库与数据挖掘技术的结合应用是现代企业实现高效决策和精准分析的重要手段。通过整合高质量的数据资源,利用先进的数据挖掘技术,企业可以更好地理解市场、客户和业务,从而制定科学的决策和战略。未来,随着技术的不断进步和应用场景的不断拓展,数据仓库与数据挖掘技术的结合应用将会为企业的发展提供更多机遇和挑战。
|
机器学习/深度学习 数据采集 算法
数据科学基础:数据挖掘与分析的技术探讨
【6月更文挑战第15天】本文探讨数据科学中的数据挖掘与分析技术,阐述其基础理论,包括数据预处理、探索和模型建立,并介绍统计分析、机器学习、深度学习等方法。面对数据质量、算法选择等挑战,数据挖掘在智能决策、个性化服务、预测等方面展现广阔前景,将在跨领域融合中发挥更大作用,同时也需关注隐私安全与技术伦理。
|
数据采集 自然语言处理 数据可视化
基于python数据挖掘在淘宝评价方面的应用与分析,技术包括kmeans聚类及情感分析、LDA主题分析
本文探讨了基于Python数据挖掘技术在淘宝评价分析中的应用,涵盖了数据采集、清洗、预处理、评论词频分析、情感分析、聚类分析以及LDA主题建模和可视化,旨在揭示淘宝客户评价中的潜在模式和情感倾向,为商家和消费者提供决策支持。
492 0
|
数据采集 数据可视化 数据挖掘
数据挖掘微博:爬虫技术揭示热门话题的趋势
微博是中国最大的社交媒体平台之一,每天有数亿用户在上面发表自己的观点、分享自己的生活、参与各种话题。微博上的热门话题反映了用户的关注点和社会的动态,对于分析舆情、预测市场、探索文化等方面都有重要的价值。本文将介绍如何使用爬虫技术从微博上抓取热门话题的数据,并通过可视化的方式展示热门话题的变化趋势。
767 0
数据挖掘微博:爬虫技术揭示热门话题的趋势
|
机器学习/深度学习 算法 数据挖掘
数据挖掘:Python数据分析中的高级技术点
数据挖掘:Python数据分析中的高级技术点
238 0
|
机器学习/深度学习 数据采集 算法
【数据挖掘和机器学习技术】数据挖掘和机器学习相关的算法和模型,如聚类、分类、回归、神经网络
【数据挖掘和机器学习技术】数据挖掘和机器学习相关的算法和模型,如聚类、分类、回归、神经网络
397 0
|
机器学习/深度学习 存储 分布式计算
Hadoop生态系统中的机器学习与数据挖掘技术:Apache Mahout和Apache Spark MLlib的应用
Hadoop生态系统中的机器学习与数据挖掘技术:Apache Mahout和Apache Spark MLlib的应用

热门文章

最新文章