Hadoop服务器配置不当 造成5PB数据泄露

本文涉及的产品
云数据库 MongoDB,通用型 2核4GB
简介:

根据John Matherly的说法,不适当地配置HDFS服务器——主要是Hadoop安装——将会泄露超过5PB的信息。John Matherly是用于发现互联网设备的搜索引擎Shodan的创始人。

这位专家说,他发现了4487个HDFS服务器实例,这些服务器可通过公共IP地址获得,而且不需要身份验证。这些服务器总共泄露了超过5120TB的数据。

20170605032124494.png

▲HDFS系统泄露地图

据Matherly说,47820个MongoDB服务器只泄露了25 TB的数据。从这个角度来看,与MongoDB服务器相比,HDFS服务器泄露的数据要多200倍,而与此同时,MongoDB服务器的数量是后者的10倍。Binary Edge于2015年公布的一份报告显示,在当时,Redis、MongoDB、Memcached和ElasticSearch服务器的数据只泄露了1.1 PB的数据。

大多数HDFS系统位于美国和中国

泄露最多HDFS实例的国家是美国和中国,但这并不奇怪,因为这两个国家拥有世界上超过50%的数据中心。

今年早些时候,攻击者意识到他们可以接管为受保护的服务器,在网络上泄露、窃取他们的内容,请要求赎金。黑客攻击首先针对的是MongoDB,但很快就转移到了CouchDB和Hadoop。

最初的时候,有124个服务器遭受勒索,这个数字最近增长到了500个。根据Matherly的说法,仍然有207个基于hdfs的集群有赎金要求,不过我们不清楚这些是不是今年1月袭击的遗留问题,还是现下仍然有服务器正被劫持。

HDFS支持Hadoop分布式文件系统,这是一个可以在基于云的服务器上运行的分布式文件系统。它是Apache Hadoop的核心技术,但它也部署了自定义解决方案。HDFS系统通常位于云托管环境中,用于存储和处理大量的用户数据。



本文转自d1net(转载)

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
分布式计算 资源调度 Hadoop
Hadoop运行模式(五)、编写Hadoop集群常用脚本、Hadoop集群启停脚本、常用端口号说明、集群时间同步、时间服务器配置、其他机器配置
Hadoop运行模式(五)、编写Hadoop集群常用脚本、Hadoop集群启停脚本、常用端口号说明、集群时间同步、时间服务器配置、其他机器配置
Hadoop运行模式(五)、编写Hadoop集群常用脚本、Hadoop集群启停脚本、常用端口号说明、集群时间同步、时间服务器配置、其他机器配置
|
分布式计算 安全 大数据
Hadoop服务器配置不当致使全球5120TB数据泄露,中国和美国受伤最深
本文讲的是Hadoop服务器配置不当致使全球5120TB数据泄露,中国和美国受伤最深,直到去年,网络犯罪分子还只是针对具有支付赎金能力的个人或企业组织的计算机进行勒索攻击,但是现在,一切都悄然发生了变化,他们开始针对全球未受保护的在线数据库和服务器进行勒索攻击并索要赎金。
1637 0
|
分布式计算 安全 大数据
还在用Hadoop么?Hadoop服务器造成5PB数据泄露,中国、美国受波及最大!
根据John Matherly的说法,不适当地配置HDFS服务器——主要是Hadoop安装——将会泄露超过5PB的信息。John Matherly是用于发现互联网设备的搜索引擎Shodan的创始人。 这位专家说,他发现了4487个HDFS服务器实例,这些服务器可通过公共IP地址获得,而且不需要身份验证。
4221 0
|
1月前
|
存储 分布式计算 Hadoop
大数据处理架构Hadoop
【4月更文挑战第10天】Hadoop是开源的分布式计算框架,核心包括MapReduce和HDFS,用于海量数据的存储和计算。具备高可靠性、高扩展性、高效率和低成本优势,但存在低延迟访问、小文件存储和多用户写入等问题。运行模式有单机、伪分布式和分布式。NameNode管理文件系统,DataNode存储数据并处理请求。Hadoop为大数据处理提供高效可靠的解决方案。
87 2
|
1月前
|
分布式计算 Hadoop 大数据
大数据技术与Python:结合Spark和Hadoop进行分布式计算
【4月更文挑战第12天】本文介绍了大数据技术及其4V特性,阐述了Hadoop和Spark在大数据处理中的作用。Hadoop提供分布式文件系统和MapReduce,Spark则为内存计算提供快速处理能力。通过Python结合Spark和Hadoop,可在分布式环境中进行数据处理和分析。文章详细讲解了如何配置Python环境、安装Spark和Hadoop,以及使用Python编写和提交代码到集群进行计算。掌握这些技能有助于应对大数据挑战。
|
5天前
|
分布式计算 资源调度 Hadoop
java与大数据:Hadoop与MapReduce
java与大数据:Hadoop与MapReduce
23 0
|
15天前
|
存储 分布式计算 Hadoop
【专栏】Hadoop,开源大数据处理框架:驭服数据洪流的利器
【4月更文挑战第28天】Hadoop,开源大数据处理框架,由Hadoop Common、HDFS、YARN和MapReduce组成,提供大规模数据存储和并行处理。其优势在于可扩展性、容错性、高性能、灵活性及社区支持。然而,数据安全、处理速度、系统复杂性和技能短缺是挑战。通过加强安全措施、结合Spark、自动化工具和培训,Hadoop在应对大数据问题中保持关键地位。
|
19天前
|
分布式计算 Hadoop 大数据
[大数据] mac 史上最简单 hadoop 安装过程
[大数据] mac 史上最简单 hadoop 安装过程

相关实验场景

更多