基于Hadoop的云盘系统客户端技术难点之二 HDFS文件访问控制-阿里云开发者社区

基于Hadoop的云盘系统客户端技术难点之二 HDFS文件访问控制

2013-03-07 986

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

访问控制，不限时长

作者：张子良

一、概述　　

　　Hadoop开源技术框架在实际业务应用中，其早期的安全机制饱受诟病，具体到HDFS应用方面的问题，主要包括以下几个方面：

　　1.用户到服务器的认证问题

　　（1）Namenode上没有用户认证：用户只要知道NameNode服务地址和端口信息，就可以访问HDFS，并获取文件namespace信息。

　　（2）Datanode上没有认证机制：Datanode对读入输出并没有认证，导致如果客户端知道Blockid，就可以任意的访问Datanode上的Block数据。

　　2.服务器到服务器的认证信息

　　（1）Namenode对Datanode没有认证机制：非法用户可以伪装成Datanode，去接收Namenode的文件存储任务。

二、hadoop的Security

　　针对用户到服务器的认证问题，Hadoop在1.0.0版本以后增加了Security认证机制。该机制采用类Unix用户管理机制，文件的创建用户和超级用户拥有对文件的所有权限，包括读和写，其他用户拥有访问权，无写权限。具体来讲就是，连接到hadoop 集群的用户/组信息取决于客户端环境，即客户端主机中`whoami`和`bash –c groups`取到的用户名和组名，没有uid和gid，用户属组列表中只要有一个与集群配置的用户组相同即拥有该组权限。

　　值得注意的是当前Hadoop的三个主要版本分支中并不是都实现了对其的支持，具体实施时需要注意不同版本的区别。

三、hadoop的kebores

　　Hadoop的Kebores认证机制，用来解决服务器到服务器的认证，主要涉及云盘系统后台服务分布式集群安全问题，将另开专题讨论。在此不作讨论。

四、云盘系统客户端文件安全保障

　　云盘系统客户端HDFS文件安全保障主要涉及用户对HDFS文件服务集群的安全访问问题，包括某一个注册用户只能访问属于该用户的空间和某一个用户只能在HDFS空间上访问指定大小的空间两个问题。这里面是涉及一个用户管理和空间管理的问题，在此不作详细介绍。

针对问题一，我们可以通过改造现有HadoopThriftServer或者新增服务机制来解决，即客户端登陆时，返回HDFS上该用户的允许访问路径，用户操作过程中进行访问路径检测，非授权路径自动过滤，不允许访问。

针对问题二，提供用户注册机制，服务端根据用户注册的权属组，调用FSadmin设置用户文件夹的授权大小。

作者：张子良
出处：http://www.cnblogs.com/hadoopdev
本文版权归作者所有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。

基于Hadoop的云盘系统客户端技术难点之二 HDFS文件访问控制

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

基于Hadoop的云盘系统客户端技术难点之二 HDFS文件访问控制

热门文章

最新文章

相关课程

相关电子书

相关实验场景