Alluxio源码分析定位策略：最大可用容量优先策略MostAvailableFirstPolicy-阿里云开发者社区

Alluxio源码分析定位策略：最大可用容量优先策略MostAvailableFirstPolicy

2016-03-24 917

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 最大可用容量优先策略MostAvailableFirstPolicy是一种worker可用容量最大的定位策略。如果没有worker合格的话该策略返回null。它的核心方法getWorkerForNextBlock()实现如下： /** * A policy that returns the worker with the most available bytes. The policy returns null if no * worker is qualified. * 一种worker可用容量最大的定位策略。

最大可用容量优先策略MostAvailableFirstPolicy是一种worker可用容量最大的定位策略。如果没有worker合格的话该策略返回null。它的核心方法getWorkerForNextBlock()实现如下：

/**
 * A policy that returns the worker with the most available bytes. The policy returns null if no
 * worker is qualified.
 * 一种worker可用容量最大的定位策略。如果没有worker合格的话该策略返回null。
 */
@ThreadSafe
public final class MostAvailableFirstPolicy implements FileWriteLocationPolicy {

  @Override
  public WorkerNetAddress getWorkerForNextBlock(List<BlockWorkerInfo> workerInfoList,
      long blockSizeBytes) {
	  
	// 将输入参数BlockWorkerInfo列表workerInfoList转换成ArrayList形式的列表inputList
    List<BlockWorkerInfo> inputList = Lists.newArrayList(workerInfoList);
    
    // 标志变量：最大可用容量
    long mostAvailableBytes = -1;
    
    // 被选中的worker地址
    WorkerNetAddress result = null;
    
    // 遍历BlockWorkerInfo列表inputList，取出每个BlockWorkerInfo，即workerInfo：
    for (BlockWorkerInfo workerInfo : inputList) {
    	
      // 如果该workerInfo的可用容量（总容量减去已用容量）大于最大可用容量mostAvailableBytes，则
      // 设置标志变量最大可用容量mostAvailableBytes为当前worker的可用容量，设置被选中的worker地址result为当前worker的网络地址
      if (workerInfo.getCapacityBytes() - workerInfo.getUsedBytes() > mostAvailableBytes) {
        mostAvailableBytes = workerInfo.getCapacityBytes() - workerInfo.getUsedBytes();
        result = workerInfo.getNetAddress();
      }
    }
    
    // 返回被选中的worker地址
    return result;
  }
}

大体流程如下：

1、将输入参数BlockWorkerInfo列表workerInfoList转换成ArrayList形式的列表inputList；

2、初始化标志变量：最大可用容量mostAvailableBytes为-1；

3、初始化被选中的worker地址result为null；

4、遍历BlockWorkerInfo列表inputList，取出每个BlockWorkerInfo，即workerInfo：

4.1、如果该workerInfo的可用容量（总容量减去已用容量）大于最大可用容量mostAvailableBytes，则：

4.1.1、设置标志变量最大可用容量mostAvailableBytes为当前worker的可用容量；

4.1.2、设置被选中的worker地址result为当前worker的网络地址；

5、返回被选中的worker地址（有可能为null）。

这里，有个问题：什么时候所有worker已用容量会大于总容量，也就是workerInfo.getCapacityBytes() - workerInfo.getUsedBytes()的值会小于等于-1，而导致最终结果返回null呢？即便是某一个worker，什么时候已用容量会大于总容量呢？留待以后再解决吧！

Alluxio源码分析定位策略：最大可用容量优先策略MostAvailableFirstPolicy

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Alluxio源码分析定位策略：最大可用容量优先策略MostAvailableFirstPolicy

热门文章

最新文章

相关电子书