HashMap原理-阿里云开发者社区

HashMap原理

2015-12-21 983

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 1.HashMap的数据结构　　数组的特点是：寻址容易，插入和删除困难；而链表的特点是：寻址困难，插入和删除容易。那么我们能不能综合两者的特性，做出一种寻址容易，插入删除也容易的数据结构？答案是肯定的，这就是我们要提起的哈希表，哈希表有多种不同的实现方法，我接下来解释的是最常用的一种方法—— 拉链法，我们可以理解为“链表的数组” ，如图：　　从上图我们可以发现哈希表是由数组+链表组成的，一个长度为16的数组中，每个元素存储的是一个链表的头结点。

1.HashMap的数据结构

　　数组的特点是：寻址容易，插入和删除困难；而链表的特点是：寻址困难，插入和删除容易。那么我们能不能综合两者的特性，做出一种寻址容易，插入删除也容易的数据结构？答案是肯定的，这就是我们要提起的哈希表，哈希表有多种不同的实现方法，我接下来解释的是最常用的一种方法—— 拉链法，我们可以理解为“链表的数组” ，如图：

　　从上图我们可以发现哈希表是由数组+链表组成的，一个长度为16的数组中，每个元素存储的是一个链表的头结点。那么这些元素是按照什么样的规则存储到数组中呢。一般情况是通过hash(key)%len获得，也就是元素的key的哈希值对数组长度取模得到。比如上述哈希表中，12%16=12,28%16=12,108%16=12,140%16=12。所以12、28、108以及140都存储在数组下标为12的位置。

　　HashMap其实也是一个线性的数组实现的,所以可以理解为其存储数据的容器就是一个线性数组。这可能让我们很不解，一个线性的数组怎么实现按键值对来存取数据呢？这里HashMap有做一些处理。

　　1.首先HashMap里面实现一个静态内部类Entry，其重要的属性有 key , value, next，从属性key,value我们就能很明显的看出来Entry就是HashMap键值对实现的一个基础bean，我们上面说到HashMap的基础就是一个线性数组，这个数组就是Entry[]，Map里面的内容都保存在Entry[]里面。

2.HashMap的存取实现

既然是线性数组，为什么能随机存取？这里HashMap用了一个小算法，大致是这样实现：

1 //存储时:
2 int hash = key.hashCode();// 这个hashCode方法这里不详述,只要理解每个key的hash是一个固定的int值
3 int index = hash % Entry[].length;
4 Entry[index] = value;
5 
6 //取值时:
7 int hash = key.hashCode();
8 int index = hash % Entry[].length;
9 return Entry[index];

到这里我们轻松的理解了HashMap通过键值对实现存取的基本原理

3.疑问：如果两个key通过hash%Entry[].length得到的index相同，会不会有覆盖的危险？

　　这里HashMap里面用到链式数据结构的一个概念。上面我们提到过Entry类里面有一个next属性，作用是指向下一个Entry。打个比方，第一个键值对A进来，通过计算其key的hash得到的index=0，记做:Entry[0] = A。一会后又进来一个键值对B，通过计算其index也等于0，现在怎么办？HashMap会这样做:B.next = A,Entry[0] = B,如果又进来C,index也等于0,那么C.next = B,Entry[0] = C；这样我们发现index=0的地方其实存取了A,B,C三个键值对,他们通过next这个属性链接在一起。所以疑问不用担心。也就是说数组中存储的是最后插入的元素。到这里为止，HashMap的大致实现，我们应该已经清楚了。

　　当然HashMap里面也包含一些优化方面的实现，这里也说一下。比如：Entry[]的长度一定后，随着map里面数据的越来越长，这样同一个index的链就会很长，会不会影响性能？HashMap里面设置一个因素（也称为因子），随着map的size越来越大，Entry[]会以一定的规则加长长度。

3.解决hash冲突的办法

开放定址法（线性探测再散列，二次探测再散列，伪随机探测再散列）
再哈希法
链地址法
建立一个公共溢出区

Java中hashmap的解决办法就是采用的链地址法。

4.实现自己的HashMap

　　MapTest.java

 1 package General;
 2 import java.util.*;
 3 public class MapTest {
 4     public static void main(String[] args){
 5         Map<String,Employee> staff=new HashMap<>();
 6         staff.put("144-25-5456",new Employee("Amy Lee"));
 7         staff.put("567-24-2456",new Employee("Harry Hacker"));
 8         staff.put("157-62-7935",new Employee("Gary Cooper"));
 9         staff.put("465-62-5537",new Employee("Francesca Cruz"));
10         
11         //print all entries
12         System.out.println(staff);
13         
14         //remove an entry
15         staff.remove("567-24-2456");
16         
17         //replace an entry
18         staff.put("456-62-5527",new Employee("Francesca Miller"));
19         
20         //look up a value
21         System.out.println(staff.get("157-62-7935"));
22         
23         //iterate through all entries
24         for(Map.Entry<String, Employee>entry:staff.entrySet()){
25                 String key=entry.getKey();
26                 Employee value=entry.getValue();
27                 System.out.println("Key="+key+", value="+value);
28         }
29     }
30 }
31 class Employee{
32     private String name;
33     public Employee(String n){
34         name=n;
35     }
36     public String getName(){
37         return name;
38     }
39 }

View Code

1 {157-62-7935=Amy Lee, 
2 567-24-2456=Harry Hacker, 
3 144-25-5456=Gary Cooper, 
4 465-62-5537=Francesca Cruz}
5 Francesca Miller
6 Key=157-62-7935, value=Amy Lee
7 Key=144-25-5456, value=Harry Hacker
8 Key=465-62-5537, value=Gary Cooper
9 Key=456-62-5527, value=Francesca Cruz

View Code

当神已无能为力，那便是魔渡众生

HashMap原理

1.HashMap的数据结构

2.HashMap的存取实现

3.解决hash冲突的办法

4.实现自己的HashMap

热门文章

最新文章

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

HashMap原理

1.HashMap的数据结构

2.HashMap的存取实现

3.解决hash冲突的办法

4.实现自己的HashMap

热门文章

最新文章

相关电子书