分布式锁在分布式应用当中是要经常用到的,主要是解决分布式资源访问冲突的问题。
一开始考虑采用ReentrantLock来实现,但是实际上去实现的时候,是有问题的,ReentrantLock的lock和unlock要求必须是在同一线程进行,而分布式应用中,lock和unlock是两次不相关的请求,因此肯定不是同一线程,因此导致无法使用ReentrantLock。
接下来就考虑采用自己做个状态来进行锁状态的记录,结果发现总是死锁,仔细一看代码,能不锁死么。
1
2
3
4
5
6
7
8
9
10
11
12
|
public
synchronized
void
lock(){
while
(lock){
Thread.sleep(
1
);
}
lock=
true
;
...
}
public
synchronized
void
unlock(){
lock=
false
;
...
}
|
第一个请求要求获得锁,好么,给他个锁定状态,然后他拿着锁去干活了。
这个时候,第二个请求也要求锁,OK,他在lock中等待解锁。
第一个干完活了,过来还锁了,这个时候悲催了,因为,他进不了unlock方法了。
可能有人会问,为什么采用while,而不是采用wait...notify?这个问题留一下,看看有人能给出来不?
总之,上面的方安案流产了。
同样,不把synchronized 放在方法上,直接放在方法里放个同步对象可以不??道理是一样的,也会发生上面一样的死锁。
到此为止前途一片黑暗。
@沈学良 同学的http://my.oschina.net/shenxueliang/blog/135865写了一个用zk做的同布锁,感觉还是比较复杂的且存疑。自己做不出来吧,又不死心。
再来看看Lock的接口,想了一下,不遵守Lock的接口了。编写了下面的接口。
1
2
3
4
5
6
7
8
9
|
public
interface
DistributedLock
extends
RemoteObject {
long
lock()
throws
RemoteException, TimeoutException;
long
tryLock(
long
time, TimeUnit unit)
throws
RemoteException, TimeoutException;
void
unlock(
long
token)
throws
RemoteException;
}
|
呵呵,眼尖的同学可能已经发现不同了。
lock方法增加了个long返回值,tryLock方法,返回的也不是boolean,也是long,unlock方法多了一个long参数型参数,呵呵,技巧就在这里了。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
|
public
class
DistributedLockImpl
extends
UnicastRemoteObject
implements
DistributedLock {
/**
* 超时单位
*/
private
TimeUnit lockTimeoutUnit = TimeUnit.SECONDS;
/**
* 锁的令牌
*/
private
volatile
long
token =
0
;
/**
* 同步对象
*/
byte
[] lock =
new
byte
[
0
];
/**
* 默认永不超时
*/
long
lockTimeout =
60
*
60
;
//默认超时3600秒
long
beginLockTime;
//获取令牌时间,单位毫秒
public
DistributedLockImpl()
throws
RemoteException {
super
();
}
/**
* @param lockTimeout 锁超时时间,如果加锁的对象不解锁,超时之后自动解锁
* @param lockTimeoutUnit
* @throws RemoteException
*/
public
DistributedLockImpl(
long
lockTimeout, TimeUnit lockTimeoutUnit)
throws
RemoteException {
super
();
this
.lockTimeout = lockTimeout;
this
.lockTimeoutUnit =
this
.lockTimeoutUnit;
}
public
long
lock()
throws
TimeoutException {
return
tryLock(
0
, TimeUnit.MILLISECONDS);
}
private
boolean
isLockTimeout() {
if
(lockTimeout <=
0
) {
return
false
;
}
return
(System.currentTimeMillis() - beginLockTime) < lockTimeoutUnit.toMillis(lockTimeout);
}
private
long
getToken() {
beginLockTime = System.currentTimeMillis();
token = System.nanoTime();
return
token;
}
public
long
tryLock(
long
time, TimeUnit unit)
throws
TimeoutException {
synchronized
(lock) {
long
startTime = System.nanoTime();
while
(token !=
0
&& isLockTimeout()) {
try
{
if
(time >
0
) {
long
endTime = System.nanoTime();
if
(endTime - startTime >= unit.toMillis(time)) {
throw
new
TimeoutException();
}
}
Thread.sleep(
1
);
}
catch
(InterruptedException e) {
//DO Noting
}
}
return
getToken();
}
}
public
void
unlock(
long
token) {
if
(
this
.token !=
0
&& token ==
this
.token) {
this
.token =
0
;
}
else
{
throw
new
RuntimeException(
"令牌"
+ token +
"无效."
);
}
}
}
|
下面对代码进行一下讲解。
上面的代码提供了,永远等待的获取锁的lock方法和如果在指定的时间获取锁失败就获得超时异常的tryLock方法,另外还有一个unlock方法。
技术的关键点实际上就是在token上,上面的实现,有一个基本的假设,就是两次远程调用之间的时间不可能在1纳秒之内完成。因此,每次锁的操作都会返回一个长整型的令牌,就是当时执行时间的纳秒数。下次解锁必须用获得的令牌进行解锁,才可以成功。如此,解锁就不用添加同步操作了,从而解决掉上面死锁的问题。
实际上,没有令牌也是可以的,但是那样就会导致a获取了锁,但是b执行unlock也会成功解锁,是不安全的,而加入令牌,就可以保证只有加锁者才可以解锁。
下面是测试代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
|
public
class
TestDLock {
public
static
void
main(String[] args)
throws
Exception {
RmiServer rmiServer =
new
LocalRmiServer();
DistributedLockImpl distributedLock =
new
DistributedLockImpl();
rmiServer.registerRemoteObject(
"lock1"
, distributedLock);
MultiThreadProcessor processor =
new
MultiThreadProcessor(
"aa"
);
for
(
int
i =
0
; i <
8
; i++) {
processor.addProcessor(
new
RunLock(
"aa"
+ i));
}
long
s = System.currentTimeMillis();
processor.start();
long
e = System.currentTimeMillis();
System.out.println(e - s);
rmiServer.unexportObject(distributedLock);
}
}
class
RunLock
extends
AbstractProcessor {
public
RunLock(String name) {
super
(name);
}
@Override
protected
void
action()
throws
Exception {
try
{
RmiServer client =
new
RemoteRmiServer();
DistributedLock lock = client.getRemoteObject(
"lock1"
);
for
(
int
i =
0
; i <
1000
; i++) {
long
token = lock.lock();
lock.unlock(token);
}
System.out.println(
"end-"
+ Thread.currentThread().getId());
}
catch
(RemoteException e) {
e.printStackTrace();
}
}
}
|
运行情况:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
|
-
0
[main] INFO - 线程组<aa>运行开始,线程数
8
...
-
3
[aa-aa0] INFO - 线程<aa-aa0>运行开始...
-
3
[aa-aa1] INFO - 线程<aa-aa1>运行开始...
-
3
[aa-aa2] INFO - 线程<aa-aa2>运行开始...
-
3
[aa-aa3] INFO - 线程<aa-aa3>运行开始...
-
3
[aa-aa4] INFO - 线程<aa-aa4>运行开始...
-
4
[aa-aa5] INFO - 线程<aa-aa5>运行开始...
-
4
[aa-aa6] INFO - 线程<aa-aa6>运行开始...
-
8
[aa-aa7] INFO - 线程<aa-aa7>运行开始...
end-
19
-
9050
[aa-aa3] INFO - 线程<aa-aa3>运行结束
end-
17
-
9052
[aa-aa1] INFO - 线程<aa-aa1>运行结束
end-
20
-
9056
[aa-aa4] INFO - 线程<aa-aa4>运行结束
end-
16
-
9058
[aa-aa0] INFO - 线程<aa-aa0>运行结束
end-
21
-
9059
[aa-aa5] INFO - 线程<aa-aa5>运行结束
end-
26
-
9063
[aa-aa7] INFO - 线程<aa-aa7>运行结束
end-
18
-
9064
[aa-aa2] INFO - 线程<aa-aa2>运行结束
end-
22
-
9065
[aa-aa6] INFO - 线程<aa-aa6>运行结束
-
9066
[main] INFO - 线程组<aa>运行结束, 用时:9065ms
9069
|
也就是9069ms中执行了8000次锁定及解锁操作。
小结:
上面的分布式锁实现方案,综合考虑了实现简单,锁安全,锁超时等因素。实际测试,大概900到1000次获取锁和释放锁操作每秒,可以满足大多数应用要求。
由于昨天有粉要求尽快发出,因此发得比较匆忙,不足之处及BUG在所难免,欢迎拍砖。