作者:林昊
如今服务器的配置越来越高端,对于Java应用而言,通常很难充分利用物理机资源,这其实并不是说Java本身没法做到用那么多的资源,而是因为通常Java是用于实现应用,应用很多的情况下对内存、cpu的需求都不会太高,这就使得我们需要有一些办法来充分提升机器的资源使用,虚拟化就是其中一种常用的方法。
虚拟化简单来说就是把一台物理机虚拟为N台机器,对于使用者而言通常会觉得虚拟机和一台单独的机器没什么区别。
对于服务器的虚拟化而言,具体关于实现虚拟化的技术像PV/FV等这些就不在这里讲了,感兴趣的同学可以自行google。
用来实现服务器虚拟化中比较好的产品是xen,xen的成熟度很高,易操作比较稳定性不错,用xen可以很简单的在一台物理机上创建N个虚拟机。
CPU的话为每个虚拟机分配的其实都是virtual的,也就是多个虚拟机可能共用一个CPU,这也是为什么有些虚拟机上会看到%st这个指标是有值的,这个值表示的就是多个虚拟机共用一个CPU的时候,被其他虚拟机用掉的CPU,对于一些敏感的场景,可通过绑定CPU的方式来做到隔离,避免互相影响,但相对来说这样的利用率就不能发挥错峰填谷了,在运行过程中可通过xen的管理工具来动态的调整cpu的绑定,创建的虚拟机的cpu core数只能在在设定的最大cpu个数范围内调整。
从上面可以看到,可以认为CPU不是一台机器能创建的xen虚拟机的瓶颈因素,瓶颈因素为内存,xen比较难实现内存的共享,所以在创建了虚拟机后,分配给它的内存就占用了,要实现共享的话会对虚拟机的性能有一定的影响,所以通常来说一般是不会开启的,从这可以看到,如果对于cpu利用不多但内存用的比较多的场景而言,xen虚拟化能提供的帮助是有限的。
磁盘/网络的IO通常是不做隔离的,也就是所有的虚拟机共用,这也是为什么有些时候大家会碰到io hang住后物理机上所有的虚拟机全都受影响,通常可做的是限制磁盘的容量、网络的流量。
目前的虚拟化技术已经非常成熟,对比虚拟机的性能和直接在物理机上跑的性能,差距也很小(通常看到差距比较大是因为物理机上跑的虚拟机比较多),当然,这还和虚拟机上跑的应用类型有关。
对于较多机器的情况下,怎么合理的规划虚拟化,其实是个比较复杂的话题,例如虚拟比到底为多少、虚拟机的ip怎么设计、物理机/虚拟机挂了的情况下怎么处理等等,这些话题就不在这里展开讲了。
除了Xen以外,其实还有很多其他的方案,其中现在用的比较多的还有KVM、LXC,KVM的话在GAE上有使用,LXC比较特殊,所以在这里还是稍微讲下。
LXC相对Xen/KVM而言,其实不能算是完整的虚拟化,LXC其实就是物理机上的一个进程,只支持linux,所以创建出来的虚拟机是没有独立的os的,但可以用独立的用户体系、ip等,官方的LXC版本创建出来的虚拟机,登录进去后看到的物理资源等都是物理机的,如果要让它想一个真正的虚拟机,需要从内核层面做一些改造,LXC带来的好处是可以动态的调整cpu的搭配、个数,并且内存超配也是ok的,这样对于一些场景而言利用率的提升就比较明显了,感兴趣的同学可以去搜下我以前在QCon上讲过的一个T4的产品,是基于LXC的。
提升利用率是个比较大的话题,虚拟化是其中的一个技术点,但涉及的点其实还有很多,Google Borg是提升利用率中“神”级的产品,但目前资料非常少,感兴趣的可以看下我之前写过的一篇我猜测的Borg。
随着硬件的不断发展,之后的PC Server的配置将会比现在高很多,到了那个时候,如何提升机器利用率就是个更复杂的话题,一台物理机上跑的虚拟机太多的话也不太适合,主要的是物理机挂了影响会比较明显,因此如何在虚拟比到达上限的情况下有效的提升利用率会是再过几年要面临的大话题。