虚拟化的发展历史
从1998年到现在,为什么会有虚拟化?虚拟化的发展历史是什么样的?虚拟化掌门人张献涛从一个投资故事“张守晟投资vmware”开始,讲到真正的云计算时代,他认为虚拟化经过十年的发展,在业务的驱动下,才能不断进化,不断发展。云栖大会上发布了神龙云服务器新物种,他说:真正的神龙技术,代表虚拟化会进入虚拟化下一个阶段。
云计算中的虚拟化
云计算——Iaas——虚拟化,虚拟化成为公共云计算的基石性技术。无论是公有云还是私有云,都借助虚拟化的技术在进行。
只要是阿里云的新产品,100多个产品都要基于虚拟化去做,当然也对虚拟化提出了更高的挑战。
对阿里云虚拟化的关键词,张献涛提出:“安全,稳定,性能,隔离,兼容性,热升级,热迁移…...”,针对以上几点,分别做了精彩的分享。
其中针对稳定性,他认为确保业务永续是考核稳定性的关键指标,云计算必须打造最稳定的虚拟化技术。
谈到对虚拟化技术的未来和展望:虚拟化进入了2.0时代,它打破了虚拟机和物理机的界限。
进入本场论坛的主题,由虚拟化张超带来热迁移的精彩分享。
热迁移技术从第一次被提出到如今已经迈过了差不多十多个年头。然而在公有云领域,即使是世界领先的厂商也鲜有提及热迁移在其内部的应用和技术进展。这不是因为热迁移不重要,也不是因为热迁移已经成熟到成为云计算领域的一个基础能力。而是因为同私有云相比,在公有云中使用热迁移技术有其独特的技术难度和复杂度。在本次技术分享中,张超为大家介绍了阿里云在公有云中实践热迁移技术时所碰到的一些技术难点,以及我们对这些困难的思考和最终的解决方案。
同传统的虚拟化热迁移相比,公有云热迁移最大的技术难点在于,共有云里面要迁移的不只是一个VM,而是一个完整的云生态。阿里云通过在这个过程中,一直致力于打造一个热迁移友好的云生态系统。围绕这个系统,我在在虚拟化、云存储、VPC网络、SLB、控制系统方面以工匠心态,进行了打磨。这里我们介绍了阿里云在公有云热迁移方面的一些主要工作和优化,通过这些应用,如今阿里云在热迁移的性能方面,对于idle状态的虚拟机,我们的中断时间已经从最初的18秒优化到当前的100ms左右。在热迁移展示阶段,我们展示了热迁移在阿里云内部在轮转升级、主动运维、碎片整理方面的一些应用,并就我们在热迁移使用过程中碰到的一些问题,与大家做了相应的分享和探讨。
虚拟化专家沈益斌对用户态高速块缓存方案,很精彩地分享了其中之道。
分布式存储因为其拥有良好的弹性机制和扩展能力,在公有云里被广泛用于构建云盘系统,然而在享受其强大功能的同时,也因为架构上的原因,面临了性能上的挑战。主要是因为路径太长,导致随机IO延迟较高, 这对很多应用使用云盘带来了障碍。
阿里云虚拟化团队深入分析了此问题,并在众多前人工作基础上,和Intel CAS团队一起提出了可以在用户态qemu中增加一层透写的cache来优化此问题。因为cache非常靠近用户端,所以对于加速读操作效果明显。和传统的bcache,flashcache不一样的地方是,Qcache工作在用户态,这为cache系统的维护带来了极大的便利性,即使出问题也不会导致物理机异常。
同时也方便了和SPDK高速存储框架的对接,为接入NVMe, Optane等最新的存储技术提供了便利性。
Intel的精彩分享
David首先介绍了现有的两种存储技术,3d nand 和optane 技术。随着技术进步,3d nand芯片密度更高同时变的更便宜。而optane技术拥有更好的性能,David相信optane接下来5年会带来存储技术的革命。
接下来David & 来自Intel 研究院的Zou Yi联合总结了intel与阿里云的合作,如何使用intel的存储与技术加速阿里云的存储性能,以及未来的合作路线图。
最后David介绍了cache 的性能数据,使用fio 4k随机读测试的结果,intel cache 使用nand ssd 提供了4.7倍的性能提升,而使用optane可以提供6.3倍的性能提升。
阿里高级技术专家张扬针对虚拟化全链路调优主题做了深度解析。
会上,互动气氛超乎想象,观众不停地提问。
感谢关注虚拟化平台,精彩继续。