9月19日上午9点,杭州云栖小镇E1-3会场,2018年杭州云栖大会弹性计算平台技术专场拉开帷幕。
弹性计算系列产品是云时代的基石产品之一,一直备受外界关注。作为弹性计算团队在本届云栖大会的开场大戏,平台技术专场吸引了超过200位与会嘉宾,现场座无虚席。为了让更多的朋友快速了解这场技术盛宴,小编现在带你快速回顾一下专场的精彩片段。
全场景覆盖,面向未来的弹性计算
首先,阿里云研究员,弹性计算负责人余锋,做了精彩的开场演讲。余锋说,阿里云弹性计算团队的服务能力正在从中小企业客户到大型企业全计算场景覆盖的方向演进,不但覆盖通用CPU场景,也有GPU,FPGA等等异构场景,另外弹性计算团队也在存储,网络等方面不断扩展能力边界。
此外,团队正在持续打磨产品的稳定性和服务质量,在企业生态配接上做出努力。弹性计算团队正在通过强化对于硬件服务器的管控能力,对操作系统的定制能力,和对故障隔离能力等等多个维度提升客户对稳定性的体验,宕机率大大降低,在业界遥遥领先。
另外,弹性计算团队也正在通过弹性容器实例,为用户提供更轻,更快,秒级计费,同时兼顾安全和生态的全新服务,为更多的客户量身打造更高性价比,更合适的计算服务。
深入合作,一起探讨云计算的未来
来自英特尔开源技术中心的网络与存储研发经理王庆先生首先带来议题:关于当代云计算的方向展望。将云计算和通信,人工智能,边缘计算等等热点领域的关系进行了深入梳理,并挖掘了相关的技术方向。
明星产品,重磅发布
随后,阿里云高级产品专家倪波,代表弹性计算团队带来了最新的产品更新。在块存储产品领域,倪波宣布IOPS达到百万级的全新一代超高性能云盘ESSD即将全面商业化。
同时,作为新一代异构计算的代表产品,最新的GN6V和F3实例正在全面商业化推进中。GN6V实例搭载NVIDIA Volta架构的Tesla V100计算卡,相对于上一代产品可以提供12倍的运算能力提升。而基于阿里云FaaS(FPGA as a service)舜天平台的F3实例对比上一代产品,逻辑容量增加4倍,DSP能力提升8倍。
议题还介绍了无限制T5实例,该实例可以在传统T5实例积分耗完后,让用户能够继续按需使用付费,从而保持计算性能的持续性。
该议题的最后,弹性计算团队重磅发布了弹性容器实例ECI (Elastic Container Instance)。ECI作为弹性计算在Severless领域的创新产品,具备以下四大特点:极速交付,极小资源,全面兼容K8S,用户只需专注业务。
保持和学术界的无缝对接
弹性计算团队一直和学术界保持无缝对接,对于新技术,新理论一直高度关注。论坛也邀请了华南理工大学的林伟伟教授,详细分享了“面向异构云服务器的能耗模型和能耗测算系统研究”的议题。
该技术在应用后,可以作为云服务器的功耗测算工具,为新服务器功耗模型提供评测功能,也可以为服务器能耗优化调度提供技术支撑和基础平台。同时,基于功耗模型可以给出峰值能效感知的虚拟机调度策略,并以此作为调度的参考信息之一,可以实现对云数据中心更为有效的节能调度。
云服务器测试怎么做到有意义?
阿里云高级技术专家钱超,分享了“怎样有意义地测试云服务器性能”。
钱超从多个角度和指标来阐述了性能测试。钱超指出性能,稳定,时延是互相影响的,脱离另两个只讲其一是不全面的。同时在测试时,需要结合客观条件来对比结果(比如CPU是否PIN住,操作系统的影响等等)。议题客观,实用,现场观众反应热烈。
弹性计算的极致稳定
接着性能测试的议题,阿里云高级技术专家郑旭东分享了关于产品稳定性的议题:“数据,智能,驱动ECS极致稳定”。议题从智能异常调度,健康巡检,强大的分析和预测系统等角度,全面立体地呈现了弹性计算团队在达到极致稳定性上所做的努力。
弹性计算团队借助阿里巴巴强大的基础设施,重构建立了覆盖全生命周期,全链路,全类型的4大类,11小类,同时具有上千项监控细节的监控系统,每天光监控数据都有几十TB。另外,利用人工智能技术做出精准预测,帮助快速发现业务异常和系统隐患。弹性计算正在利用数据,智能,异常调度,客户侧运维形成强大的闭环,随着闭环上数据的积累,可以真正将稳定性做到极致。
首次揭秘:弹性计算调度系统 - 后羿
随后,弹性计算首席架构师,阿里云资深技术专家蔡俊杰,和阿里云高级技术专家徐海弘共同为来宾解密了弹性计算的幕后英雄 – 后羿调度系统。
议题指出,弹性计算调度系统正在从稳定性,性能,成本,和弹性四个方面影响产品。弹性计算调度系统需要管理全球50多个区域的资源,单可用区可以在3分钟内创建一千个以上的虚拟机,每天需要管理的虚拟机数量是在百万级别的。另外,调度系统不仅仅是虚拟机的调度,甚至还包括服务器的采购,机房规划,资源的使用分配都会被纳入闭环,端到端地实现产业优化。
议题还揭秘了弹性计算调度系统的三大层次,和四大核心组件,并且从场景角度切入进行了详细立体的剖析。
主动运维:赋能业务永续
阿里云高级产品专家张鹏程带来了关于主动运维的议题。
议题强调,基于ECS主动运维能力,用户从高可用架构设计开始,将主动运维的思想贯穿于各个基础运维环节。借助云助手、弹性伸缩、系统事件等服务和功能实现开放、弹性、透明体验,建立适合自身业务规模和技术路线的主动运维体系,赋能业务永续运行。
资源编排,弹性伸缩,带来高可用和低成本
最后,阿里云资深技术专家田涛涛带来议题:基于资源编排和弹性伸缩构建高可用低成本的应用。
田涛涛详细介绍了资源编排的使用场景。使用资源编排,实现自动化复制和交付,可以让基础设施更加高可用。结合弹性伸缩,自动保障业务的永续性和可靠性。另外结合抢占式实例和停机不收费模式,切实实现成本和弹性需求的完美结合。
阿里云弹性计算团队,让计算无处不在。
更多的云栖大会咨询,请参见下方链接。
【杭州云栖】异构计算:软硬件结合全栈助力AI大爆发