编者按:10月11-14日,为期四天的2017杭州云栖大会(门票火热抢购中!)将再度在杭州云栖小镇起航,作为全球最具影响力的科技展会之一,本届大会将有不少阿里集团专家以及各企业行业领袖的精彩演讲。从今天开始,云栖社区将会对大会嘉宾做一系列专访,想了解嘉宾以及最新议题信息请关注“云栖大会”公众号。本期我们采访的是阿里巴巴资深技术专家雁杨,他将在10月的云栖大会·弹性计算企业线峰会上分享ECS的应用现状、技术解析以及云服务器未来的发展趋势。
近年来随着云计算如火如荼的发展,上云已经成为了所有企业的标配。但在国内鱼龙混杂的云服务市场下,云服务器的选型评估却是长期困扰着企业的难题。基于此,阿里云ECS一直坚持为不同行业及不同企业提供垂直实例产品,提高用户体验,有针对性的解决行业特色问题并且带来最优的性价比。本文中阿里云ECS产品负责人雁杨,将就云服务器的选择、业务迁移上云的经验分享等话题进行深度解答。
雁杨
ECS发展现状解读
和亚马逊一样,阿里云始于电商业务,其整体技术构筑在阿里集团10年的电商业务积淀之上。雁杨表示,作为国内最早对外开放的云服务器,ECS从开放至今已经历了三个里程碑。
2012年,阿里巴巴把整体基础设施能力通过云服务器开始对外服务。此时的整体配置是从xen虚拟化架构,千兆网络起步,最早一批对外服务的主要客户为站长和互联网小客户。在这期间,阿里云也经历了内部技术基础设施外部商业化的阵痛。由于xen架构、千兆网以及早期底层飞天虚拟化网络和存储技术的局限性,当时云服务器的整体IO和网络能力十分有限,主体就是原来的I型非IO优化实例系列。随着更多的中型互联网客户进驻,IO能力成为最大的制约因素,因此客户结构的变化开始推动阿里云在IO能力上进行进化。
2014年与2015年之交,阿里云的整体架构进化为KVM +万兆网络,并且引入了高效云盘和ssd云盘(ssd云盘能够到2万以上的IOPS),同时整体机型同步切换到Haswell,计算能力也得到了跨越式的提升。另一方面,整体的产品功能、运维稳定性方面也在逐步完善,这使得阿里云形成了对中型,大型客户初步的服务能力。但与此同时,随着大型企业客户的涌入,内部体量和客户结构又产生了进一步的变化。这些大型互联网企业对整体云服务的全方位可预期稳定性、可预期性能、整体拥有成本的要求更加苛刻,于是构建真正覆盖所有规模企业云服务器的能力是下一步的目标重点。
现在正属于非常关键的阶段,大规模的企业客户除了对绝对性能和成本上提出了更高的要求,他们更加看重线上持续可预期、稳定的全生命周期性能。消除性能的不可预期性有几个解决方法:一方面通过底层的调度算法优化来保证用户的云服务器能够获取稳定的性能;另一方面,新的企业线云服务器产品切实降低了资源复用率,在企业线上把绝对稳定的高计算力给到对可预期性能要求非常高的企业客户;除此之外,阿里云本身的计算、存储和网络性能都有非常大的提升。
“作为IAAS的核心组件,ECS实质上就是对IDC服务器、运维、管理自动化三个领域的整合”,雁杨认为,其准入门槛并不高,但想要做精、做好却并不容易。想要降低成本、提升稳定性、做到高性能并获得最佳体验,阿里云ECS希望针对传统IDC服务器托管领域的各种稳定性、性能、成本、运维等问题,日拱一卒而不断精进。
技术沉淀带来能力的质变
八月初,阿里云在企业级ECS发布会上进行了跑分测试,这也是云产品现场跑分的先驱。不同于传统手机、PC市场领域的常规动作,在云计算领域,稳定性、隔离性以及关键场景的性能表现实际上相差巨大。根据现场的跑分情况,阿里云新发布的企业级ECS产品系列在性能上明显优于竞争对手。
事实上,代表了中国云计算技术实力的阿里云同时也承载了国内大部分上云企业的业务,这也就导致了在不断高速技术创新的迭代下,阿里云还要求能够高效保障客户的稳定性。“积累是重点,云计算是资本技术双密集的产业,阿里云的先发优势让我们积累了非常强的、富有经验的核心技术团队”,雁杨提到,“坚持自研不走捷径,虽然投入会更大,但是只要坚持下来,对核心技术掌控力必然会发生质的变化。”
当然,在克服这些困难的同时,阿里也确实打造了非常高效的软件工程和线上迭代体系。相比友商同价位的产品,ECS的网络性能和存储IO性能是其的数倍。在网络性能上,阿里云的网络虚拟化技术一直是走自主研发的路线,所以有很深的人才积累和技术积累。实际上,阿里云已经将整个虚拟化的网络技术全部进行了重构,升级到了第二代Alibaba vSwitch技术,采用自主研发的网络协议栈和vSwitch技术比开源的对应实现在性能、规模以及运维各方面都有很大的优势。在存储IO性能上,ECS也超过了其他云服务厂商同类产品的水平,超高存储吞吐,低成本存储,高带宽,为大数据场景提供最佳的性价比。
对阿里云而言,最关键的产品核心性能经过多年的锻造,对比友商具有巨大的优势。让上云的企业明明白白选型,避免浪费每一分宝贵的IT预算,并且把云产品的透明度做好——这些是根本前提,也有利于客户、利于市场的良性竞争。
ECS的多维度衡量和选型
对于企业而言,云服务器的优劣需要从多维度衡量和选型。“云服务器的随开随得、按量付费弹性、宕机迁移、云盘n个9的数据可靠性、VPC私有网络隔离、内建多AZ、多地域容灾等能力,是云计算区别于传统IDC托管的核心价值。”
雁杨认为,选择云时首先需要注意云的弹性,弹性实质是规模业务扩容的冗余buffer的深度,只有靠规模上量才可能实现更深的池化buffer形成弹性能力,最终让不同企业客户业务错峰提供有效弹性。所以业务的规模是云计算的一大门槛,没有规模很难发挥云的弹性价值。当然,云服务器的各种场景基础支撑能力是绕不开的话题。企业要看云服务商的云服务器是否提供了支撑不同场景的丰富规格,以及这些不同规格特点的云服务器是否提供了清晰的性能承诺。在这样的前提下,企业才能根据业务场景对整体性能进行选型和搭配。总而言之,企业在选择云服务器前,需要理解自己业务场景各种对计算、存储和网络性能的诉求。ECS主页所标注的性能specification,不玩纸面指标,阿里云保障客户所见即所得能保障拿到的性能,并且把常见场景和选型做了推荐映射,相信这种透明度能够大幅度降低企业的选型和对比的困难,帮助消除不同规模企业的不同业务场景对搬迁上云的疑虑。
阿里云ECS企业产品线做到了稳定性和超高性能,在不同场景下都能提供最高性价比的选择。同时阿里云也一直在进步,这些技术红利会通过稳定性、性能、体验等方式反馈企业的信任。针对阿里云ECS的配置选择,ECS的主页枚举了大部分企业常见场景下最佳性价比的配置选型,企业可以根据场景来对计算、网络和存储的能力组合进行快速选型,客户可以用支持分钟付费的按量付费购买对应的机型,对使用场景进行性能的测试验证。
云服务器未来之势
利用特有的快速交付和弹性能力,让企业从原来全量为业务峰值准备计算力,过渡到贴合业务流量曲线准备计算力,从根本上提升资源利用率,这是“弹性”的核心也是云计算的魅力所在。未来,云服务器必然会因客户对计算、网络和存储需求的变化而进化。除了区域本身的扩展,中心区域和边缘区域的结合、在线离线的整体差异化成本模型、基于云服务器提供的PaaS/SaaS服务、新兴领域对异构计算细分市场的强力需求,这些都是云服务器发展可预见的趋势。
ECS作为IAAS的核心组件,除去提供基础的计算、存储和网络服务,其核心依然是稳定性、性能以及在各种场景下的最佳性价比。未来,阿里云ECS希望能够做到更丰富的弹性能力,帮助客户在各种财务和扩缩容场景上大幅度提高业务敏捷度并且降低成本。
对于本次云栖大会,雁杨表示初心依旧。在总结一年来技术上的进步之外,还会全面介绍新产品和新功能,并且对于常见架构在ECS上的性能调优、ECS超高稳定性和性能背后的技术故事等话题展开分享,借云栖大会这个绝佳的机会和客户一起碰撞,温故知新,共同进步。
云栖大会购票通道请戳这里!。
云栖大会报道: