专访阿里云雁杨:因需求而进化,ECS云服务器追求弹性极致

简介: 八月初,阿里云在企业级ECS发布会上进行了跑分测试,这也是云产品现场跑分的先驱。不同于传统手机、PC市场领域的常规动作,在云计算领域,稳定性、隔离性以及关键场景的性能表现实际上相差巨大。

编者按:10月11-14日,为期四天的2017杭州云栖大会(门票火热抢购中!)将再度在杭州云栖小镇起航,作为全球最具影响力的科技展会之一,本届大会将有不少阿里集团专家以及各企业行业领袖的精彩演讲。从今天开始,云栖社区将会对大会嘉宾做一系列专访,想了解嘉宾以及最新议题信息请关注“云栖大会”公众号。本期我们采访的是阿里巴巴资深技术专家雁杨,他将在10月的云栖大会·弹性计算企业线峰会上分享ECS的应用现状、技术解析以及云服务器未来的发展趋势。

近年来随着云计算如火如荼的发展,上云已经成为了所有企业的标配。但在国内鱼龙混杂的云服务市场下,云服务器的选型评估却是长期困扰着企业的难题。基于此,阿里云ECS一直坚持为不同行业及不同企业提供垂直实例产品,提高用户体验,有针对性的解决行业特色问题并且带来最优的性价比。本文中阿里云ECS产品负责人雁杨,将就云服务器的选择、业务迁移上云的经验分享等话题进行深度解答。


雁杨

ECS发展现状解读

和亚马逊一样,阿里云始于电商业务,其整体技术构筑在阿里集团10年的电商业务积淀之上。雁杨表示,作为国内最早对外开放的云服务器,ECS从开放至今已经历了三个里程碑。

2012年,阿里巴巴把整体基础设施能力通过云服务器开始对外服务。此时的整体配置是从xen虚拟化架构,千兆网络起步,最早一批对外服务的主要客户为站长和互联网小客户。在这期间,阿里云也经历了内部技术基础设施外部商业化的阵痛。由于xen架构、千兆网以及早期底层飞天虚拟化网络和存储技术的局限性,当时云服务器的整体IO和网络能力十分有限,主体就是原来的I型非IO优化实例系列。随着更多的中型互联网客户进驻,IO能力成为最大的制约因素,因此客户结构的变化开始推动阿里云在IO能力上进行进化。

2014年与2015年之交,阿里云的整体架构进化为KVM +万兆网络,并且引入了高效云盘和ssd云盘(ssd云盘能够到2万以上的IOPS),同时整体机型同步切换到Haswell,计算能力也得到了跨越式的提升。另一方面,整体的产品功能、运维稳定性方面也在逐步完善,这使得阿里云形成了对中型,大型客户初步的服务能力。但与此同时,随着大型企业客户的涌入,内部体量和客户结构又产生了进一步的变化。这些大型互联网企业对整体云服务的全方位可预期稳定性、可预期性能、整体拥有成本的要求更加苛刻,于是构建真正覆盖所有规模企业云服务器的能力是下一步的目标重点。

现在正属于非常关键的阶段,大规模的企业客户除了对绝对性能和成本上提出了更高的要求,他们更加看重线上持续可预期、稳定的全生命周期性能。消除性能的不可预期性有几个解决方法:一方面通过底层的调度算法优化来保证用户的云服务器能够获取稳定的性能;另一方面,新的企业线云服务器产品切实降低了资源复用率,在企业线上把绝对稳定的高计算力给到对可预期性能要求非常高的企业客户;除此之外,阿里云本身的计算、存储和网络性能都有非常大的提升。

“作为IAAS的核心组件,ECS实质上就是对IDC服务器、运维、管理自动化三个领域的整合”,雁杨认为,其准入门槛并不高,但想要做精、做好却并不容易。想要降低成本、提升稳定性、做到高性能并获得最佳体验,阿里云ECS希望针对传统IDC服务器托管领域的各种稳定性、性能、成本、运维等问题,日拱一卒而不断精进。

技术沉淀带来能力的质变

八月初,阿里云在企业级ECS发布会上进行了跑分测试,这也是云产品现场跑分的先驱。不同于传统手机、PC市场领域的常规动作,在云计算领域,稳定性、隔离性以及关键场景的性能表现实际上相差巨大。根据现场的跑分情况,阿里云新发布的企业级ECS产品系列在性能上明显优于竞争对手。

事实上,代表了中国云计算技术实力的阿里云同时也承载了国内大部分上云企业的业务,这也就导致了在不断高速技术创新的迭代下,阿里云还要求能够高效保障客户的稳定性。“积累是重点,云计算是资本技术双密集的产业,阿里云的先发优势让我们积累了非常强的、富有经验的核心技术团队”,雁杨提到,“坚持自研不走捷径,虽然投入会更大,但是只要坚持下来,对核心技术掌控力必然会发生质的变化。”

当然,在克服这些困难的同时,阿里也确实打造了非常高效的软件工程和线上迭代体系。相比友商同价位的产品,ECS的网络性能和存储IO性能是其的数倍。在网络性能上,阿里云的网络虚拟化技术一直是走自主研发的路线,所以有很深的人才积累和技术积累。实际上,阿里云已经将整个虚拟化的网络技术全部进行了重构,升级到了第二代Alibaba vSwitch技术,采用自主研发的网络协议栈和vSwitch技术比开源的对应实现在性能、规模以及运维各方面都有很大的优势。在存储IO性能上,ECS也超过了其他云服务厂商同类产品的水平,超高存储吞吐,低成本存储,高带宽,为大数据场景提供最佳的性价比。

对阿里云而言,最关键的产品核心性能经过多年的锻造,对比友商具有巨大的优势。让上云的企业明明白白选型,避免浪费每一分宝贵的IT预算,并且把云产品的透明度做好——这些是根本前提,也有利于客户、利于市场的良性竞争。

ECS的多维度衡量和选型

对于企业而言,云服务器的优劣需要从多维度衡量和选型。“云服务器的随开随得、按量付费弹性、宕机迁移、云盘n个9的数据可靠性、VPC私有网络隔离、内建多AZ、多地域容灾等能力,是云计算区别于传统IDC托管的核心价值。”

雁杨认为,选择云时首先需要注意云的弹性,弹性实质是规模业务扩容的冗余buffer的深度,只有靠规模上量才可能实现更深的池化buffer形成弹性能力,最终让不同企业客户业务错峰提供有效弹性。所以业务的规模是云计算的一大门槛,没有规模很难发挥云的弹性价值。当然,云服务器的各种场景基础支撑能力是绕不开的话题。企业要看云服务商的云服务器是否提供了支撑不同场景的丰富规格,以及这些不同规格特点的云服务器是否提供了清晰的性能承诺。在这样的前提下,企业才能根据业务场景对整体性能进行选型和搭配。总而言之,企业在选择云服务器前,需要理解自己业务场景各种对计算、存储和网络性能的诉求。ECS主页所标注的性能specification,不玩纸面指标,阿里云保障客户所见即所得能保障拿到的性能,并且把常见场景和选型做了推荐映射,相信这种透明度能够大幅度降低企业的选型和对比的困难,帮助消除不同规模企业的不同业务场景对搬迁上云的疑虑。


阿里云ECS企业产品线做到了稳定性和超高性能,在不同场景下都能提供最高性价比的选择。同时阿里云也一直在进步,这些技术红利会通过稳定性、性能、体验等方式反馈企业的信任。针对阿里云ECS的配置选择,ECS的主页枚举了大部分企业常见场景下最佳性价比的配置选型,企业可以根据场景来对计算、网络和存储的能力组合进行快速选型,客户可以用支持分钟付费的按量付费购买对应的机型,对使用场景进行性能的测试验证。

云服务器未来之势

利用特有的快速交付和弹性能力,让企业从原来全量为业务峰值准备计算力,过渡到贴合业务流量曲线准备计算力,从根本上提升资源利用率,这是“弹性”的核心也是云计算的魅力所在。未来,云服务器必然会因客户对计算、网络和存储需求的变化而进化。除了区域本身的扩展,中心区域和边缘区域的结合、在线离线的整体差异化成本模型、基于云服务器提供的PaaS/SaaS服务、新兴领域对异构计算细分市场的强力需求,这些都是云服务器发展可预见的趋势。

ECS作为IAAS的核心组件,除去提供基础的计算、存储和网络服务,其核心依然是稳定性、性能以及在各种场景下的最佳性价比。未来,阿里云ECS希望能够做到更丰富的弹性能力,帮助客户在各种财务和扩缩容场景上大幅度提高业务敏捷度并且降低成本。

对于本次云栖大会,雁杨表示初心依旧。在总结一年来技术上的进步之外,还会全面介绍新产品和新功能,并且对于常见架构在ECS上的性能调优、ECS超高稳定性和性能背后的技术故事等话题展开分享,借云栖大会这个绝佳的机会和客户一起碰撞,温故知新,共同进步。

云栖大会购票通道请戳这里

云栖大会报道:

安全人工智能应用之我见:时代“风口”的交叉点

专访新浪微博黄波:千人千面,机器学习赋能用户信息流消费

专访iDST NLP负责人——淘宝内容搜索、评价归纳的幕后英雄

专访阿里云易立:从实践积累到需求沉淀,容器技术必将引领主流

专访阿里云异构计算负责人:异构计算,GPU、FPGA、ASIC芯片将三分天下

专访阿里云量子技术首席科学家施尧耘:量子计算前途辉煌而任重道远


云栖大会变迁史(2009-2017)
图说历届云栖大会精彩内容(长图鉴赏)

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
19天前
|
人工智能 弹性计算 编解码
阿里云GPU云服务器性能、应用场景及收费标准和活动价格参考
GPU云服务器作为阿里云提供的一种高性能计算服务,通过结合GPU与CPU的计算能力,为用户在人工智能、高性能计算等领域提供了强大的支持。其具备覆盖范围广、超强计算能力、网络性能出色等优势,且计费方式灵活多样,能够满足不同用户的需求。目前用户购买阿里云gpu云服务器gn5 规格族(P100-16G)、gn6i 规格族(T4-16G)、gn6v 规格族(V100-16G)有优惠,本文为大家详细介绍阿里云gpu云服务器的相关性能及收费标准与最新活动价格情况,以供参考和选择。
|
25天前
|
机器学习/深度学习 人工智能 弹性计算
什么是阿里云GPU云服务器?GPU服务器优势、使用和租赁费用整理
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等多种场景。作为亚太领先的云服务提供商,阿里云的GPU云服务器具备灵活的资源配置、高安全性和易用性,支持多种计费模式,帮助企业高效应对计算密集型任务。
|
26天前
|
存储 分布式计算 固态存储
阿里云2核16G、4核32G、8核64G配置云服务器租用收费标准与活动价格参考
2核16G、8核64G、4核32G配置的云服务器处理器与内存比为1:8,这种配比的云服务器一般适用于数据分析与挖掘,Hadoop、Spark集群和数据库,缓存等内存密集型场景,因此,多为企业级用户选择。目前2核16G配置按量收费最低收费标准为0.54元/小时,按月租用标准收费标准为260.44元/1个月。4核32G配置的阿里云服务器按量收费标准最低为1.08元/小时,按月租用标准收费标准为520.88元/1个月。8核64G配置的阿里云服务器按量收费标准最低为2.17元/小时,按月租用标准收费标准为1041.77元/1个月。本文介绍这些配置的最新租用收费标准与活动价格情况,以供参考。
|
24天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU服务器全解析_GPU价格收费标准_GPU优势和使用说明
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等场景。作为亚太领先的云服务商,阿里云GPU云服务器具备高灵活性、易用性、容灾备份、安全性和成本效益,支持多种实例规格,满足不同业务需求。
156 2
|
1月前
|
弹性计算
阿里云2核16G服务器多少钱一年?亲测价格查询1个月和1小时收费标准
阿里云2核16G服务器提供多种ECS实例规格,内存型r8i实例1年6折优惠价为1901元,按月收费334.19元,按小时收费0.696221元。更多规格及详细报价请访问阿里云ECS页面。
67 9
|
29天前
|
监控 Ubuntu Linux
使用VSCode通过SSH远程登录阿里云Linux服务器异常崩溃
通过 VSCode 的 Remote - SSH 插件远程连接阿里云 Ubuntu 22 服务器时,会因高 CPU 使用率导致连接断开。经排查发现,VSCode 连接根目录 ".." 时会频繁调用"rg"(ripgrep)进行文件搜索,导致 CPU 负载过高。解决方法是将连接目录改为"root"(或其他具体的路径),避免不必要的文件检索,从而恢复正常连接。
|
1月前
|
弹性计算 异构计算
2024年阿里云GPU服务器多少钱1小时?亲测价格查询方法
2024年阿里云GPU服务器每小时收费因实例规格不同而异。可通过阿里云GPU服务器页面选择“按量付费”查看具体价格。例如,NVIDIA A100的gn7e实例为34.742元/小时,NVIDIA A10的gn7i实例为12.710156元/小时。更多详情请访问阿里云官网。
93 2
|
1月前
|
存储 弹性计算 NoSQL
"从入门到实践,全方位解析云服务器ECS的秘密——手把手教你轻松驾驭阿里云的强大计算力!"
【10月更文挑战第23天】云服务器ECS(Elastic Compute Service)是阿里云提供的基础云计算服务,允许用户在云端租用和管理虚拟服务器。ECS具有弹性伸缩、按需付费、简单易用等特点,适用于网站托管、数据库部署、大数据分析等多种场景。本文介绍ECS的基本概念、使用场景及快速上手指南。
77 3
|
29天前
|
弹性计算
阿里云2核16G云服务器多少钱?亲测ECS内存型r8i租赁价格
阿里云2核16G云服务器,内存型r8i实例1年6折优惠后价格为1901元,月付334.19元,按小时计费0.696221元。更多配置及优惠详情,请访问阿里云ECS页面。
|
1月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
114 0