【杭州云栖】弹性计算平台技术:云服务器“安全”“稳定”“弹性”的基石

简介: 2018杭州云栖大会,弹性计算平台技术专场精彩回顾

9月19日上午9点,杭州云栖小镇E1-3会场,2018年杭州云栖大会弹性计算平台技术专场拉开帷幕。

___px_2018_09_25
弹性计算系列产品是云时代的基石产品之一,一直备受外界关注。作为弹性计算团队在本届云栖大会的开场大戏,平台技术专场吸引了超过200位与会嘉宾,现场座无虚席。为了让更多的朋友快速了解这场技术盛宴,小编现在带你快速回顾一下专场的精彩片段。

全场景覆盖,面向未来的弹性计算

首先,阿里云研究员,弹性计算负责人余锋,做了精彩的开场演讲。余锋说,阿里云弹性计算团队的服务能力正在从中小企业客户到大型企业全计算场景覆盖的方向演进,不但覆盖通用CPU场景,也有GPU,FPGA等等异构场景,另外弹性计算团队也在存储,网络等方面不断扩展能力边界。

A13A2639
此外,团队正在持续打磨产品的稳定性和服务质量,在企业生态配接上做出努力。弹性计算团队正在通过强化对于硬件服务器的管控能力,对操作系统的定制能力,和对故障隔离能力等等多个维度提升客户对稳定性的体验,宕机率大大降低,在业界遥遥领先。

另外,弹性计算团队也正在通过弹性容器实例,为用户提供更轻,更快,秒级计费,同时兼顾安全和生态的全新服务,为更多的客户量身打造更高性价比,更合适的计算服务。

深入合作,一起探讨云计算的未来

来自英特尔开源技术中心的网络与存储研发经理王庆先生首先带来议题:关于当代云计算的方向展望。将云计算和通信,人工智能,边缘计算等等热点领域的关系进行了深入梳理,并挖掘了相关的技术方向。

A13A2651

明星产品,重磅发布

随后,阿里云高级产品专家倪波,代表弹性计算团队带来了最新的产品更新。在块存储产品领域,倪波宣布IOPS达到百万级的全新一代超高性能云盘ESSD即将全面商业化。

同时,作为新一代异构计算的代表产品,最新的GN6V和F3实例正在全面商业化推进中。GN6V实例搭载NVIDIA Volta架构的Tesla V100计算卡,相对于上一代产品可以提供12倍的运算能力提升。而基于阿里云FaaS(FPGA as a service)舜天平台的F3实例对比上一代产品,逻辑容量增加4倍,DSP能力提升8倍。

A13A2725

议题还介绍了无限制T5实例,该实例可以在传统T5实例积分耗完后,让用户能够继续按需使用付费,从而保持计算性能的持续性。

该议题的最后,弹性计算团队重磅发布了弹性容器实例ECI (Elastic Container Instance)。ECI作为弹性计算在Severless领域的创新产品,具备以下四大特点:极速交付,极小资源,全面兼容K8S,用户只需专注业务。

保持和学术界的无缝对接

弹性计算团队一直和学术界保持无缝对接,对于新技术,新理论一直高度关注。论坛也邀请了华南理工大学的林伟伟教授,详细分享了“面向异构云服务器的能耗模型和能耗测算系统研究”的议题。

A13A2782

该技术在应用后,可以作为云服务器的功耗测算工具,为新服务器功耗模型提供评测功能,也可以为服务器能耗优化调度提供技术支撑和基础平台。同时,基于功耗模型可以给出峰值能效感知的虚拟机调度策略,并以此作为调度的参考信息之一,可以实现对云数据中心更为有效的节能调度。

云服务器测试怎么做到有意义?

阿里云高级技术专家钱超,分享了“怎样有意义地测试云服务器性能”。

A13A2849

钱超从多个角度和指标来阐述了性能测试。钱超指出性能,稳定,时延是互相影响的,脱离另两个只讲其一是不全面的。同时在测试时,需要结合客观条件来对比结果(比如CPU是否PIN住,操作系统的影响等等)。议题客观,实用,现场观众反应热烈。

弹性计算的极致稳定

接着性能测试的议题,阿里云高级技术专家郑旭东分享了关于产品稳定性的议题:“数据,智能,驱动ECS极致稳定”。议题从智能异常调度,健康巡检,强大的分析和预测系统等角度,全面立体地呈现了弹性计算团队在达到极致稳定性上所做的努力。

A13A2933
弹性计算团队借助阿里巴巴强大的基础设施,重构建立了覆盖全生命周期,全链路,全类型的4大类,11小类,同时具有上千项监控细节的监控系统,每天光监控数据都有几十TB。另外,利用人工智能技术做出精准预测,帮助快速发现业务异常和系统隐患。弹性计算正在利用数据,智能,异常调度,客户侧运维形成强大的闭环,随着闭环上数据的积累,可以真正将稳定性做到极致。

首次揭秘:弹性计算调度系统 - 后羿

随后,弹性计算首席架构师,阿里云资深技术专家蔡俊杰,和阿里云高级技术专家徐海弘共同为来宾解密了弹性计算的幕后英雄 – 后羿调度系统。

A13A3008
议题指出,弹性计算调度系统正在从稳定性,性能,成本,和弹性四个方面影响产品。弹性计算调度系统需要管理全球50多个区域的资源,单可用区可以在3分钟内创建一千个以上的虚拟机,每天需要管理的虚拟机数量是在百万级别的。另外,调度系统不仅仅是虚拟机的调度,甚至还包括服务器的采购,机房规划,资源的使用分配都会被纳入闭环,端到端地实现产业优化。

A13A3076
议题还揭秘了弹性计算调度系统的三大层次,和四大核心组件,并且从场景角度切入进行了详细立体的剖析。

主动运维:赋能业务永续

阿里云高级产品专家张鹏程带来了关于主动运维的议题。

A13A3126
议题强调,基于ECS主动运维能力,用户从高可用架构设计开始,将主动运维的思想贯穿于各个基础运维环节。借助云助手、弹性伸缩、系统事件等服务和功能实现开放、弹性、透明体验,建立适合自身业务规模和技术路线的主动运维体系,赋能业务永续运行。

资源编排,弹性伸缩,带来高可用和低成本

最后,阿里云资深技术专家田涛涛带来议题:基于资源编排和弹性伸缩构建高可用低成本的应用。

A13A3141
田涛涛详细介绍了资源编排的使用场景。使用资源编排,实现自动化复制和交付,可以让基础设施更加高可用。结合弹性伸缩,自动保障业务的永续性和可靠性。另外结合抢占式实例和停机不收费模式,切实实现成本和弹性需求的完美结合。

阿里云弹性计算团队,让计算无处不在。
更多的云栖大会咨询,请参见下方链接。
【杭州云栖】异构计算:软硬件结合全栈助力AI大爆发

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
3天前
|
存储 监控 固态存储
【vSAN分布式存储服务器数据恢复】VMware vSphere vSAN 分布式存储虚拟化平台VMDK文件1KB问题数据恢复案例
在一例vSAN分布式存储故障中,因替换故障闪存盘后磁盘组失效,一台采用RAID0策略且未使用置备的虚拟机VMDK文件受损,仅余1KB大小。经分析发现,该VMDK文件与内部虚拟对象关联失效导致。恢复方案包括定位虚拟对象及组件的具体物理位置,解析分配空间,并手动重组RAID0结构以恢复数据。此案例强调了深入理解vSAN分布式存储机制的重要性,以及定制化数据恢复方案的有效性。
17 5
|
3天前
|
API Windows
揭秘网络通信的魔法:Win32多线程技术如何让服务器化身超级英雄,同时与成千上万客户端对话!
【8月更文挑战第16天】在网络编程中,客户/服务器模型让客户端向服务器发送请求并接收响应。Win32 API支持在Windows上构建此类应用。首先要初始化网络环境并通过`socket`函数创建套接字。服务器需绑定地址和端口,使用`bind`和`listen`函数准备接收连接。对每个客户端调用`accept`函数并在新线程中处理。客户端则通过`connect`建立连接,双方可通过`send`和`recv`交换数据。多线程提升服务器处理能力,确保高效响应。
15 6
|
26天前
|
存储 弹性计算 运维
可观测性体系问题之ECS管控的metric数据存储对安全合规的考虑如何解决
可观测性体系问题之ECS管控的metric数据存储对安全合规的考虑如何解决
17 4
|
3天前
|
Cloud Native 安全 云计算
云原生技术的未来:探索服务网格和无服务器架构
随着企业数字化转型的深入,云计算已成为推动业务创新的核心力量。本文将深入探讨云原生技术的最新发展趋势,重点分析服务网格和无服务器架构如何重塑云计算的未来。通过实际案例和技术解析,揭示这些前沿技术如何解决现代应用部署的复杂性,提高系统的可伸缩性和弹性。文章旨在为读者提供云原生领域的深度见解,并激发对云技术未来发展的思考。
11 0
|
26天前
|
弹性计算 运维 监控
可观测性体系问题之实现告警的自愈如何解决
可观测性体系问题之实现告警的自愈如何解决
26 1
|
21天前
|
机器学习/深度学习 SQL 人工智能
人工智能平台PAI使用问题之如何在阿里云服务器上搭建自己的人工智能
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
21天前
|
机器学习/深度学习 存储 SQL
人工智能平台PAI使用问题之如何快速搭建一个能够进行视图计算的服务器
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
22天前
|
安全 网络安全 虚拟化
云服务器:构建现代数字基础设施的基石
云服务器不仅改变了企业和个人获取计算资源的方式,也为数字化转型提供了强大的支撑。通过深入了解云服务器的特点和优势,我们可以更好地利用这一技术来推动业务发展和创新。在未来,随着云计算技术的不断创新和完善,云服务器将会发挥更加重要的作用,成为构建现代化数字基础设施不可或缺的一部分。
|
26天前
|
弹性计算 调度
可观测性体系问题之ECS管控的Dashboard分层如何解决
可观测性体系问题之ECS管控的Dashboard分层如何解决
27 0
|
3天前
|
机器学习/深度学习 编解码 人工智能
阿里云gpu云服务器租用价格:最新收费标准与活动价格及热门实例解析
随着人工智能、大数据和深度学习等领域的快速发展,GPU服务器的需求日益增长。阿里云的GPU服务器凭借强大的计算能力和灵活的资源配置,成为众多用户的首选。很多用户比较关心gpu云服务器的收费标准与活动价格情况,目前计算型gn6v实例云服务器一周价格为2138.27元/1周起,月付价格为3830.00元/1个月起;计算型gn7i实例云服务器一周价格为1793.30元/1周起,月付价格为3213.99元/1个月起;计算型 gn6i实例云服务器一周价格为942.11元/1周起,月付价格为1694.00元/1个月起。本文为大家整理汇总了gpu云服务器的最新收费标准与活动价格情况,以供参考。
阿里云gpu云服务器租用价格:最新收费标准与活动价格及热门实例解析

相关产品

  • 云服务器 ECS