云计算的未来在哪?破解亚马逊云科技增长神话(2)

本文涉及的产品
函数计算FC,每月15万CU 3个月
简介: 云计算的未来在哪?破解亚马逊云科技增长神话

4)抢占式实例--共享资源新范式

B2B 共享资源的新范式,闲置资源拍卖

使用 Amazon EC2 Spot 实例,可以请求 Amazon EC2 备用计算容量,与按需实例的价格相比,这类实例最多可以节省 90% 的成本。

image.png

计算过去 30 天内与按需相比节省的费用

中断频率表示 Spot 在过去一个月间回收容量的比率。

过去按量售卖,客户峰谷会非常多,削峰填谷非常难调度,导致经常有 30-40% 的限制,采用 spot 方式,可以低价抢占剩余资源。

实际上有不少做算力的公司把这种空余资源低价买入,分发给需要计算的客户;比如并行计算类似玩家,二次售卖 HPC 业务。

5)手中无剑--开创无服务器新赛道

一个做云服务器起家的服务商,竟然开启了无服务器新赛道。顶级高手追求手中无剑,心中有剑的层次。

基础设施无论怎么按量、弹性的方式使用资源,让人有 scale-out 水位,一般应用工作水位 30%,启动扩容的水位是 50-70%,缩容更加谨慎,需要等实例内的最后一个客户服务结束。

开创性地发布产品 Amazon Lambda,完全按照业务负载付费,把资源占用和浪费压缩到 0。

image.png

Amazon Lambda 费用=计算时间+请求次数+内存+存储+并发。

image.png

咱们看一个官方案例,一个具备峰谷特点的外卖订餐系统;每月处理 300 万个请求。函数计算实现执行时间为 120 ms,每次内存 1536 MB。扣掉 100 万免费额度,一个月下来才 20 美元;

当然,Serverless 还不是万能的,仅支持脚本语言、启动慢(50ms+)、有调用限制。

6)自动省钱的 Amazon S3

Amazon S3 是对象存储,是亚马逊云科技营收最大的存储产品。从开发中角度,数据在产生之时,并不知道未来如何使用,未来算冷还是热数据。而 Amazon S3 存储提供了冷热自动分级,超过 90 天不用,可以自动降级;

我想问一个问题,这么主动帮客户省钱,PD 不用承担营收 KPI 吗?

设计一个产品尽量从客户那儿多收钱,这才是职业化的 PD 。

image.png

Amazon S3 不只是一个产品,而是一个系列,有多种热度和性能的存续范式。

image.png

Amazon S3 的产品价格随着用量增加,单价下降。按照我的期待,容量达到 PB 后应该继续降价。后面应该留给了销售去申请折扣。

image.png

美中不足的是,Amazon S3 的收费复杂度,由六大成本组成:存储定价、请求和数据检索定价、数据传输和传输加速定价、数据管理和分析定价、复制定价以及使用Amazon S3 Object Lambda 处理数据的价格。

如何选择趁手兵器--购买方式总结

大胆设想,目前大客户还是有额外折扣的,有额外议价空间,未来的产业互联网,按照采购量自动生成阶梯折扣,更加透明,期待有云厂商早日迈出这一步。

image.png

image.png

主动帮助客户省钱,这也许是敢于用按量收费,而且客户粘性越来越强的原因。

成本管理和优化工具的七种武器

好的产品设计要对财务友好,企业IT部门每年都有降本 KPI。亚马逊云科技有如此多的工具组合,功能强大,很多账单还可以导出 excel,二次架构处理。

丰富的工具包:

a.Amazon Pricing Calculator 在亚马逊云科技中国区域估算云使用成本

b.产品内置:购买界面内置多种选项建议,比如 Saving Plan,输入需求,自动给出建议。

c.云上财务管理 (CFM) 使组织能够调整其流程以实现最大的业务价值和财务成功,同时优化亚马逊云科技上的成本。

d.Amazon Cost Explorer 查看和分析您的成本和使用情况。该工具提供默认报告,可帮助您直观地查看成本和使用情况(例如账户,服务)或资源级别(例如 Amazon EC2 实例 ID)

e.Amazon Trusted Advisor,这是一种线上工具,可帮助您按照最佳实践在五个方面配置资源:成本优化、性能、安全性、容错和限制。建议定期使用 Amazon Trusted Advisor 以最佳方式维护您的解决方案。

f.Amazon Compute Optimizer 会为您的工作负载推荐最佳实例种类及規格大小,以降低成本并提高性能,并使用机器学习来分析历史利用率指标。过度配置资源会导致不必要的基础设施成本,而资源不足会导致应用程序性能不佳。帮助您根据您的利用率数据为三种类型的资源选择最佳配置:Amazon EC2 、Amazon EBS 、Amazon Lambda。

g.Amazon QuickSight 成本可视化方案

技术创新围绕客户价值

自底向上的基础技术创新-芯片

亚马逊云深耕客户 IT 多年,为云原生场景设计芯片,从减少虚拟化损耗开始,逐步接管客户通用负载、ML 负载:

Amazon Nitro:就是支持虚拟化的智能网卡,带火了 DPU 概念。快速创新,性能让利给客户

Amazon Graviton:基于 ARM 架构的 CPU,如今已经发展到可以在生态、性能方面赶超 x86的水平。

Amazon Trainum 和 Amazon Inferentia:分别是 ML 的训练和推理芯片,对比 NVIDIA GPU 性价比更高。

image.png

Amazon Nitro 加速应用性能

亚马逊云科技早在 2006 年就推出了 Amazon EC2 虚拟主机服务,早期可用的虚拟化技术只有 VMware 商业软件和开源的只有 Xen 技术,KVM 刚刚诞生还未成熟。

Xen 的虚拟化采用全虚拟化技术,也就是靠软件虚拟出内存、IO、外设等设备,CPU 性能损耗达 20-30%,主流云服务商都切换到了 KVM,2013 年收购了 Annapurna labs。还在忍受低效的老技术。被 VM 性能吊打两年后,终于在 2017 年发布了Amazon Nitro 和 Amazon Nitro hypervisor,实现优化虚拟化负载。

表-Amazon EC2 Virtualization Types

image.png

过去 KVM 软件虚拟化虽然实现了 SRIOV,但是 vNIC、vBlock 设备还是需要大量内核来处理设备 IO,与应用负载争抢 CPU 资源。负载的比例大概 10-20%。采用 Amazon Nitro 硬件虚拟化技术帮客户应用实现性能提升,同时意味着降低资源需求,降低成本:

Memcahed:Amazon Nitro 领先 9-26%

Nginx:领先 11-20%

MySQL:领先 6%

image.png

Amazon Nitro SSD 优化存储时延:从 0.08ms 降低到 0.02ms;数据库、ML 需要更低时延提升应用响应速度。过去应该采用商用方案,现在 Amazon Nitro 加速,实现 SSD 虚拟化,统一监控和管理,且降低时延。

image.png

Amazon EC2快速推出新实例

亚马逊云科技主要以服务形式提供给客户,后台技术迭代,客户不需要感知,一个产品系列类型可以收敛到 1-3 个形态。但计算产品不同,客户的应用会感知到 CPU 平台的差异,不同应用也有不同的需求,这导致 Amazon EC2 产品实例系列快速爆炸,比如 CPU 分为 Intel、AMD、ARM,内存分为1:2、1:4、1:8 和 1:16,加速器分为推理、训练、FPGA、媒体转码,此外还有 IO 增强,如网络增强、本地盘等形态。几种组合,每一代有数十种硬件架构形态。亚马逊云科技可以快速推出新实例,得益于Amazon Nitro 实现了虚拟化卸载。

自研 Amazon Graviton-高性能低价格

随着 Intel 这几年挤牙膏,服务器处理器的性价比提升放缓,尤其是能耗快速增长。亚马逊云科技推出 ARM 处理器 Amazon Graviton 2 和 3 系列。

最近分析 ARM 技术,推测应该采用的是 Nerverous V1 架构,代号 Zeus,比 N1 核性能提高 50%(实际 SVE 提升更大)

创新的云原生芯片设计理念:

  • 性能:单核内存带宽和时延
  • ML:BF16 和 INT8 方面遥遥领先
  • 能耗:功耗是 ARM 强项,效率比 x86 优 60%
  • 放弃:随着核心增加 NUMA 作为独木桥,越来越影响性能,干脆放弃NUMA
  • 场景:单 core 性能强劲,HPC、媒体转码场景具备优势;

Amazon Graviton 3 比 G2 增加 200 亿晶体管;但是处理器主频不增加,核数没变,推测战略定位如下:

  • 性能战略:选择了 V1 架构,意味着走了性能路线,主打 ML 和 HPC
  • 成本更高:Amazon Graviton 3 仅 64core,相比较而言行业其他处理器的核密度更高,Ampere AltraMax、Yitian、NVIDIA 分别是 128core 和 144core(2chips)
  • 让利客户:Amazon G3 实例 C7g 定价只比上一代 Amazon G2 提高 5%;5nm 500 亿晶体管,比7nm 300 亿晶体管成本预计翻倍。

ML芯片赋能AI场景

  • 成本降低 70%
  • Alex 都已经转到 Inf1 实例
  • 成本降低 35%
  • 吞吐提升 2.3 倍

image.png

EFA 支持 SRD 协议,帮助客户优化 HPC、ML 并行能力,减少 TCP 通信开销占比。

image.png

云上创新技术赋能业务

AI 赋能业务

CTO 格言:每一行代码都是业务逻辑。从 OPPO 案例可以看到,采用云上 Amazon EC2-Inf1,快速构建语音助手的案例。

image.png

智能运维

亚马逊云科技利用自身电商积累的经验,通过亚马逊云科技云服务帮助客户运维。包括对事件的分析、响应进行的机器学习.比如 trusted advisor,为客户提供超过 5000 万智能运维推荐。根据 Amazon 电商积累的经验,输出给客户,此外还有 IEM 等工具。

image.png

数据价值

数据为客户创造这块儿也很精彩,可以让只懂 SQL 的人玩转 AI。先不做详述,我把回放链接放在文末,感兴趣可以了解下。

数据服务提供:

冷热数据快速恢复

数据备份、安全

Amazon S3-redshift,打通湖与仓

数据安全,审计策略

用 SQL 实现 ML 创新

image.png

思考和启发

因为价值所以选择

通过为客户节约成本,创造业务价值,让亚马逊云科技受到全球用户欢迎。另外,云计算消耗占半壁江山的互联网企业,告别内卷奔赴全球化是 2022 年主题,全球化需要强大的安全、合规特性产品能力,需要全球网络。因此国内企业出海纷纷选择亚马逊云科技。

根据统计报告,虽然在国内市场亚马逊云科技只占 6%,但加上中国企业出海份额占到了 26%,足以说明亚马逊云科技强大的竞争力和客户粘性。


image.png

image.png

亚马逊云科技的秘籍你能学会吗

IT 服务商存在的意义就是为客户创造价值。最后我提几个问题,你的企业文化真的是客户第一吗?今年营收 KPI 和客户粘性需要牺牲一个,你怎么选择?

破解了云计算增长之谜,亚马逊云科技的产品之道,你能学会吗?

(完)码字不易,请点赞支持

前文说过,很多地方本文没有探究,爱好技术的喜欢刨根问底,附一个回放入口自己去看。

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
2月前
|
存储 边缘计算 人工智能
解密云计算:未来科技的基石
【10月更文挑战第6天】解密云计算:未来科技的基石
62 0
|
7月前
|
机器学习/深度学习 人工智能 API
|
7月前
|
存储 人工智能 vr&ar
未来科技中的云计算之路
未来科技中的云计算之路
86 0
|
7月前
|
人工智能 前端开发 云计算
构建未来:云计算 & 生成式 AI 诞生科技新局面
构建未来:云计算 & 生成式 AI 诞生科技新局面
|
存储 网络安全 定位技术
探秘亚马逊云科技海外服务器 | 解析跨境云计算的前沿技术与应用
海外服务器也称境外服务器。主要是指除中国大陆以外的其他国家和地区的服务器,海外服务器 其实是一个统称,包括了全球各地的服务器 例如:日本服务器,韩国服务器、美国服务器、德国服务器。
577 0
|
存储 Devops 测试技术
【云计算】打破神话:容器vs虚拟机
【云计算】打破神话:容器vs虚拟机
|
存储 人工智能 缓存
《达摩院2023十大科技趋势》——产业革新——软硬融合云计算体系架构
《达摩院2023十大科技趋势》——产业革新——软硬融合云计算体系架构
246 0