4)抢占式实例--共享资源新范式
B2B 共享资源的新范式,闲置资源拍卖
使用 Amazon EC2 Spot 实例,可以请求 Amazon EC2 备用计算容量,与按需实例的价格相比,这类实例最多可以节省 90% 的成本。
计算过去 30 天内与按需相比节省的费用
中断频率表示 Spot 在过去一个月间回收容量的比率。
过去按量售卖,客户峰谷会非常多,削峰填谷非常难调度,导致经常有 30-40% 的限制,采用 spot 方式,可以低价抢占剩余资源。
实际上有不少做算力的公司把这种空余资源低价买入,分发给需要计算的客户;比如并行计算类似玩家,二次售卖 HPC 业务。
5)手中无剑--开创无服务器新赛道
一个做云服务器起家的服务商,竟然开启了无服务器新赛道。顶级高手追求手中无剑,心中有剑的层次。
基础设施无论怎么按量、弹性的方式使用资源,让人有 scale-out 水位,一般应用工作水位 30%,启动扩容的水位是 50-70%,缩容更加谨慎,需要等实例内的最后一个客户服务结束。
开创性地发布产品 Amazon Lambda,完全按照业务负载付费,把资源占用和浪费压缩到 0。
Amazon Lambda 费用=计算时间+请求次数+内存+存储+并发。
咱们看一个官方案例,一个具备峰谷特点的外卖订餐系统;每月处理 300 万个请求。函数计算实现执行时间为 120 ms,每次内存 1536 MB。扣掉 100 万免费额度,一个月下来才 20 美元;
当然,Serverless 还不是万能的,仅支持脚本语言、启动慢(50ms+)、有调用限制。
6)自动省钱的 Amazon S3
Amazon S3 是对象存储,是亚马逊云科技营收最大的存储产品。从开发中角度,数据在产生之时,并不知道未来如何使用,未来算冷还是热数据。而 Amazon S3 存储提供了冷热自动分级,超过 90 天不用,可以自动降级;
我想问一个问题,这么主动帮客户省钱,PD 不用承担营收 KPI 吗?
设计一个产品尽量从客户那儿多收钱,这才是职业化的 PD 。
Amazon S3 不只是一个产品,而是一个系列,有多种热度和性能的存续范式。
Amazon S3 的产品价格随着用量增加,单价下降。按照我的期待,容量达到 PB 后应该继续降价。后面应该留给了销售去申请折扣。
美中不足的是,Amazon S3 的收费复杂度,由六大成本组成:存储定价、请求和数据检索定价、数据传输和传输加速定价、数据管理和分析定价、复制定价以及使用Amazon S3 Object Lambda 处理数据的价格。
如何选择趁手兵器--购买方式总结
大胆设想,目前大客户还是有额外折扣的,有额外议价空间,未来的产业互联网,按照采购量自动生成阶梯折扣,更加透明,期待有云厂商早日迈出这一步。
主动帮助客户省钱,这也许是敢于用按量收费,而且客户粘性越来越强的原因。
成本管理和优化工具的七种武器
好的产品设计要对财务友好,企业IT部门每年都有降本 KPI。亚马逊云科技有如此多的工具组合,功能强大,很多账单还可以导出 excel,二次架构处理。
丰富的工具包:
a.Amazon Pricing Calculator 在亚马逊云科技中国区域估算云使用成本
b.产品内置:购买界面内置多种选项建议,比如 Saving Plan,输入需求,自动给出建议。
c.云上财务管理 (CFM) 使组织能够调整其流程以实现最大的业务价值和财务成功,同时优化亚马逊云科技上的成本。
d.Amazon Cost Explorer 查看和分析您的成本和使用情况。该工具提供默认报告,可帮助您直观地查看成本和使用情况(例如账户,服务)或资源级别(例如 Amazon EC2 实例 ID)
e.Amazon Trusted Advisor,这是一种线上工具,可帮助您按照最佳实践在五个方面配置资源:成本优化、性能、安全性、容错和限制。建议定期使用 Amazon Trusted Advisor 以最佳方式维护您的解决方案。
f.Amazon Compute Optimizer 会为您的工作负载推荐最佳实例种类及規格大小,以降低成本并提高性能,并使用机器学习来分析历史利用率指标。过度配置资源会导致不必要的基础设施成本,而资源不足会导致应用程序性能不佳。帮助您根据您的利用率数据为三种类型的资源选择最佳配置:Amazon EC2 、Amazon EBS 、Amazon Lambda。
g.Amazon QuickSight 成本可视化方案
技术创新围绕客户价值
自底向上的基础技术创新-芯片
亚马逊云深耕客户 IT 多年,为云原生场景设计芯片,从减少虚拟化损耗开始,逐步接管客户通用负载、ML 负载:
Amazon Nitro:就是支持虚拟化的智能网卡,带火了 DPU 概念。快速创新,性能让利给客户
Amazon Graviton:基于 ARM 架构的 CPU,如今已经发展到可以在生态、性能方面赶超 x86的水平。
Amazon Trainum 和 Amazon Inferentia:分别是 ML 的训练和推理芯片,对比 NVIDIA GPU 性价比更高。
Amazon Nitro 加速应用性能
亚马逊云科技早在 2006 年就推出了 Amazon EC2 虚拟主机服务,早期可用的虚拟化技术只有 VMware 商业软件和开源的只有 Xen 技术,KVM 刚刚诞生还未成熟。
Xen 的虚拟化采用全虚拟化技术,也就是靠软件虚拟出内存、IO、外设等设备,CPU 性能损耗达 20-30%,主流云服务商都切换到了 KVM,2013 年收购了 Annapurna labs。还在忍受低效的老技术。被 VM 性能吊打两年后,终于在 2017 年发布了Amazon Nitro 和 Amazon Nitro hypervisor,实现优化虚拟化负载。
表-Amazon EC2 Virtualization Types
过去 KVM 软件虚拟化虽然实现了 SRIOV,但是 vNIC、vBlock 设备还是需要大量内核来处理设备 IO,与应用负载争抢 CPU 资源。负载的比例大概 10-20%。采用 Amazon Nitro 硬件虚拟化技术帮客户应用实现性能提升,同时意味着降低资源需求,降低成本:
Memcahed:Amazon Nitro 领先 9-26%
Nginx:领先 11-20%
MySQL:领先 6%
Amazon Nitro SSD 优化存储时延:从 0.08ms 降低到 0.02ms;数据库、ML 需要更低时延提升应用响应速度。过去应该采用商用方案,现在 Amazon Nitro 加速,实现 SSD 虚拟化,统一监控和管理,且降低时延。
Amazon EC2快速推出新实例
亚马逊云科技主要以服务形式提供给客户,后台技术迭代,客户不需要感知,一个产品系列类型可以收敛到 1-3 个形态。但计算产品不同,客户的应用会感知到 CPU 平台的差异,不同应用也有不同的需求,这导致 Amazon EC2 产品实例系列快速爆炸,比如 CPU 分为 Intel、AMD、ARM,内存分为1:2、1:4、1:8 和 1:16,加速器分为推理、训练、FPGA、媒体转码,此外还有 IO 增强,如网络增强、本地盘等形态。几种组合,每一代有数十种硬件架构形态。亚马逊云科技可以快速推出新实例,得益于Amazon Nitro 实现了虚拟化卸载。
自研 Amazon Graviton-高性能低价格
随着 Intel 这几年挤牙膏,服务器处理器的性价比提升放缓,尤其是能耗快速增长。亚马逊云科技推出 ARM 处理器 Amazon Graviton 2 和 3 系列。
最近分析 ARM 技术,推测应该采用的是 Nerverous V1 架构,代号 Zeus,比 N1 核性能提高 50%(实际 SVE 提升更大)
创新的云原生芯片设计理念:
- 性能:单核内存带宽和时延
- ML:BF16 和 INT8 方面遥遥领先
- 能耗:功耗是 ARM 强项,效率比 x86 优 60%
- 放弃:随着核心增加 NUMA 作为独木桥,越来越影响性能,干脆放弃NUMA
- 场景:单 core 性能强劲,HPC、媒体转码场景具备优势;
Amazon Graviton 3 比 G2 增加 200 亿晶体管;但是处理器主频不增加,核数没变,推测战略定位如下:
- 性能战略:选择了 V1 架构,意味着走了性能路线,主打 ML 和 HPC
- 成本更高:Amazon Graviton 3 仅 64core,相比较而言行业其他处理器的核密度更高,Ampere AltraMax、Yitian、NVIDIA 分别是 128core 和 144core(2chips)
- 让利客户:Amazon G3 实例 C7g 定价只比上一代 Amazon G2 提高 5%;5nm 500 亿晶体管,比7nm 300 亿晶体管成本预计翻倍。
ML芯片赋能AI场景
- 成本降低 70%
- Alex 都已经转到 Inf1 实例
- 成本降低 35%
- 吞吐提升 2.3 倍
EFA 支持 SRD 协议,帮助客户优化 HPC、ML 并行能力,减少 TCP 通信开销占比。
云上创新技术赋能业务
AI 赋能业务
CTO 格言:每一行代码都是业务逻辑。从 OPPO 案例可以看到,采用云上 Amazon EC2-Inf1,快速构建语音助手的案例。
智能运维
亚马逊云科技利用自身电商积累的经验,通过亚马逊云科技云服务帮助客户运维。包括对事件的分析、响应进行的机器学习.比如 trusted advisor,为客户提供超过 5000 万智能运维推荐。根据 Amazon 电商积累的经验,输出给客户,此外还有 IEM 等工具。
数据价值
数据为客户创造这块儿也很精彩,可以让只懂 SQL 的人玩转 AI。先不做详述,我把回放链接放在文末,感兴趣可以了解下。
数据服务提供:
冷热数据快速恢复
数据备份、安全
Amazon S3-redshift,打通湖与仓
数据安全,审计策略
用 SQL 实现 ML 创新
思考和启发
因为价值所以选择
通过为客户节约成本,创造业务价值,让亚马逊云科技受到全球用户欢迎。另外,云计算消耗占半壁江山的互联网企业,告别内卷奔赴全球化是 2022 年主题,全球化需要强大的安全、合规特性产品能力,需要全球网络。因此国内企业出海纷纷选择亚马逊云科技。
根据统计报告,虽然在国内市场亚马逊云科技只占 6%,但加上中国企业出海份额占到了 26%,足以说明亚马逊云科技强大的竞争力和客户粘性。
亚马逊云科技的秘籍你能学会吗
IT 服务商存在的意义就是为客户创造价值。最后我提几个问题,你的企业文化真的是客户第一吗?今年营收 KPI 和客户粘性需要牺牲一个,你怎么选择?
破解了云计算增长之谜,亚马逊云科技的产品之道,你能学会吗?
(完)码字不易,请点赞支持
前文说过,很多地方本文没有探究,爱好技术的喜欢刨根问底,附一个回放入口自己去看。