昨天,在2022杭州·云栖大会上,阿里云智能总裁张建锋表示:“阿里云将坚持技术长征,抓住未来技术的定义权。”
他认为新一轮的科技变革深入发展,一个全新的计算体系正在到来,它将对IT硬件体系、软件研发范式和终端世界带来深刻变革。
过去十多年,飞天为阿里云打下了扎实的技术基础,让云实现了第一次飞跃。自研CPU芯片倚天710、下一代云计算体系架构CIPU等将为阿里云构建第二技术曲线,是云面向下一代技术构建的核心竞争力。
一起看看,本届云栖大会带来了哪些变化和技术趋势:
01阿里云核心产品全面Serverless化
软件研发范式正在发生新的变革,Serverless是其中最重要的趋势之一,阿里云将坚定推进核心产品全面Serverless 化,帮助客户更好地实现敏捷创新。
“我们希望让用户做得更少而收获更多,通过Serverless化,用云就像用电一样简单。”张建锋表示,Serverless将让云计算从一种资源真正变成一种能力,未来云将全面Serverless化,更加接近“电网”模式,按计算的调用次数付费。
- 在零售商超世纪联华:会员系统、交易系统等都被放在阿里云函数计算上处理,告别了靠扩展机器支撑大体量业务,促销准备时间从周级缩短到小时级,成本下降40%;
- 在南瓜电影:当涌入大量用户时,南瓜电影可在短时间内切换到阿里云Serverless应用引擎SAE,峰值时秒级自动扩容,峰谷时按需自动缩容,总成本下降 40%,从容应对突发流量。
目前,阿里云已经拥有超过20款 Serverless 产品,包括函数计算FC、Serverless 应用引擎SAE、Serverless容器服务ASK、PolarDB数据库、AnalyticDB数仓等。
其中函数计算日调用次数超过 200 亿次,有效支撑历年双11 百万 QPS 洪峰,业务年均增速超 300%,整体规模位居国内首位。
02倚天+飞天+CIPU组合,性能提升20%以上
为了提供更好的产品和服务,阿里云进一步优化数据处理和传输效率,构建了以数据为中心的新型云计算架构体系,提供近网络计算和近存储计算的加速支撑。
在飞天+CIPU加持下,Redis/Tair数据库的缓存QPS性能可提升80%,数据库的主从复制延迟降低50%、全局一致性读性能提升5~10倍,大数据Spark性能提升30%,AI深度学习图形分类训练性能提升30%,OLAP实时数仓查询性能提升2倍以上,冷热分层四种存储类型,一份数据支持多种计算引擎……
在这个体系下,倚天+飞天+CIPU的组合表现也非常亮眼,在数据库、大数据和AI及高性能计算、视频编解码等场景下普遍优于业内同类产品,性能可提升20%以上。
搭载倚天芯片的阿里云弹性计算实例G8M将于11月15日正式上线,同时CIPU也被首次引入到专有云形态,为政企客户提供存算分离的一云多芯、一云多region架构能力。
03 阿里云数据库走向“四化”,All in Serverless
在本届云栖大会上,阿里云宣布PolarDB、AnalyticDB(简称ADB)、RDS、Lindorm等核心数据库产品已与自研CPU、CIPU、飞天操作系统进行深度融合创新,并全面Serverless化,对外更好地提供一站式数据管理与服务。
- RDS数据库基于自研CPU的软硬协同优化,整体性价比提升25%;
- PolarDB通过融合自研Smart-SSD智能固态硬盘技术,实现性能零损耗,数据存储成本最高下降60%。
PolarDB是业内首创支持跨机Serverless服务的云数据库,突破了无感秒切和高性能全局一致性两大技术难点,与按照峰值负载配置容量的成本相比,最多可节省95%的数据库成本。
同时,PolarDB数据库最新商业化的云原生HTAP功能,在列存索引IMCI技术加持之下,TPC-C、TPC-H性能实现行业大幅领先。
以PolarDB和ADB为代表的阿里云核心数据库产品也在HTAP、离在线一体化等前沿技术上发力,进一步提升数据库产品的易用性,并进一步提升性能。
其中,ADB提供离在线一体化数据处理分析能力,基于一份数据融合两种计算模型(MPP+BSP) 同时支持离线处理和在线分析,解决因数据同步产生的数据一致性和时效性问题,资源成本降低30%以上。
面向未来,阿里云数据库将整体向“四化”方向发展:
- 云原生化:资源解耦、Serverless化
- 平台化:基于云构建数据平台能力、OpenAPI标准化
- 一体化:处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化
- 智能化:AI for DB简化运维、In-DB ML挖掘数据价值
04 ODPS全新升级,满足用户多元化数据计算需求
为满足用户多元化数据计算需求,阿里云ODPS升级为一体化开放大数据平台。升级后的ODPS支持大规模批量计算、实时分析等服务,提供实时流式计算、机器学习等多种计算能力,可同时调度超10万台以上服务器规模进行并行计算。
ODPS实现了存储、调度、元数据管理上的一体化架构融合,支撑智慧交通、生命科学、风险精算等各领域数据的高效处理,并通过DataWorks提供一致的数据开发和治理服务。
在刚刚公布的TPC-H 30000GB基准测试中,ODPS-Hologres刷新世界纪录,分数超过2786万分,领先第二名23%。ODPS-MaxCompute则在TPCx-BB 100TB标准测试中,连续6年保持性能和性价比第一。
05 磐久超高性能网络,时延显著降低90%
为了突破计算性能、内存资源对AI模型训练效率的限制,阿里云工程师打造了一套“磐久超高性能网络”,采用自研的Solar-RDMA高速网络协议,使处理器可访问其他任意服务器的内存,非常适合深度学习模型内神经网络的交互形态,相比传统模式可降低长尾时延90%以上,最低可至2微秒。
基于这套超高性能网络技术及软硬一体化能力,今年6月阿里云推出了新一代智能计算产品——灵骏,可最小化所有非计算开销,实现5倍的通信性能提升,千卡并行计算效率高达90%,大规模AI场景下性能可提升2-5倍。
06 模型即服务,魔搭社区ModelScope降低AI门槛
为了降低AI的使用门槛,充分发挥AI的潜能,阿里达摩院与CCF开源发展委员会共同推出AI模型社区“魔搭”ModelScope。社区首批合作机构包括澜舟科技、深势科技、智谱AI、中国科学技术大学等。
魔搭社区践行模型即服务(Model as a Service)的理念,在代码开源的基础上更进一步,将AI的代码变成模型,将模型变成服务。社区实现了零门槛AI模型体验,一行代码模型推理,十行代码模型调优。
达摩院等率先向社区贡献300多个经过验证的优质AI模型,超过三分之一为中文模型。利用这些基础模型,开发者只需针对具体场景再稍作调优,就能快速投入使用。
07 玄铁C908实现RISC-V架构高能效突破
最新发布的玄铁C908处理器实现了RISC-V架构的高能效突破,较业界同性能处理器能效提升超20%。
为进一步提升AI算力及能效,玄铁C908升级了微架构,首次采用RISC-V Vector 1.0标准,并基于标准新增DOT指令;推出INT4数据类型;全面优化AI算子及算法库,典型神经网络计算的性能比前一代产品提升50%以上。
玄铁C908也因此超越此前在国际权威AI测试MLPerf Tiny V0.7中夺冠的玄铁C906,在图像分类任务中性能再提升3.5倍。玄铁C908可应用于智能交互、AR/VR、无线通讯等场景。
08 无影升级强化云网端一体安全:覆盖终端生产力场景
无影近期在多个场景推出生产力解决方案,包括研发、分支机构、RPA、教育等,往往都属于数据敏感领域。在为终端研发厂商提供更好的云流协议之外,无影进一步集成了安全能力。
无论用户使用既有应用、桌面实例池还是进行其他调度,都能够在敏感数据检测、行为日志处理、高危操作拦截、安全态势感知、外接设备权限、网络与应用安全监控等多个方面,设定符合自己场景的权限与策略。
过去的企业办公场景下,计算终端与内网的安全策略往往支离破碎,无法形成整体协同,尤其是企业跨组织协同的安全。
文章转自阿里云公众号2022年11月4日发布的《坚持技术长征,构建第二技术曲线》