阿里云弹性计算核心技术解密LC3专场回顾

简介: 在备受业界关注的LC3会议飞天技术汇专场上,飞天技术专场:阿里云弹性计算核心技术解密专场内容颇为丰富,阿里云弹性计算团队分享了人工智能应用性能加速、热迁移、virtio-blk的加速qcache等议题,同时还对提升虚拟机性能提出了新的思考。

 6月25日,由LFAsia, LLC主办的全球开源顶级盛会LinuxCon + ContainerCon + CloudOpen(LC3)在北京国家会议中心召开。来自国内外的开发人员、架构师、系统管理员、DevOps专家、商业领袖等数千名专业人士汇聚一堂。

a8539366960611d398da122383812b5253fe47ff

      阿里云研究员褚霸在大会当天同多位业界资深大咖同台时交流表示,阿里发展到今天,计算能力转化为普化的能力并且形成数据在云上,纵然极具挑战,但是也在不断增强阿里的技术能力,促进经验的积累。

阿里云ECS弹性计算作为计算能力的基础,今年做的最重要的2件事

第一,在芯片和软硬件一体化系统层面不断的挑战创新,比如我们推出的弹性裸金属服务器(神龙)以及自研异构计算高密度FPGA板卡AliFPGA等。第二,基于阿里云近些年在云原生领域积累的经验,产品创新的同时持续优化用户体验,在提升计算能力的同时驱动各行业真正的步入智能时代。

在备受业界关注的LC3会议飞天技术汇专场上,飞天技术专场:阿里云弹性计算核心技术解密专场内容颇为丰富,阿里云弹性计算团队分享了人工智能应用性能加速、热迁移、virtio-blk的加速qcache等议题,同时还对提升虚拟机性能提出了新的思考。

高级技术专家昀龙带来了人工智能服务极致加速的分享。通过不同的应用优化案例提出了若干针对AI场景的解决方案。例如,在一个CTR预估训练场景中, 通过GPU分布式训练性能优化,性能大约可提升至原来的14倍。
57a2b7bd71477a9415b04f24c651320d4b995368
9b79a32831411bc8d5b6b03f661ba9df35a1d614
技术专家张超分享了阿里云弹性计算高可靠性的技术保障之一:热迁移技术。通过热迁移技术,可以使虚拟机在保持运行状态的情况下,将其从一个物理宿主机迁移到另外一个物理宿主机,整个过程用户几乎无感。
2e5c57d2995efda716e014370a0bdf93704a83b2

高级工程师念卿全面分享了virtio-blk的加速qcache的相关内容。从kvm的存储背景栈,qcache的工作原理,qcache常见的使用模式,qcache的性能展示,到未来工作的思考等方面详细介绍了qcache。除了介绍qcache的基本工作原理外,念卿还介绍了qcache的两个特征,大量未命中请求处理以及seq-cut-off。其中,在大量请求未命中的场景,为了减少cache磁盘压力以及保持guest请求的响应速度,qcache会在未命中请求过多的时候采用PT的方式进行处理。而seq-cut-off特征提供了一种方法,使得可以自主调整是否缓存大块连续的请求。最后,会议介绍了qcache的未来发展方向,包括spdkoptane的支持,QOS的支持,cache size的动态分配以及开源。

0d6b1b44237cb2bcc4bd7079d2352d0c734976ac

高级技术专家哲杨则对典型业务场景在虚拟化场景下存在的性能问题进行了分析,并由此提出了一个新的技术解决方案。该方案通过在内核进行少量的修改,可以有效地降低虚拟化的开销,同时提升虚拟机的性能。在实际的业务测试场景中,通过该方案,可以有效提升大约20%的系统性能。

a610978c93fcca7d18e7d4205201594925694ed5

c1c71dce43783cdeb5287b21b8a3a27573db8aaa

目录
相关文章
|
弹性计算 人工智能 编解码
阿里云庞雄伟:云原生算力时代——倚天实例技术架构与最佳实践解析|阿里云弹性计算技术公开课直播预告
阿里云倚天实例基于平头哥半导体自研倚天710云原生处理器,倚天710使用ARMv9架构,采用业界领先的工艺设计,单芯片容纳高达600亿晶体管,内含128核CPU核心,主频2.75GHz,能同时兼顾性能和功耗。同时得益于阿里云自研的CIPU处理器以及飞天云计算操作系统,倚天实例实现了芯片、计算架构及操作系统的协同优化,显著提升了算力性价比。目前阿里云倚天实例已经在视频编解码、科学计算、电商等领域得到了广泛的应用。
阿里云庞雄伟:云原生算力时代——倚天实例技术架构与最佳实践解析|阿里云弹性计算技术公开课直播预告
|
弹性计算 人工智能 安全
阿里云弹性计算产品线负责人张献涛 为计算提速,弹性计算的创新与普惠
“阿里云始终围绕‘稳定、安全、性能、成本、弹性’的目标不断创新,为客户创造业务价值。”10月31日,杭州云栖大会上,阿里云弹性计算计算产品线负责人张献涛表示,通过持续的产品和技术创新,阿里云发布了HPC优化实例等多款新品,性能可提升40%,并对g8i等多款第八代ECS实例升级算力、降低成本,让客户真正体验到云计算带来的创新和普惠。
阿里云弹性计算产品线负责人张献涛  为计算提速,弹性计算的创新与普惠
|
2月前
|
存储 人工智能 弹性计算
阿里云弹性计算_加速计算专场精华概览 | 2024云栖大会回顾
2024年9月19-21日,2024云栖大会在杭州云栖小镇举行,阿里云智能集团资深技术专家、异构计算产品技术负责人王超等多位产品、技术专家,共同带来了题为《AI Infra的前沿技术与应用实践》的专场session。本次专场重点介绍了阿里云AI Infra 产品架构与技术能力,及用户如何使用阿里云灵骏产品进行AI大模型开发、训练和应用。围绕当下大模型训练和推理的技术难点,专家们分享了如何在阿里云上实现稳定、高效、经济的大模型训练,并通过多个客户案例展示了云上大模型训练的显著优势。
104620 10
|
3月前
|
存储 弹性计算 安全
阿里云弹性计算_通用计算专场精华概览 | 2024云栖大会回顾
本次专场内容包括阿里云弹性计算全新发布的产品家族、阿里云第9代 ECS 企业级实例、CIPU 2.0技术解读、E-HPC+超算融合、倚天云原生算力解析等内容,并发布了国内首个云超算国家标准。
|
存储 弹性计算 人工智能
阿里云杨航:阿里云CIPU技术解析|阿里云弹性计算技术公开课直播预告
此次公开课,杨航首先会从多租和弹性两个维度介绍云计算和计算的关系,并从成本、性能、安全、稳定性等方面分析IaaS虚拟化业务面临的痛点。之后,杨航将会从产品定位、体系架构和技术的演进、与DPU的差异、未来发展方向等方面对阿里云CIPU进行重点解读。
阿里云杨航:阿里云CIPU技术解析|阿里云弹性计算技术公开课直播预告
|
弹性计算 人工智能 算法
阿里云徐成:CIPU最新秘密武器-弹性RDMA的技术解析与实践|阿里云弹性计算技术公开课直播预告
弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA),是阿里云自研的云上弹性RDMA网络,底层链路复用VPC网络,采用全栈自研的拥塞控制CC(Congestion Control )算法,兼具传统RDMA网络高吞吐、低延迟特性,同时支持秒级的大规模RDMA组网。基于弹性RDMA,开发者可以将HPC应用软件部署在云上,获取成本更低、弹性更好的高性能应用集群;也可以将VPC网络替换成弹性RDMA网络,加速应用性能。
|
编解码 人工智能 弹性计算
阿里云视频云总经理何亚明:基于倚天的视频云原生业务新范式
软硬协同提速度、AI处理提画质、云端联合保体验
阿里云视频云总经理何亚明:基于倚天的视频云原生业务新范式
|
安全 数据安全/隐私保护
阿里云飞天计划在家实践
阿里云飞天计划在家实践
144 0
|
存储 弹性计算 运维
带你读《弹性计算—无处不在的算力》第一章:开篇 1.4:弹性计算的技术架构
《弹性计算—无处不在的算力》第一章:开篇 1.4:弹性计算的技术架构
1375 0
带你读《弹性计算—无处不在的算力》第一章:开篇 1.4:弹性计算的技术架构
|
弹性计算 NoSQL Java
阿里云飞天计划实践心得
首先介绍了自己的相关信息,其次阐述了对阿里云ESC的认识和自己的收获,最后展现了自己对未来的期望

热门文章

最新文章