阿里云弹性计算核心技术解密LC3专场回顾

简介: 在备受业界关注的LC3会议飞天技术汇专场上,飞天技术专场:阿里云弹性计算核心技术解密专场内容颇为丰富,阿里云弹性计算团队分享了人工智能应用性能加速、热迁移、virtio-blk的加速qcache等议题,同时还对提升虚拟机性能提出了新的思考。

 6月25日,由LFAsia, LLC主办的全球开源顶级盛会LinuxCon + ContainerCon + CloudOpen(LC3)在北京国家会议中心召开。来自国内外的开发人员、架构师、系统管理员、DevOps专家、商业领袖等数千名专业人士汇聚一堂。

a8539366960611d398da122383812b5253fe47ff

      阿里云研究员褚霸在大会当天同多位业界资深大咖同台时交流表示,阿里发展到今天,计算能力转化为普化的能力并且形成数据在云上,纵然极具挑战,但是也在不断增强阿里的技术能力,促进经验的积累。

阿里云ECS弹性计算作为计算能力的基础,今年做的最重要的2件事

第一,在芯片和软硬件一体化系统层面不断的挑战创新,比如我们推出的弹性裸金属服务器(神龙)以及自研异构计算高密度FPGA板卡AliFPGA等。第二,基于阿里云近些年在云原生领域积累的经验,产品创新的同时持续优化用户体验,在提升计算能力的同时驱动各行业真正的步入智能时代。

在备受业界关注的LC3会议飞天技术汇专场上,飞天技术专场:阿里云弹性计算核心技术解密专场内容颇为丰富,阿里云弹性计算团队分享了人工智能应用性能加速、热迁移、virtio-blk的加速qcache等议题,同时还对提升虚拟机性能提出了新的思考。

高级技术专家昀龙带来了人工智能服务极致加速的分享。通过不同的应用优化案例提出了若干针对AI场景的解决方案。例如,在一个CTR预估训练场景中, 通过GPU分布式训练性能优化,性能大约可提升至原来的14倍。
57a2b7bd71477a9415b04f24c651320d4b995368
9b79a32831411bc8d5b6b03f661ba9df35a1d614
技术专家张超分享了阿里云弹性计算高可靠性的技术保障之一:热迁移技术。通过热迁移技术,可以使虚拟机在保持运行状态的情况下,将其从一个物理宿主机迁移到另外一个物理宿主机,整个过程用户几乎无感。
2e5c57d2995efda716e014370a0bdf93704a83b2

高级工程师念卿全面分享了virtio-blk的加速qcache的相关内容。从kvm的存储背景栈,qcache的工作原理,qcache常见的使用模式,qcache的性能展示,到未来工作的思考等方面详细介绍了qcache。除了介绍qcache的基本工作原理外,念卿还介绍了qcache的两个特征,大量未命中请求处理以及seq-cut-off。其中,在大量请求未命中的场景,为了减少cache磁盘压力以及保持guest请求的响应速度,qcache会在未命中请求过多的时候采用PT的方式进行处理。而seq-cut-off特征提供了一种方法,使得可以自主调整是否缓存大块连续的请求。最后,会议介绍了qcache的未来发展方向,包括spdkoptane的支持,QOS的支持,cache size的动态分配以及开源。

0d6b1b44237cb2bcc4bd7079d2352d0c734976ac

高级技术专家哲杨则对典型业务场景在虚拟化场景下存在的性能问题进行了分析,并由此提出了一个新的技术解决方案。该方案通过在内核进行少量的修改,可以有效地降低虚拟化的开销,同时提升虚拟机的性能。在实际的业务测试场景中,通过该方案,可以有效提升大约20%的系统性能。

a610978c93fcca7d18e7d4205201594925694ed5

c1c71dce43783cdeb5287b21b8a3a27573db8aaa

目录
相关文章
|
存储 人工智能 分布式计算
2021云栖大会丨阿里云发布第四代神龙架构,提供业界首个大规模弹性RDMA加速能力
10月20日,2021年杭州云栖大会上,阿里云发布第四代神龙架构,升级至全新的eRMDA网络架构,是业界首个大规模弹性RDMA加速能力。
2021云栖大会丨阿里云发布第四代神龙架构,提供业界首个大规模弹性RDMA加速能力
|
6月前
|
API PHP 索引
这插件太危险了!PDFParser自动扒取PDF每天躺赚300+的暴利搬运术
本文介绍了如何使用PHP提取PDF文档中的文字内容。为解决PDF文档“不可编辑”或“文本无法复制”的问题,推荐使用免费的PHP库——PDFParser。通过Composer安装后,可利用其简单强大的API解析PDF文件,提取文本内容。文章详细演示了获取PDF基本信息、全文内容、指定页内容及循环输出每页文本的方法,并附带中英文PDF示例,操作简便实用。
186 3
这插件太危险了!PDFParser自动扒取PDF每天躺赚300+的暴利搬运术
|
11月前
|
人工智能 运维 网络架构
阿里云引领智算集群网络架构的新一轮变革
11月8日至10日,CCF ChinaNet(中国网络大会)在江苏张家港召开,众多院士、教授和技术领袖共聚一堂,探讨网络未来发展方向。阿里云研发副总裁蔡德忠发表主题演讲,展望智算技术发展趋势,提出智算网络架构变革的新思路,发布高通量以太网协议和ENode+超节点系统规划,引起广泛关注。阿里云HPN7.0引领智算以太网生态蓬勃发展,成为业界标杆。未来,X10规模的智算集群将面临新的挑战,Ethernet将成为主流方案,推动Scale up与Scale out的融合架构,提升整体系统性能。
|
机器学习/深度学习 数据采集 人工智能
探索机器学习中的特征工程最佳实践
【5月更文挑战第21天】 在机器学习领域,特征工程是模型性能优化的关键环节之一。本文将深入探讨特征工程的核心概念、方法及其在构建高效机器学习模型中的应用。文章不仅总结了实用的特征选择技巧和数据预处理策略,还介绍了如何通过自动化工具简化特征工程流程。通过案例分析,我们展示了在不同数据集上应用这些技术的效果,并讨论了特征工程在未来发展中的潜在趋势与挑战。
|
存储 人工智能 运维
阿里云自研存储部件创新亮相2024全球闪存峰会
阿里云在AI时代背景下对自研存储部件进行的一系列创新实践并取得丰硕成果。
阿里云自研存储部件创新亮相2024全球闪存峰会
|
弹性计算 关系型数据库 MySQL
倚天云服务器ECS体验分享
倚天云服务器ECS体验分享
192 6
|
JavaScript 前端开发 Java
Github 2024-08-01 开源项目月报 Top17
根据Github Trendings统计,2024年8月共有17个项目上榜。按开发语言分类,项目数量如下:Python项目6个,非开发语言项目与TypeScript项目各4个,JavaScript项目3个,Java、Go及Vue项目各1个。其中,免费编程学习平台freeCodeCamp.org以381,011个Star数领先,提供全栈网页开发和机器学习课程。其他项目涵盖编程书籍、API集合、低代码开发平台等多种资源。
227 1
|
人工智能 自然语言处理 计算机视觉
Meta发布混合多模态模型—Chameleon
【8月更文挑战第5天】Meta AI团队近期发布了Chameleon,一种基于早期融合的混合多模态模型,能在任意顺序下理解和生成图像与文本。此34B参数模型经10万亿token训练,展现出卓越的多模态处理能力。Chameleon在视觉问答、图像字幕生成等任务中成绩亮眼,特别是在图像字幕生成上表现优异,文本生成上亦具竞争力,且有一定的图像生成能力。其性能在新混合模态生成评估中媲美甚至超越大型模型。尽管如此,Chameleon仍面临特定任务处理及计算资源需求等方面的挑战。论文已发布于arXiv。
291 11
|
存储 自然语言处理 测试技术
Transformers 4.37 中文文档(八)(4)
Transformers 4.37 中文文档(八)
366 2
|
域名解析 负载均衡 网络协议
linux 网络设置
linux 网络设置