子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,030

乐忱

2024-06-14

37906

AI时代：云存储加速多模态数据存储与管理创新

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

37,906

张玉峰

2024-05-15

490

如何使用SASE快速构建零信任架构

企业构建零信任架构已经成为近年热门的话题之一。本质都是保护企业核心数据安全，防止未经合法授权的数据的访问行为。阿里云SASE依托于阿里云的网络组网优势，为用户提供一个稳定、高效的SD-WAN组网及接入能力，与此同时叠加安全能力。

张玉峰

490

休祯

2024-07-18

7522

流量回放新形态：基于网关 Access Log 发起

流量回放技术在性能测试和故障排除中至关重要。传统工具如 GoReplay、Tcpreplay 等存在高权限、配置复杂、登录态失效等痛点。PTS 推出基于 Access Log 的流量回放功能，自动生成压测场景，解决传统工具痛点，操作简单，一起来了解下吧~

休祯

7,522

阿里云存储

2024-05-15

138727

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

138,727

阿里云云原生

2024-07-29

111

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

111

斜阳

2024-05-15

132445

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,445

刘佳旭

2023-09-26

138050

云原生场景下高可用架构的最佳实践

刘佳旭

138,050

杨永

2024-05-15

92638

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

92,638

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

AI时代：云存储加速多模态数据存储与管理创新

如何使用SASE快速构建零信任架构

流量回放新形态：基于网关 Access Log 发起

用软硬协同设计下的飞天盘古降低存储系统开销

从供应商深度绑定，到走向真正的云原生，他们是这样做的

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

云原生场景下高可用架构的最佳实践

使用KMS为MSE-Nacos敏感配置加密的最佳实践