子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,086

阿里云实时数仓Hologres

2024-06-27

72190

Hologres+Flink企业级实时数仓核心能力介绍

通过Hologres+Flink构建易用、统一的企业级实时数仓。

阿里云实时数仓Hologres

72,190

新洲

2024-05-15

459

企业级DMZ上云场景方案

随着企业业务云化进程逐渐进入深水区，简单地使用云上资源出入公网已经无法满足业务的诉求，安全、成本、权限、监控等诉求的迭代，需要企业有系统性地视角来考虑如何做好公网出入口（DMZ）的规划设计。

新洲

459

骐迹

2024-05-15

452

阿里云全球跨地域网络互通方案

随着企业客户上云的深入，越来越多的客户会选择在阿里云全球region多地部署其企业业务系统，以便其全球化业务的迅速开展。阿里云在云上有非常丰富云网络产品，来协助企业客户在全球region迅速构建云上多个地域的互联互通，帮忙企业客户快速实现业务上线。本章节为您介绍如何使用云企业网转发路由器CEN-TR（Transit Router），来实现客户本地多个不同城市数据中心IDC（Internet Data Center）和云上VPC跨地域互通互联。

骐迹

452

任庆盛

2023-02-22

21923

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

21,923

斜阳

2024-05-15

132478

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,478

阿里云实时数仓Hologres

2024-06-18

989

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

989

骆天

2024-05-15

874

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

874

乐忱

2024-06-14

37937

AI时代：云存储加速多模态数据存储与管理创新

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

37,937

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Hologres+Flink企业级实时数仓核心能力介绍

企业级DMZ上云场景方案

阿里云全球跨地域网络互通方案

Flink CDC+Kafka 加速业务实时化

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

森马基于MaxCompute+Hologres+DataWorks构建数据中台

高并发架构设计三大利器：缓存、限流和降级

AI时代：云存储加速多模态数据存储与管理创新