子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

100,829

任庆盛

2023-02-22

21795

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

21,795

瑞丹

2024-06-05

262

台州银行携手瓴羊Dataphin共建数据平台，打造小微金融治理新标杆

台州银行数据治理项目携手瓴羊Dataphin，荣获中国信息通信研究院评为“2023年铸基计划高质量数字化转型典型优秀案例”、数字化研究机构沙丘社区选为“2024中国数据资产管理最佳实践案例”双重认可。

瑞丹

262

吴昆

2024-05-15

145393

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,393

杳天

2022-12-13

1722

技术原理，Hologres Binlog技术原理揭秘

详细介绍Hologres Binlog技术原理以及最佳实践。

杳天

1,722

焱冰

2023-03-09

11452

数据湖存储的安全写入之道

本文以 Hadoop 社区中的 S3A Connector 的实现为切入，分析了数据湖写入路径的安全性。

焱冰

11,452

尹航

2024-06-03

73344

基于阿里云服务网格流量泳道的全链路流量管理（三）：无侵入式的宽松模式泳道

本文简要讨论了使用流量泳道来实现全链路流量灰度管理的场景与方案，并回顾了阿里云服务网格 ASM 提供的严格与宽松两种模式的流量泳道、以及这两种模式各自的优势与挑战。接下来介绍了一种基于 OpenTelemetry 社区提出的 baggage 透传能力实现的无侵入式的宽松模式泳道，这种类型的流量泳道同时具有对业务代码侵入性低、同时保持宽松模式的灵活特性的特点。同时，我们还介绍了新的基于权重的流量引流策略，这种策略可以基于统一的流量匹配规则，将匹配到的流量以设定好的比例分发到不同的流量泳道。

尹航

73,344

张佐玮

2023-12-01

868

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

868

昕羽

2024-05-15

65076

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

Apache Paimon 和 Apache Hudi 作为数据湖存储格式，有着高吞吐的写入和低延迟的查询性能，是构建数据湖的常用组件。本文在阿里云EMR上，针对数据实时入湖场景，对 Paimon 和 Hudi 的性能进行比对，并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

昕羽

65,076

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Flink CDC+Kafka 加速业务实时化

台州银行携手瓴羊Dataphin共建数据平台，打造小微金融治理新标杆

弹性调度助力企业灵活应对业务变化，高效管理云上资源

技术原理，Hologres Binlog技术原理揭秘

数据湖存储的安全写入之道

基于阿里云服务网格流量泳道的全链路流量管理（三）：无侵入式的宽松模式泳道

Koordinator 助力云原生应用性能提升，小红书混部技术实践

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse