子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

100,822

任庆盛

2023-02-22

21790

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

21,790

瑞丹

2024-06-05

262

台州银行携手瓴羊Dataphin共建数据平台，打造小微金融治理新标杆

台州银行数据治理项目携手瓴羊Dataphin，荣获中国信息通信研究院评为“2023年铸基计划高质量数字化转型典型优秀案例”、数字化研究机构沙丘社区选为“2024中国数据资产管理最佳实践案例”双重认可。

瑞丹

262

吴昆

2024-05-15

145392

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,392

豁朗

2024-05-15

125352

弱结构化日志 Flink SQL 怎么写？SLS SPL 来帮忙

豁朗

125,352

杳天

2022-12-13

1721

技术原理，Hologres Binlog技术原理揭秘

详细介绍Hologres Binlog技术原理以及最佳实践。

杳天

1,721

焱冰

2023-03-09

11449

数据湖存储的安全写入之道

本文以 Hadoop 社区中的 S3A Connector 的实现为切入，分析了数据湖写入路径的安全性。

焱冰

11,449

豁朗

2021-08-13

1666

用SLS配置日志关键字告警的N种方法

本文主要介绍一种免运维，高性能，支持灵活配置的方案，使用SLS接入日志和告警。

豁朗

1,666

非有

2024-05-15

876

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

876

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Flink CDC+Kafka 加速业务实时化

台州银行携手瓴羊Dataphin共建数据平台，打造小微金融治理新标杆

弹性调度助力企业灵活应对业务变化，高效管理云上资源

弱结构化日志 Flink SQL 怎么写？SLS SPL 来帮忙

技术原理，Hologres Binlog技术原理揭秘

数据湖存储的安全写入之道

用SLS配置日志关键字告警的N种方法

一文详解 Java 限流接口实现