ModelScope

2024-05-15

2028

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

2,028

ModelScope

2024-05-15

648

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

648

子白

2024-05-15

101024

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,024

阿里云存储

2024-05-15

138721

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

138,721

任庆盛

2023-02-22

21883

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

21,883

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

41965

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

41,965

杳天

2022-12-13

1829

技术原理，Hologres Binlog技术原理揭秘

详细介绍Hologres Binlog技术原理以及最佳实践。

杳天

1,829

章磊

2023-08-15

21577

迄今为止最完整的DDD实践

对于一个架构师来说，在软件开发中如何降低系统复杂度是一个永恒的挑战。

章磊

21,577

闵子

2023-12-01

1049

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

1,049

类目筛选

内容类型

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

Multi-Agent实践第7期：智能体的高效协作

大语言模型推理提速，TensorRT-LLM 高性能推理实践

用软硬协同设计下的飞天盘古降低存储系统开销

Flink CDC+Kafka 加速业务实时化

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

技术原理，Hologres Binlog技术原理揭秘

迄今为止最完整的DDD实践

从浏览器原理出发聊聊Chrome插件