官方博客-第15页-阿里云开发者社区

子白

2024-05-15

102414

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,414

吴昆

2024-05-15

222058

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,058

ModelScope

2024-05-15

1359

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,359

阿里云实时数仓Hologres

2024-06-18

2284

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,284

张昕东

2024-07-25

14019

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,019

赵源筱

2024-08-19

20086

不改一行代码轻松玩转 Go 应用微服务治理

为了更好的进行 Go 应用微服务治理，提高研发效率和系统稳定性，本文将介绍 MSE 微服务治理方案，无需修改业务代码，实现治理能力。

赵源筱

20,086

穹谷

2024-09-02

852

ARMS RUM 是阿里云应用实时监控服务（ARMS）下的用户体验监控（RUM）产品，覆盖 Web/H5、各类平台小程序、Android、iOS、Flutter、ReactNative、Windows、macOS 等平台框架。接入 SDK 后会主动采集端侧页面性能、资源加载、API 调用、异常崩溃、卡顿、用户操作、系统信息等数据，还支持事件、日志、异常等数据按需自定义上报以满足业务数据分析需求，提供全面的性能分析、异常分析、产品分析、会话分析能力，帮助快速跟踪定位问题原因，提升产品用户使用体验。

穹谷

852

烨陌

2024-09-05

368

软件测试之道 -- 做一个有匠心的程序员

作者一年前围绕设计模式与代码重构写了一篇《代码整洁之道 -- 告别码农，做一个有思想的程序员！》的文章。本文作为续篇，从测试角度谈程序员对软件质量的追求。

烨陌

368

右予故黎

2024-11-21

969

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

969

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

森马基于MaxCompute+Hologres+DataWorks构建数据中台

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

不改一行代码轻松玩转 Go 应用微服务治理

每个端侧产品都需要的用户体验监控

软件测试之道 -- 做一个有匠心的程序员

“无”中生有：基于知识增强的RAG优化实践

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

森马基于MaxCompute+Hologres+DataWorks构建数据中台

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

不改一行代码轻松玩转 Go 应用微服务治理

每个端侧产品都需要的用户体验监控

软件测试之道 -- 做一个有匠心的程序员

“无”中生有：基于知识增强的RAG优化实践