官方博客-第15页-阿里云开发者社区

子白

2024-05-15

102414

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,414

吴昆

2024-05-15

222058

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,058

ModelScope

2024-05-15

1359

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,359

乐忱

2024-06-14

39863

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

39,863

张昕东

2024-07-25

14019

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,019

坤硕

2024-07-29

20046

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

20,046

穹谷

2024-09-02

852

每个端侧产品都需要的用户体验监控

ARMS RUM 是阿里云应用实时监控服务（ARMS）下的用户体验监控（RUM）产品，覆盖 Web/H5、各类平台小程序、Android、iOS、Flutter、ReactNative、Windows、macOS 等平台框架。接入 SDK 后会主动采集端侧页面性能、资源加载、API 调用、异常崩溃、卡顿、用户操作、系统信息等数据，还支持事件、日志、异常等数据按需自定义上报以满足业务数据分析需求，提供全面的性能分析、异常分析、产品分析、会话分析能力，帮助快速跟踪定位问题原因，提升产品用户使用体验。

穹谷

852

烨陌

2024-09-05

368

软件测试之道 -- 做一个有匠心的程序员

作者一年前围绕设计模式与代码重构写了一篇《代码整洁之道 -- 告别码农，做一个有思想的程序员！》的文章。本文作为续篇，从测试角度谈程序员对软件质量的追求。

烨陌

368

阿里云存储

2024-10-08

1363

Data+AI双轮驱动，阿里云存储服务全面升级

近日，2024云栖大会现场，阿里云宣布对其存储服务进行全面升级，围绕 Storage for AI 与 AI in Storage 两大领域，提出“4 Any + 3 AI ”的升级方向，揭示存储基础设施与AI的双向赋能路径。阿里云存储产品将支持更多AI业务高效创新，同时 AI 技术也将助力基础设施迭代，支持企业更好地管理数据资产。

阿里云存储

1,363

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

AI时代：云存储加速多模态数据存储与管理创新

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

每个端侧产品都需要的用户体验监控

软件测试之道 -- 做一个有匠心的程序员

Data+AI双轮驱动，阿里云存储服务全面升级

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

AI时代：云存储加速多模态数据存储与管理创新

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

每个端侧产品都需要的用户体验监控

软件测试之道 -- 做一个有匠心的程序员

Data+AI双轮驱动，阿里云存储服务全面升级