官方博客-第13页-阿里云开发者社区

子白

2024-05-15

102414

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,414

吴昆

2024-05-15

222058

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,058

ModelScope

2024-05-15

1359

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,359

言澈

2024-05-15

1330

全景剖析阿里云容器网络数据链路（一）—— Flannel

本文是[全景剖析容器网络数据链路]第一部分，主要介绍Kubernetes Flannel模式下，数据面链路的转转发链路

言澈

1,330

乐忱

2024-06-14

39863

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

39,863

阿里云实时数仓Hologres

2024-06-18

2284

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,284

张昕东

2024-07-25

14019

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,019

无哲

2024-08-13

13151

更快更强，SLS 推出高性能 SPL 日志查询模式

从海量的日志数据中，按照各种灵活的条件进行即时查询搜索，是可观测场景下的基本需求。本文介绍了 SLS 新推出的高性能 SPL 日志查询模式，支持 Unix 风格级联管道式语法，以及各种丰富的 SQL 处理函数。同时通过计算下推、向量化计算等优化，使得 SPL 查询可以在数秒内处理亿级数据，并支持 SPL 过滤结果分布图、随机翻页等特性。

无哲

13,151

阿里云存储

2024-10-08

1363

Data+AI双轮驱动，阿里云存储服务全面升级

近日，2024云栖大会现场，阿里云宣布对其存储服务进行全面升级，围绕 Storage for AI 与 AI in Storage 两大领域，提出“4 Any + 3 AI ”的升级方向，揭示存储基础设施与AI的双向赋能路径。阿里云存储产品将支持更多AI业务高效创新，同时 AI 技术也将助力基础设施迭代，支持企业更好地管理数据资产。

阿里云存储

1,363

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

全景剖析阿里云容器网络数据链路（一）—— Flannel

AI时代：云存储加速多模态数据存储与管理创新

森马基于MaxCompute+Hologres+DataWorks构建数据中台

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

更快更强，SLS 推出高性能 SPL 日志查询模式

Data+AI双轮驱动，阿里云存储服务全面升级

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

全景剖析阿里云容器网络数据链路（一）—— Flannel

AI时代：云存储加速多模态数据存储与管理创新

森马基于MaxCompute+Hologres+DataWorks构建数据中台

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

更快更强，SLS 推出高性能 SPL 日志查询模式

Data+AI双轮驱动，阿里云存储服务全面升级