官方博客-第9页-阿里云开发者社区

探索云世界

2025-08-05

878

Qwen-MT：翻得快，译得巧

今天，机器翻译模型Qwen-MT正式上线，支持92种语言互译，具备高度可控性与低延迟、低成本特点，适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

探索云世界

878

子白

2024-05-15

102501

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,501

ModelScope

2024-05-15

1451

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,451

阿里云云原生

2025-08-05

1107

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

Nacos社区推出MCP Router与MCP Registry开源解决方案，助力AI Agent高效调用外部工具。Router可智能筛选匹配的MCP Server，减少Token消耗，提升安全性与部署效率。结合Nacos Registry实现服务自动发现与管理，简化AI Agent集成复杂度。支持协议转换与容器化部署，保障服务隔离与数据安全。提供智能路由与代理模式，优化工具调用性能，助力MCP生态普及。

阿里云云原生

1,107

乐忱

2024-06-14

39965

AI时代：云存储加速多模态数据存储与管理创新

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

39,965

耘越

2024-10-29

1506

AI 辅助编程的效果衡量

本文主要介绍了如何度量研发效能，以及 AI 辅助编程是如何影响效能的，进而阐述如何衡量 AI 辅助编程带来的收益。

耘越

1,506

阿里云云原生

2025-07-21

836

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

本课程通过通义灵码实现零代码数据分析全流程，涵盖数据读取、清洗、可视化、报告生成及内容仿写，无需编程基础，轻松掌握从CSV导入到PDF报告输出的实战技能。

阿里云云原生

836

阿里云数据库

2024-05-15

84328

Ganos H3地理网格能力解析与最佳实践

本文介绍了Ganos H3的相关功能，帮助读者快速了解Ganos地理网格的重要特性与应用实践。H3是Uber研发的一种覆盖全球表面的二维地理网格，采用了一种全球统一的、多层次的六边形网格体系来表示地球表面，这种地理网格技术在诸多业务场景中得到广泛应用。Ganos不仅提供了H3网格的全套功能，还支持与其它Ganos时空数据类型进行跨模联合分析，极大程度提升了客户对于时空数据的挖掘分析能力。

阿里云数据库

84,328

米基

2024-05-15

3860

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,860

官方博客-第9页-阿里云开发者社区

类目筛选

内容类型

Qwen-MT：翻得快，译得巧

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

AI时代：云存储加速多模态数据存储与管理创新

AI 辅助编程的效果衡量

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

Ganos H3地理网格能力解析与最佳实践

大模型推理优化实践：KV cache复用与投机采样

官方博客-第9页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Qwen-MT：翻得快，译得巧

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

AI时代：云存储加速多模态数据存储与管理创新

AI 辅助编程的效果衡量

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

Ganos H3地理网格能力解析与最佳实践

大模型推理优化实践：KV cache复用与投机采样