官方博客-第14页-阿里云开发者社区

子白

2024-05-15

102438

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,438

榆松

2025-01-14

1187

网络分析与监控：阿里云拨测方案解密

阿里云网络拨测业务提供了全球、多种协议、多种网络态势的用户网络性能和用户体验监控场景的全面可观测方案。该文章从拨测场景下，介绍了用户如何快速的构建一套全球用户视角的服务可用性大盘，为客户的业务保驾护航。

榆松

1,187

阿里云云原生

2025-01-26

1244

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,244

澄潭计缘望宸

2025-03-14

977

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

977

阿里云云原生

2025-05-15

878

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

本文介绍了将社区主流STDIO MCP Server一键转为企业内可插拔Remote MCP Server的方法，以及存量API智能化重生的解决方案。通过FunctionAI平台模板实现STDIO MCP Server到SSE MCP Server的快速部署，并可通过“npx”或“uvx”命令调试。同时，文章还探讨了如何将OpenAPI规范数据转化为MCP Server实例，支持API Key、HTTP Basic和OAuth 2.0三种鉴权配置。该方案联合阿里云百练、魔搭社区等平台，提供低成本、高效率的企业级MCP Server服务化路径，助力AI应用生态繁荣。

阿里云云原生

878

灵杰开发者

2025-08-08

604

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

604

ModelScope

2024-05-15

3531

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,531

探索云世界

2024-05-15

1278

使用CDN来加速OSS上存储的文件资源分发

本文为真实设备电商行业的实践，在网站有大量产品图片上传的场景下，用OSS配合CDN加速，提高了用户的访问速度、站点稳定性，并且提供了节省成本的思路。

探索云世界

1,278

崔力强

2024-12-10

603

更快、更灵活、场景更丰富，云效镜像构建能力升级啦

本文介绍了云效在镜像构建方面的改进。

崔力强

603

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

网络分析与监控：阿里云拨测方案解密

最近谈论 SSE 和 WebSocket 的人越来越多的原因

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

使用CDN来加速OSS上存储的文件资源分发

更快、更灵活、场景更丰富，云效镜像构建能力升级啦

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

网络分析与监控：阿里云拨测方案解密

最近谈论 SSE 和 WebSocket 的人越来越多的原因

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

使用CDN来加速OSS上存储的文件资源分发

更快、更灵活、场景更丰富，云效镜像构建能力升级啦