官方博客-第14页-阿里云开发者社区

ModelScope

2024-05-15

1159

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,159

赵世振

2024-12-24

2547

本文介绍了阿里云百炼的CosyVoice语音合成大模型及其高并发调用优化方案。CosyVoice支持文本到语音的实时流式合成，适用于智能设备播报、音视频创作等多种场景。为了高效稳定地调用服务，文章详细讲解了WebSocket连接复用、连接池和对象池等优化技术，并通过对比实验展示了优化效果。优化后，机器负载降低，任务耗时减少，网络负载更优。同时，文章还提供了异常处理方法及常见问题解决方案，帮助开发者更好地集成和使用SDK。

赵世振

2,547

雨鸦

2024-12-27

1559

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,559

阿里云云原生

2025-01-26

1260

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,260

阿里云中间件

2024-07-23

15636

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

大语言模型的革命性突破使智能编程成为了可能，通义灵码正是基于通义大模型打造的 AI 编程助手，通过 IDE 插件的形式提供代码补全、单元测试生成等功能，能达到毫秒级的响应速度。目前，通义灵码已在阿里云内部及多家企业中应用，阿里云也在探索多智能体产品，即 AI 程序员，助力数字世界的蓬勃发展，颠覆 IT 生产力。

阿里云中间件

15,636

龙蜥社区OpenAnolis

2024-11-06

2924

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

机密计算软硬结合技术保障数据安全。

龙蜥社区OpenAnolis

2,924

柳遵飞

2024-12-11

967

SpringCloud 应用 Nacos 配置中心注解

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

967

澄潭

2025-04-03

1847

开源 Remote MCP Server 一站式托管来啦！

MCP Server 的实施存在着诸多挑战，特别是在认证授权、服务可靠性和可观测性方面，Higress 作为 AI 原生的 API 网关，提供了完整的开源 MCP Server 托管解决方案，实现存量 API 到 MCP 的协议转换。即将上线的 MCP 市场，将大幅降低开发者构建 MCP Server 的时间和人力成本。

澄潭

1,847

ModelScope

2024-05-15

951

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

951

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

【最佳实践系列】高并发调用百炼语音合成大模型

极简开发，极速上线：构建端到端大模型应用

最近谈论 SSE 和 WebSocket 的人越来越多的原因

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

SpringCloud 应用 Nacos 配置中心注解

开源 Remote MCP Server 一站式托管来啦！

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

【最佳实践系列】高并发调用百炼语音合成大模型

极简开发，极速上线：构建端到端大模型应用

最近谈论 SSE 和 WebSocket 的人越来越多的原因

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

SpringCloud 应用 Nacos 配置中心注解

开源 Remote MCP Server 一站式托管来啦！

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent