官方博客-第21页-阿里云开发者社区

ModelScope

2024-05-15

1128

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,128

资源编排ROS

2024-06-24

400

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

基于 IaC 的理念，通过定义一个模板，使用 ROS 提供的 Terraform 托管服务进行自动化部署，可以非常高效快捷地部署任意云资源和应用（比如 ChatTTS 服务）。相比于手动部署或者通过 API、SDK 的部署方式，有着高效、稳定等诸多优势，也是服务上云的最佳实践。

资源编排ROS

400

张昕东

2024-07-25

14023

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,023

浅奕

2024-09-05

378

通过实验深入了解 TCP 连接的建立和关闭

TCP/IP 这个主题很多文章比较陈旧，且以讹传讹的东西太多，所以本文作者结合了理论和实践去写，旨在通过一系列实验帮助读者深入理解 TCP 连接的建立过程。

浅奕

378

阿里云云原生

2024-10-18

962

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

962

明巍临城水德

2024-11-14

511

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

511

龙蜥社区OpenAnolis

2024-11-22

462

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

Anolis OS 作为国内首个正式提供 OpenVINO 开发包和镜像的服务器端操作系统，推动国内 AI 推理生态和能力的升级。

龙蜥社区OpenAnolis

462

望雲十雨言澈

2025-04-10

528

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

528

阿里云云原生

2025-05-23

536

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

536

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

通过实验深入了解 TCP 连接的建立和关闭

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

AI Infra之模型显存管理分析

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

通过实验深入了解 TCP 连接的建立和关闭

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

AI Infra之模型显存管理分析

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理