官方博客-第25页-阿里云开发者社区

ModelScope

2024-05-15

1128

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,128

景祁

2024-05-15

164484

设计与构建 FinOps 流程、团队、体系与目标

企业 FinOps 实施不是一蹴而就的项目，如果您正在推进企业云原生 FinOps 落地，除了选择合适的技术手段，企业内部的流程和体系建设也尤为重要。

景祁

164,484

资源编排ROS

2024-06-24

400

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

基于 IaC 的理念，通过定义一个模板，使用 ROS 提供的 Terraform 托管服务进行自动化部署，可以非常高效快捷地部署任意云资源和应用（比如 ChatTTS 服务）。相比于手动部署或者通过 API、SDK 的部署方式，有着高效、稳定等诸多优势，也是服务上云的最佳实践。

资源编排ROS

400

张昕东

2024-07-25

14023

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,023

阿里云云原生

2024-09-02

660

西游再现，一键部署 Flux 文生图大模型生成西游人物

从花果山的灵石出世，到取经路上的九九八十一难，再到大闹天宫的惊心动魄……这些耳熟能详的西游场景，如今都能通过 Flux 模型，以超乎想象的细节和真实感呈现在你眼前。本次实验在函数计算中内置的 flux.1-dev-fp8 大模型，搭配 Lora 模型，无需复杂的配置，一键部署，你就能成为这场视觉盛宴的创造者。

阿里云云原生

660

浅奕

2024-09-05

378

通过实验深入了解 TCP 连接的建立和关闭

TCP/IP 这个主题很多文章比较陈旧，且以讹传讹的东西太多，所以本文作者结合了理论和实践去写，旨在通过一系列实验帮助读者深入理解 TCP 连接的建立过程。

浅奕

378

不达

2024-09-11

308

内核网络小白之故障寻踪记

本文记述了一次由 skb（socket buffer）异常导致的内核故障排查过程。

不达

308

寒斜

2024-10-11

1002

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

今天分享一下，基于阿里云函数计算 FC 以及 CAP（云应用开发平台），极速托管专属的 CosyVoice 应用。并且我们提供了 API 调用方案以及镜像构建源码方便您根据自己的业务任意 DIY。

寒斜

1,002

阿里云云原生

2024-10-18

962

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

962

官方博客-第25页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

设计与构建 FinOps 流程、团队、体系与目标

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

西游再现，一键部署 Flux 文生图大模型生成西游人物

通过实验深入了解 TCP 连接的建立和关闭

内核网络小白之故障寻踪记

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

官方博客-第25页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

设计与构建 FinOps 流程、团队、体系与目标

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

西游再现，一键部署 Flux 文生图大模型生成西游人物

通过实验深入了解 TCP 连接的建立和关闭

内核网络小白之故障寻踪记

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案