官方博客-第28页-阿里云开发者社区

ModelScope

2024-05-15

1128

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,128

景祁

2024-05-15

164484

设计与构建 FinOps 流程、团队、体系与目标

企业 FinOps 实施不是一蹴而就的项目，如果您正在推进企业云原生 FinOps 落地，除了选择合适的技术手段，企业内部的流程和体系建设也尤为重要。

景祁

164,484

资源编排ROS

2024-06-24

400

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

基于 IaC 的理念，通过定义一个模板，使用 ROS 提供的 Terraform 托管服务进行自动化部署，可以非常高效快捷地部署任意云资源和应用（比如 ChatTTS 服务）。相比于手动部署或者通过 API、SDK 的部署方式，有着高效、稳定等诸多优势，也是服务上云的最佳实践。

资源编排ROS

400

张昕东

2024-07-25

14023

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,023

阿里云云原生

2024-10-18

962

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

962

明巍临城水德

2024-11-14

511

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

511

龙蜥社区OpenAnolis

2024-11-22

462

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

Anolis OS 作为国内首个正式提供 OpenVINO 开发包和镜像的服务器端操作系统，推动国内 AI 推理生态和能力的升级。

龙蜥社区OpenAnolis

462

寒空横槊娜米公仪等

2024-12-26

416

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

阿里云云消息队列 Kafka 版 Serverless 系列凭借其卓越的弹性能力，为道旅科技提供了灵活高效的数据流处理解决方案。无论是应对突发流量还是规划长期资源需求，该方案均能帮助企业实现资源动态调整和成本优化，同时保障业务的高可用性和连续性。

寒空横槊娜米公仪等

416

阿里云云原生

2025-02-25

1104

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,104

官方博客-第28页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

设计与构建 FinOps 流程、团队、体系与目标

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

解锁 DeepSeek 安全接入、稳定运行新路径

官方博客-第28页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

设计与构建 FinOps 流程、团队、体系与目标

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

解锁 DeepSeek 安全接入、稳定运行新路径

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理