官方博客-第3页-阿里云开发者社区

有松

2025-01-16

452

AI 场景下，函数计算 GPU 实例模型存储最佳实践

当前，函数计算 FC 已被广泛应用在各种 AI 场景下，函数计算支持通过使用容器镜像部署 AI 推理应用，并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用，并快速解决不同场景下的模型存储选型问题，本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析，以期为您的模型存储决策提供帮助。

有松

452

子白

2024-05-15

102601

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,601

阿里云云原生

2025-01-08

459

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

对于正在使用 GitLab 国际站托管代码的企业和研发团队，除迁移至极狐 GitLab 外，国内其他主流的 DevOps 平台也具有完备的产品能力，为开发者提供了更多的选择。其中，阿里云云效也提供了针对常见代码托管平台如 GitHub、GitLab 简单便捷的迁移方案，帮助用户快速完成核心代码数据的迁移，确保代码资产安全。

阿里云云原生

459

吴昆

2024-05-15

222171

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,171

寒斜

2024-06-24

36683

文章介绍了GPT-Sovits，一个开源的生成式语音模型，因其在声音克隆上的高质量和简易性而受到关注。阿里云函数计算（Function Compute）提供了一个快速托管GPT-Sovits的方法，让用户无需管理服务器即可体验和部署该模型。通过函数计算，用户可以便捷地搭建基于GPT-Sovits的文本到语音服务，并享受到按需付费和弹性扩展的云服务优势。此外，文章还列举了GPT-Sovits在教育、游戏、新能源等多个领域的应用场景，并提供了详细的步骤指导，帮助用户在阿里云上部署和体验GPT-Sovits模型。

寒斜

36,683

阿里云云原生

2024-05-15

1000

阿里云 SAE 2.0 正式商用，极简易用、百毫秒弹性效率，降本 40%

本文主要介绍阿里云 Serverless 应用引擎如何帮助企业跨越技术鸿沟，从传统应用架构无感升级到 Serverless 架构，以更高效、更经济的方式进行转型，快速进入云原生快车道，让 2 人的研发团队享受 2000 人技术团队的红利。

阿里云云原生

1,000

正己

2025-01-06

428

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

428

田双坤禹杨杨孙健翔

2024-05-15

101874

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

田双坤禹杨杨孙健翔等

101,874

阿里云云原生

2024-05-15

935

从自建DevOps部署微服务再到云效

以Jenkins+Gitlab基于k8s集群实现自建DevOps系统的方式部署开源微服务PiggyMetrics，与云效DevOps对比，介绍真正的免运维，实现高效的业务开发流程。

阿里云云原生

935

官方博客-第3页-阿里云开发者社区

类目筛选

内容类型

AI 场景下，函数计算 GPU 实例模型存储最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

Kube Queue：Kubernetes 任务排队的利器

AI 克隆声音，只需 3 分钟（附最全教程）

阿里云 SAE 2.0 正式商用，极简易用、百毫秒弹性效率，降本 40%

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

从自建DevOps部署微服务再到云效

官方博客-第3页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI 场景下，函数计算 GPU 实例模型存储最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

Kube Queue：Kubernetes 任务排队的利器

AI 克隆声音，只需 3 分钟（附最全教程）

阿里云 SAE 2.0 正式商用，极简易用、百毫秒弹性效率，降本 40%

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

从自建DevOps部署微服务再到云效