官方博客-第15页-阿里云开发者社区

ModelScope

2024-05-15

110042

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,042

探索云世界

2024-12-20

886

AI场景下的对象存储OSS数据管理实践

本文介绍了对象存储（OSS）在AI业务中的应用与实践。内容涵盖四个方面：1) 对象存储作为AI数据基石，因其低成本和高弹性成为云上数据存储首选；2) AI场景下的对象存储实践方案，包括数据获取、预处理、训练及推理阶段的具体使用方法；3) 国内主要区域的默认吞吐量提升至100Gbps，优化了大数据量下的带宽需求；4) 常用工具介绍，如OSSutil、ossfs、Python SDK等，帮助用户高效管理数据。重点讲解了OSS在AI训练和推理中的性能优化措施，以及不同工具的特点和应用场景。

探索云世界

886

阿里云云原生

2025-01-22

653

AI 短剧遇上函数计算，一键搭建内容创意平台

为了帮助更多内容创作者和企业快速实现 AI 短剧创作，函数计算 FC 联合百炼联合推出“AI 剧本生成与动画创作解决方案”，通过函数计算 FC 构建 Web 服务，结合百炼模型服务和 ComfyUI 生图平台，实现从故事剧本撰写、插图设计、声音合成和字幕添加到视频合成的一站式自动化流程。创作者只需通过简单操作，就能快速生成高质量的剧本，并一键转化为精美的动画。

阿里云云原生

653

新念

2025-02-14

1469

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,469

阿里云云原生

2025-04-22

1388

从零开始开发 MCP Server

本文介绍如何使用Serverless Devs CLI工具从零开发并一键部署MCP Server到阿里云函数计算（FC）。首先通过初始化MCP Server项目，完成本地代码编写，利用Node.js实现一个简单的Hello World工具。接着对代码进行打包，并通过Serverless Devs工具将项目部署至云端。部署完成后，提供三种客户端接入方式：官方Client、其他本地Client及在FC上部署的Client。最后可通过内置大模型的inspector测试部署效果。Serverless Devs简化了开发流程，提升了MCP Server的构建效率。

阿里云云原生

1,388

宝惜

2024-11-15

516

架构师的真内核

本文旨在帮助大家深入理解技术、架构和团队领导力的本质，从而获得持续成长的方法。欢迎在文末留言，你觉得架构师需要具备的核心能力是什么？

宝惜

516

阿里云云原生

2025-08-26

538

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

阿里云云速搭 CADT（Cloud Architect Design Tools）推出智能化升级——云小搭，一款基于大模型的 AI 云架构助手，致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。

阿里云云原生

538

赫曦

2024-05-15

93226

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,226

ModelScope

2024-05-15

1187

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,187

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

AI场景下的对象存储OSS数据管理实践

AI 短剧遇上函数计算，一键搭建内容创意平台

DeepSeek-V3 高效训练关键技术分析

从零开始开发 MCP Server

架构师的真内核

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

vLLM部署Yuan2.0：高吞吐、更便捷

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

AI场景下的对象存储OSS数据管理实践

AI 短剧遇上函数计算，一键搭建内容创意平台

DeepSeek-V3 高效训练关键技术分析

从零开始开发 MCP Server

架构师的真内核

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

vLLM部署Yuan2.0：高吞吐、更便捷