官方博客-第11页-阿里云开发者社区

ModelScope

2024-05-15

1322

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,322

阿里云实时数仓Hologres

2024-06-27

3132

实时数仓Hologres OLAP场景核心能力介绍

Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎，解决复杂OLAP难题。

阿里云实时数仓Hologres

3,132

易定

2024-12-06

1221

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,221

阿里云云原生

2025-04-17

1434

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

通义灵码新上的外挂 Project Rules 获得了开发者的一致好评：最小成本适配我的开发风格、相当把团队经验沉淀下来，是个很好功能……

阿里云云原生

1,434

探索云世界

2025-11-17

171

PAIFuser：面向图像视频的训练推理加速框架

阿里云PAI推出PAIFuser框架，专为视频生成模型设计，通过模型并行、量化优化、稀疏运算等技术，显著提升DiT架构的训练与推理效率。实测显示，推理耗时最高降低82.96%，训练时间减少28.13%，助力高效低成本AI视频生成。

探索云世界

171

一默

2024-08-26

408

打破传统叙事逻辑，构建基于原子化任务的人机交互

在复杂中后台设计中，为解决配置变更影响多场景问题，提出结合正向和逆向信息架构，采用原子化任务，动态组合任务，降低用户和开发成本，优化体验并改变已有的产品迭代和人机交互模式。未来可能发展为AI自动根据业务规则和用户行为生成最佳方案。

一默

408

新念

2025-02-14

1570

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,570

DataWorks团队

2025-04-17

912

智能体Agent：用自然语言重构数据开发

本文分享如何基于利用MCP协议，配置MCP Server，以调用大数据开发与治理平台DataWorks Open API搭建智能体Agent，实现通过自然语言完成数据集成与数据开发等任务。文章还介绍了MCP协议的基本知识，帮助大家了解背后实现原理。大家可以通过自行配置体验数据工作流智能自动化运行。

DataWorks团队

912

ModelScope

2024-05-15

110144

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,144

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

实时数仓Hologres OLAP场景核心能力介绍

【实战干货】AI大模型工程应用于车联网场景的实战总结

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

PAIFuser：面向图像视频的训练推理加速框架

打破传统叙事逻辑，构建基于原子化任务的人机交互

DeepSeek-V3 高效训练关键技术分析

智能体Agent：用自然语言重构数据开发

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

实时数仓Hologres OLAP场景核心能力介绍

【实战干货】AI大模型工程应用于车联网场景的实战总结

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

PAIFuser：面向图像视频的训练推理加速框架

打破传统叙事逻辑，构建基于原子化任务的人机交互

DeepSeek-V3 高效训练关键技术分析

智能体Agent：用自然语言重构数据开发

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践