官方博客-第11页-阿里云开发者社区

李鹏

2024-05-15

743

Serverless Kubernetes 开发实践：异构资源，按需使用

Kubernetes 作为当今云原生业界标准，具备良好的生态以及跨云厂商能力。Kubernetes 很好的抽象了 IaaS 资源交付标准，使得云资源交付变的越来越简单，与此同时用户期望更多的聚焦于业务自身，做到面向应用交付，Serverless 理念也因此而生。那么如何通过原生 k8s 提供Serverless 能力？如何实现GPU等异构资源按需使用？这里给大家介绍一下我们在Serverless Kubernetes 开发实践：异构资源，按需使用。

李鹏

743

易定

2024-12-06

1222

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,222

探索云世界

2025-08-05

1051

Qwen-MT：翻得快，译得巧

今天，机器翻译模型Qwen-MT正式上线，支持92种语言互译，具备高度可控性与低延迟、低成本特点，适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

探索云世界

1,051

ModelScope

2024-05-15

110146

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,146

ModelScope

2024-05-15

905

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型，有如下几个特点

ModelScope

905

ModelScope

2024-05-15

1322

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,322

一默

2024-08-26

408

打破传统叙事逻辑，构建基于原子化任务的人机交互

在复杂中后台设计中，为解决配置变更影响多场景问题，提出结合正向和逆向信息架构，采用原子化任务，动态组合任务，降低用户和开发成本，优化体验并改变已有的产品迭代和人机交互模式。未来可能发展为AI自动根据业务规则和用户行为生成最佳方案。

一默

408

新念

2025-02-14

1570

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,570

阿里云云原生

2025-06-24

668

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

通义灵码现已全面支持Qwen3，新增智能体模式，具备自主决策、环境感知、工具使用等能力，可端到端完成编码任务。支持问答、文件编辑、智能体多模式自由切换，结合MCP工具与记忆功能，提升开发效率。AI IDE重构编程流程，让开发更智能高效。

阿里云云原生

668

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

Serverless Kubernetes 开发实践：异构资源，按需使用

【实战干货】AI大模型工程应用于车联网场景的实战总结

Qwen-MT：翻得快，译得巧

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

vLLM部署Yuan2.0：高吞吐、更便捷

打破传统叙事逻辑，构建基于原子化任务的人机交互

DeepSeek-V3 高效训练关键技术分析

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless Kubernetes 开发实践：异构资源，按需使用

【实战干货】AI大模型工程应用于车联网场景的实战总结

Qwen-MT：翻得快，译得巧

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

vLLM部署Yuan2.0：高吞吐、更便捷

打破传统叙事逻辑，构建基于原子化任务的人机交互

DeepSeek-V3 高效训练关键技术分析

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城