官方博客-第26页-阿里云开发者社区

阿里云云原生

2024-11-01

966

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

966

肯梦筱姜

2025-02-11

658

DeepSeek 凭借其卓越的性能和广泛的应用场景，迅速在全球范围内获得了极高的关注度和广泛的用户基础。DeepSeek-R1-Distill 是使用 DeepSeek-R1 生成的样本对开源模型进行蒸馏得到的小模型，拥有更小参数规模，推理成本更低，基准测试同样表现出色。依托于函数计算 FC 算力，Serverless+ AI 开发平台 CAP 现已提供模型服务、应用模版两种部署方式辅助您部署 DeepSeek R1 系列模型。完成模型部署后，您即可与模型进行对话体验；或以 API 形式进行调用，接入 AI 应用中。欢迎您立即体验。

肯梦筱姜

658

言澈

2025-02-28

1167

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,167

王晨

2025-04-03

799

大模型上下文协议 MCP 带来了哪些货币化机会

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

799

以珩

2025-04-10

489

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

489

孤弋孚阳

2025-05-07

484

破茧成蝶：阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代

本文详细介绍了阿里云应用服务器如何助力传统J2EE应用实现智能化升级。文章分为三部分：第一部分阐述了传统J2EE应用在智能化转型中的痛点，如协议鸿沟、资源冲突和观测失明；第二部分展示了阿里云应用服务器的解决方案，包括兼容传统EJB容器与微服务架构、支持大模型即插即用及全景可观测性；第三部分则通过具体步骤说明如何基于EDAS开启J2EE应用的智能化进程，确保十年代码无需重写，轻松实现智能化跃迁。

孤弋孚阳

484

非有

2024-05-15

1478

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

1,478

ModelScope

2024-05-15

927

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

927

ModelScope

2024-05-15

1446

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

零一万物发布并开源了Yi系列中的“理科状元”——Yi-9B，可在魔搭体验

ModelScope

1,446

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

0 代码！2 种方式，一键部署 DeepSeek 系列模型

进行GPU算力管理

大模型上下文协议 MCP 带来了哪些货币化机会

用自定义插件生成一篇图文并茂的文章

破茧成蝶：阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代

一文详解 Java 限流接口实现

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

0 代码！2 种方式，一键部署 DeepSeek 系列模型

进行GPU算力管理

大模型上下文协议 MCP 带来了哪些货币化机会

用自定义插件生成一篇图文并茂的文章

破茧成蝶：阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代

一文详解 Java 限流接口实现

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践