官方博客-第24页-阿里云开发者社区

阿里云云原生

2024-11-01

987

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

987

明巍临城水德

2024-11-14

542

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

542

易定

2024-12-06

1049

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,049

阿里云云原生

2025-01-10

523

Qwen2.5 的云端新体验，5 分钟完成极速部署

将 Qwen2.5 模型部署于函数计算 FC，用户能依据业务需求调整资源配置，有效应对高并发场景，并通过优化资源配置，如调整实例规格、多 GPU 部署和模型量化来提升推理速度。此外，函数计算支持多样化 GPU 计费模式（按需计费、阶梯定价、极速模式），可根据业务需求调整，在面对高频请求和大规模数据处理时，能够显著降低综合成本。

阿里云云原生

523

阿里云云原生

2025-01-22

532

两步构建 AI 总结助手，实现智能文档摘要

本方案将运用函数计算 FC，构建一套高可用性的 Web 服务，以满足用户多样化的需求。当用户发起请求时，系统内部会自动将包含文本和提示词的信息传递给百炼模型服务，百炼平台将根据后台配置调用相应的大模型服务，对文本数据进行智能识别与解析，最终将总结结果返回给用户。

阿里云云原生

532

望宸

2025-02-20

670

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

670

李德

2025-04-03

417

结合多模态RAG和异步调用实现大模型内容

文章探讨了如何利用多模态大模型和工程优化手段提升物流理赔业务效率。核心方案包括：通过多模态RAG技术实现图片查重，结合异步调用方法优化货损识别功能。

李德

417

以珩

2025-04-10

518

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

518

阿里云云原生

2025-04-29

690

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

本文介绍了阿里云Prometheus 2.0方案，针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集，采用全新时序存储引擎提升性能，并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力，结合PromQL与SPL语言增强分析功能。此外，该方案已成功应用于阿里云内部AI系统，如百炼、通义千问等大模型全链路监控。未来，阿里云将发布云监控2.0产品，进一步完善智能观测技术栈。

阿里云云原生

690

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

【实战干货】AI大模型工程应用于车联网场景的实战总结

Qwen2.5 的云端新体验，5 分钟完成极速部署

两步构建 AI 总结助手，实现智能文档摘要

大模型推理服务全景图

结合多模态RAG和异步调用实现大模型内容

用自定义插件生成一篇图文并茂的文章

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

【实战干货】AI大模型工程应用于车联网场景的实战总结

Qwen2.5 的云端新体验，5 分钟完成极速部署

两步构建 AI 总结助手，实现智能文档摘要

大模型推理服务全景图

结合多模态RAG和异步调用实现大模型内容

用自定义插件生成一篇图文并茂的文章

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理