官方博客-第12页-阿里云开发者社区

悦达

2025-03-21

1121

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,121

阿里云云原生

2025-08-01

990

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

Qwen3 Coder 是全球领先的开源编程大模型，具备强大的代码生成能力与1M超长上下文支持，适用于构建复杂应用。本文通过实际案例展示其在电商网站开发中的应用，并详解提示词设计、技术拆解与部署方案，探讨Agentic AI落地的挑战与经验。

阿里云云原生

990

ModelScope

2024-05-15

501

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

501

乐忱

2024-06-14

39882

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

39,882

无哲

2024-08-13

13172

更快更强，SLS 推出高性能 SPL 日志查询模式

从海量的日志数据中，按照各种灵活的条件进行即时查询搜索，是可观测场景下的基本需求。本文介绍了 SLS 新推出的高性能 SPL 日志查询模式，支持 Unix 风格级联管道式语法，以及各种丰富的 SQL 处理函数。同时通过计算下推、向量化计算等优化，使得 SPL 查询可以在数秒内处理亿级数据，并支持 SPL 过滤结果分布图、随机翻页等特性。

无哲

13,172

易定

2024-12-06

1028

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,028

阿里云云原生

2025-01-14

780

从传统家电到智能生活，海尔智家的服务治理实践

海尔与阿里云的合作不仅推动了自身的技术革新和服务升级，更为整个智能家居行业树立了典范。在未来的发展道路上，双方将继续携手共进，共同迎接 AI 时代的到来，为全球用户创造更加美好的智慧生活。

阿里云云原生

780

阿里云云原生

2025-01-26

1234

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,234

望宸

2025-02-07

756

浏览量超 10w 的热图，描述 RAG 的主流架构

大模型性能的持续提升，进一步挖掘了 RAG 的潜力，RAG 将检索系统与生成模型相结合，带来诸多优势，如实时更新知识、降低成本等。点击本文，为您梳理 RAG 的基本信息，并介绍提升大模型生成结果的方法，快一起看看吧~

望宸

756

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

监控vLLM等大模型推理性能

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

AI时代：云存储加速多模态数据存储与管理创新

更快更强，SLS 推出高性能 SPL 日志查询模式

【实战干货】AI大模型工程应用于车联网场景的实战总结

从传统家电到智能生活，海尔智家的服务治理实践

最近谈论 SSE 和 WebSocket 的人越来越多的原因

浏览量超 10w 的热图，描述 RAG 的主流架构

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

监控vLLM等大模型推理性能

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

AI时代：云存储加速多模态数据存储与管理创新

更快更强，SLS 推出高性能 SPL 日志查询模式

【实战干货】AI大模型工程应用于车联网场景的实战总结

从传统家电到智能生活，海尔智家的服务治理实践

最近谈论 SSE 和 WebSocket 的人越来越多的原因

浏览量超 10w 的热图，描述 RAG 的主流架构