官方博客-第11页-阿里云开发者社区

骆天

2024-05-15

3650

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

3,650

ModelScope

2024-05-15

494

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

494

青熙

2024-11-15

1196

AI经营｜多Agent择优生成商品标题

商品标题中关键词的好坏是商品能否被主搜检索到的关键因素，使用大模型自动优化标题成为【AI经营】中的核心能力之一，本文讲述大模型如何帮助商家优化商品素材，提升商品竞争力。

青熙

1,196

易定

2024-12-06

1021

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,021

李德

2024-12-06

1320

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,320

望宸

2025-02-20

638

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

638

悦达

2025-03-21

1111

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,111

ModelScope

2024-05-15

1181

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,181

山泽

2024-05-15

1302

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

1,302

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

高并发架构设计三大利器：缓存、限流和降级

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

AI经营｜多Agent择优生成商品标题

【实战干货】AI大模型工程应用于车联网场景的实战总结

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

大模型推理服务全景图

监控vLLM等大模型推理性能

元象大模型开源30款量化版本加速低成本部署丨附教程

从零构建现代深度学习框架(TinyDL-0.01)

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

高并发架构设计三大利器：缓存、限流和降级

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

AI经营｜多Agent择优生成商品标题

【实战干货】AI大模型工程应用于车联网场景的实战总结

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

大模型推理服务全景图

监控vLLM等大模型推理性能

元象大模型开源30款量化版本 加速低成本部署丨附教程

从零构建现代深度学习框架(TinyDL-0.01)

元象大模型开源30款量化版本加速低成本部署丨附教程