官方博客-第22页-阿里云开发者社区

张浩然郭小兵

2024-11-25

517

智能调度、秒级弹性｜一文带你探索Compaction Service的进化之路

ADB MySQL的Compaction Service功能通过将Compaction任务从存储节点解耦至独立的弹性资源池执行，解决了资源隔离性弱、并发度低等问题，实现了资源消耗降低50%，任务执行时间平均减少40%，并支持按量付费，提升了系统的稳定性和成本效益。

张浩然郭小兵

517

易定

2024-12-06

1031

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,031

望宸

2025-02-20

644

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

644

亦达

2025-02-20

706

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

706

言澈

2025-02-28

1172

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,172

致问

2023-09-15

120024

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,024

孟威

2024-05-15

105529

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,529

探索云世界

2024-05-15

40612

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

幻兽帕鲁最近非常火。有些小伙伴可能不喜欢跟陌生人一起玩，那么你可以搭建一个专有服务器和朋友一起联机游戏。自己搭建服务器不仅更私密，还能自定义游戏里的一些选项，比如调整工作速度倍率、经验获取倍率等。这篇教程将引导你在几分钟内快速完成幻兽帕鲁服务器的搭建。

探索云世界

40,612

斜阳

2024-05-15

133383

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

133,383

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

智能调度、秒级弹性｜一文带你探索Compaction Service的进化之路

【实战干货】AI大模型工程应用于车联网场景的实战总结

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

进行GPU算力管理

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

SLS 大模型可观测&安全推理审计标准解决方案

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

智能调度、秒级弹性｜一文带你探索Compaction Service的进化之路

【实战干货】AI大模型工程应用于车联网场景的实战总结

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

进行GPU算力管理

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

SLS 大模型可观测&安全推理审计标准解决方案

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化