云服务器ECS

2023-10-17

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

712

杨永

2024-05-15

652

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

针对Springboot里面使用开源工具使用加解密，替换成阿里云KMS产品进行加解密；

杨永

652

王骜

2024-05-15

164919

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,919

ModelScope

2024-05-15

404

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

404

望宸彦林

2024-06-24

50657

从云原生视角看 AI 原生应用架构的实践

本文核心观点： • 基于大模型的 AI 原生应用将越来越多，容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民，并引入了更多流量，催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能，承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要，API 网关、消息队列、可观测是 AI Infra 的重要组成。

望宸彦林

50,657

喻奎

2023-06-25

10076

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,076

元乙

2023-11-06

127739

从存储统一到数据融合，SLS在可观测场景的思考和行动

介绍SLS在可观测数据融合分析的一系列技术升级，融合Trace、全栈监控、Continuous Profiling、移动端监控等功能，帮助大家更快速地构筑全栈、自动化的观测能力。

元乙

127,739

ModelScope

2024-05-15

373

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

373

阿里云云原生

2024-05-22

60082

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

超算快速弹性伸缩场景下，如何构建一套准确、快速、可靠的监控体系成为关键点。阿里云在超算场景的主机监控落地实践，解决超算场景面临的挑战，交付一套可靠和全面的主机监控体系。

阿里云云原生

60,082

类目筛选

内容类型

使用ECS部署并使用Docker

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

元象大模型开源30款量化版本加速低成本部署丨附教程

从云原生视角看 AI 原生应用架构的实践

MaxCompute湖仓一体近实时增量处理技术架构揭秘

从存储统一到数据融合，SLS在可观测场景的思考和行动

vLLM部署Yuan2.0：高吞吐、更便捷

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

类目筛选

内容类型

使用ECS部署并使用Docker

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

元象大模型开源30款量化版本 加速低成本部署丨附教程

从云原生视角看 AI 原生应用架构的实践

MaxCompute湖仓一体近实时增量处理技术架构揭秘

从存储统一到数据融合，SLS在可观测场景的思考和行动

vLLM部署Yuan2.0：高吞吐、更便捷

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

元象大模型开源30款量化版本加速低成本部署丨附教程