云服务器ECS

2023-10-17

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

712

杨永

2024-05-15

652

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

针对Springboot里面使用开源工具使用加解密，替换成阿里云KMS产品进行加解密；

杨永

652

王骜

2024-05-15

164919

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,919

ModelScope

2024-05-15

404

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

404

望宸彦林

2024-06-24

50657

从云原生视角看 AI 原生应用架构的实践

本文核心观点： • 基于大模型的 AI 原生应用将越来越多，容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民，并引入了更多流量，催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能，承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要，API 网关、消息队列、可观测是 AI Infra 的重要组成。

望宸彦林

50,657

霖玉

2023-06-15

13301

大数据SQL数据倾斜与数据膨胀的优化与经验总结

目前市面上大数据查询分析引擎层出不穷，但在业务使用过程中，大多含有性能瓶颈的SQL，主要集中在数据倾斜与数据膨胀问题中。本文结合业界对大数据SQL的使用与优化，尝试给出相对系统性的解决方案。

霖玉

13,301

喻奎

2023-06-25

10076

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,076

刘佳旭

2023-09-26

138063

云原生场景下高可用架构的最佳实践

刘佳旭

138,063

ModelScope

2024-05-15

373

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

373

类目筛选

内容类型

使用ECS部署并使用Docker

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

元象大模型开源30款量化版本加速低成本部署丨附教程

从云原生视角看 AI 原生应用架构的实践

大数据SQL数据倾斜与数据膨胀的优化与经验总结

MaxCompute湖仓一体近实时增量处理技术架构揭秘

云原生场景下高可用架构的最佳实践

vLLM部署Yuan2.0：高吞吐、更便捷

类目筛选

内容类型

使用ECS部署并使用Docker

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

元象大模型开源30款量化版本 加速低成本部署丨附教程

从云原生视角看 AI 原生应用架构的实践

大数据SQL数据倾斜与数据膨胀的优化与经验总结

MaxCompute湖仓一体近实时增量处理技术架构揭秘

云原生场景下高可用架构的最佳实践

vLLM部署Yuan2.0：高吞吐、更便捷

元象大模型开源30款量化版本加速低成本部署丨附教程