云服务器ECS

2023-10-17

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

712

ModelScope

2024-05-15

404

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

404

望宸彦林

2024-06-24

50657

从云原生视角看 AI 原生应用架构的实践

本文核心观点： • 基于大模型的 AI 原生应用将越来越多，容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民，并引入了更多流量，催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能，承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要，API 网关、消息队列、可观测是 AI Infra 的重要组成。

望宸彦林

50,657

喻奎

2023-06-25

10076

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,076

刘佳旭

2023-09-26

138063

云原生场景下高可用架构的最佳实践

刘佳旭

138,063

霜键

2024-05-15

112510

线程操纵术之更优雅的并行策略

本文详细介绍了并行编程以及一些并行问题案例中的真实业务场景。

霜键

112,510

ModelScope

2024-05-15

373

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

373

元泊

2024-05-15

127

SLS：基于OTel的移动端全链路Trace建设思考和实践

本文探讨了移动端全链路Trace的建设思考和实践。

元泊

127

阿里云云原生

2024-05-22

60082

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

超算快速弹性伸缩场景下，如何构建一套准确、快速、可靠的监控体系成为关键点。阿里云在超算场景的主机监控落地实践，解决超算场景面临的挑战，交付一套可靠和全面的主机监控体系。

阿里云云原生

60,082

类目筛选

内容类型

使用ECS部署并使用Docker

元象大模型开源30款量化版本加速低成本部署丨附教程

从云原生视角看 AI 原生应用架构的实践

MaxCompute湖仓一体近实时增量处理技术架构揭秘

云原生场景下高可用架构的最佳实践

线程操纵术之更优雅的并行策略

vLLM部署Yuan2.0：高吞吐、更便捷

SLS：基于OTel的移动端全链路Trace建设思考和实践

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

类目筛选

内容类型

使用ECS部署并使用Docker

元象大模型开源30款量化版本 加速低成本部署丨附教程

从云原生视角看 AI 原生应用架构的实践

MaxCompute湖仓一体近实时增量处理技术架构揭秘

云原生场景下高可用架构的最佳实践

线程操纵术之更优雅的并行策略

vLLM部署Yuan2.0：高吞吐、更便捷

SLS：基于OTel的移动端全链路Trace建设思考和实践

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

元象大模型开源30款量化版本加速低成本部署丨附教程