王骜

2024-05-15

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,939

ModelScope

2024-05-15

428

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

428

阿里云云原生

2024-05-15

73

实践总结｜前端架构设计的一点考究（中）

本文总结了作者在日常/大促业务的“敏捷”开发过程中产生的疑惑，并尝试做出思考得到一些解决思路和方案。在前端开发和实践过程中，梳理了一些简单设计方案可以缓解当时 “头疼” 的几个敏捷迭代问题，并实践在项目迭代中。

阿里云云原生

73

ModelScope

2024-05-15

411

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

411

阿里云实时数仓Hologres

2024-05-15

74405

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

74,405

澄潭董艺荃

2024-05-16

87961

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

87,961

阿里云云原生

2024-07-29

160

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

160

资源编排ROS

2019-12-24

1904

资源编排ROS之自定制资源（基础篇）

本文介绍资源编排ROS的基础知识配置。

资源编排ROS

1,904

执壹海平塞缪

2023-06-02

6790

深度解析PolarDB DDL锁的优化和演进

DDL是数据库所有SQL操作中最繁重的一种，本文总结介绍了云原生数据库PolarDB中DDL全链路MDL锁治理的经验和进展，持续优化用户的使用体验，为用户打造最佳的云原生数据库。

执壹海平塞缪等

6,790

类目筛选

内容类型

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

实践总结｜前端架构设计的一点考究（中）

vLLM部署Yuan2.0：高吞吐、更便捷

大数据分析平台之 OLAP 架构的最佳实践

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

从供应商深度绑定，到走向真正的云原生，他们是这样做的

资源编排ROS之自定制资源（基础篇）

深度解析PolarDB DDL锁的优化和演进