官方博客-第47页-阿里云开发者社区

ModelScope

2024-05-15

1120

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,120

阿里云云原生

2024-05-15

44083

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

在本文中，作者探讨了ZooKeeper（ZK）的一个内存占用问题，特别是当有大量的Watcher和ZNode时，导致的内存消耗。

阿里云云原生

44,083

阿里云瑶池数据库

2024-05-15

1146

数据库索引回表困难，揭秘PolarDB存储引擎优化技术

PolarDB分布式版存储引擎采用CSM方案均衡资源开销与可用性。

阿里云瑶池数据库

1,146

阿里云云原生

2024-05-21

57438

函数计算助力领健信息为“看牙”注入 AI 活力

口腔治疗+函数计算=效率提升🚀 领健作为业界领先的口腔机构，面向口腔诊所提供正畸算法，但早期的算法部署遇到较多问题，因此在对比了阿里云的多个云产品之后，最终选择了函数计算。通过将 GPU 计算负载放到函数计算，领健技术团队达到了很好的降本效果，相比早前的按月持有 GPU 资源，函数计算的费用降低了 90% 左右，并大大提升了使用体验，实现了前所未有的敏捷性和效率。

阿里云云原生

57,438

资源编排ROS

2024-06-06

438

一键云部署：资源编排 ROS 轻松部署 LLM 流程编排服务 Flowise

Flowise 是一个开源低代码平台，用于构建定制化的 LLM 流程和 AI 代理。阿里云的 Resource Orchestration Service (ROS) 提供了一键部署 Flowise 到 ECS 实例的方案。用户只需在 ROS 控制台配置模板参数，如可用区和实例类型，即可完成部署。部署后，从资源栈输出获取 Flowise 服务地址以开始使用。ROS 模板定义了 VPC、ECS 实例等资源，并通过 ROS 自动化部署，简化了云上资源和应用的管理。

资源编排ROS

438

阿里云云原生

2024-06-13

56100

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

区别于传统的流水线工具，本实验将带你体验云效应用交付平台 AppStack，从应用视角，完成一个 AI 聊天应用的高效交付。

阿里云云原生

56,100

阿里云瑶池数据库

2024-07-18

333

Redis Proxy RT上升后连接倾斜

本文细致地描述了关于Redis Proxy RT上升后连接倾斜问题的排查过程和根本原因，最后给出了优化方案。

阿里云瑶池数据库

333

百潼

2024-08-12

8128

敦煌智旅：Serverless 初探，运维提效 60%

SAE 提供了一个开箱即用的 Serverless PaaS 平台，提供了微服务、监控等能力，帮助敦煌智旅很好地解决了发版困难、运维困难、弹性能力不足和资源利用率低等痛点问题。成功实现轻松应对 10 倍突增流量洪峰，运维效率大幅提升。

百潼

8,128

阿里云云原生

2024-09-02

458

基于 RocketMQ 的云原生 MQTT 消息引擎设计

本文将介绍阿里云如何将 Serverless 架构应用于消息队列，有效降低运营成本，同时利用云原生环境的特性，为 IoT 设备提供快速响应和灵活伸缩的通讯能力。

阿里云云原生

458

官方博客-第47页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

数据库索引回表困难，揭秘PolarDB存储引擎优化技术

函数计算助力领健信息为“看牙”注入 AI 活力

一键云部署：资源编排 ROS 轻松部署 LLM 流程编排服务 Flowise

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

Redis Proxy RT上升后连接倾斜

敦煌智旅：Serverless 初探，运维提效 60%

基于 RocketMQ 的云原生 MQTT 消息引擎设计

官方博客-第47页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

数据库索引回表困难，揭秘PolarDB存储引擎优化技术

函数计算助力领健信息为“看牙”注入 AI 活力

一键云部署：资源编排 ROS 轻松部署 LLM 流程编排服务 Flowise

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

Redis Proxy RT上升后连接倾斜

敦煌智旅：Serverless 初探，运维提效 60%

基于 RocketMQ 的云原生 MQTT 消息引擎设计