凡澈

2024-05-15

为什么 Lettuce 会带来更长的故障时间

本文详述了阿里云数据库 Tair/Redis 将使用长连接客户端在非预期故障宕机切换场景下的恢复时间从最初的 900s 降到 120s 再到 30s的优化过程，涉及产品优化，开源产品问题修复等诸多方面。

凡澈

63,328

阿里云存储

2024-05-15

138304

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

138,304

祎程

2024-06-19

89

通过OOS定时升级Redis实例临时带宽

阿里云OOS提供了定时升级Redis实例临时带宽的功能，以应对数据驱动业务中的流量高峰。这个功能允许用户根据预测的业务负载，在特定日期和时间自动增加Redis实例的带宽，确保服务性能和稳定性。在高流量事件结束后，带宽会自动恢复到原设置，节省成本。此功能适用于电商平台促销、大型游戏更新等场景，确保在流量高峰期间的系统稳定运行。

祎程

89

玄弟

2024-05-15

149

PolarDB-X用15M内存跑1G的TPCH

在数据时代，过多耗内存的大查询都有可能压垮整个集群，所以其内存管理模块在整个系统中扮演着非常重要的角色。而PolarDB-X 作为一款分布式数据库，其面对的数据可能从TB到GB字节不等，同时又要支持TP和AP Workload，要是在计算过程中内存使用不当，不仅会造成TP和AP相互影响，严重拖慢响应时间，甚至会出现内存雪崩、OOM问题，导致数据库服务不可用。CPU和MEMORY相对于网络带宽比较昂贵，所以PolarDB-X 代价模型中，一般不会将涉及到大量数据又比较耗内存的计算下推到存储DN，DN层一般不会有比较耗内存的计算。这样还有一个好处，当查询性能低的时候，无状态的CN节点做弹性扩容代价相对于DN也低。鉴于此，所以本文主要对PolarDB-X计算层的内存管理进行分析，这有助于大家有PolarDB-X有更深入的理解。

玄弟

149

凡玺

2024-05-15

121476

Ganos实时热力聚合查询能力解析与最佳实践

本文主要介绍Ganos实时热力聚合查询并动态输出热力瓦片能力，依托阿里云PolarDB PostgreSQL产品、ADB PostgreSQL和RDS PostgreSQL 三款数据库建设输出。

凡玺

121,476

阿里云存储

2024-05-15

94770

AIGC训练场景下的存储特征研究

在今天这样以AIGC为代表的AI时代下，了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告，来看看AIGC对于存储有哪些具体的性能要求。

阿里云存储

94,770

孟威

2024-05-15

104068

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,068

云服务器ECS

2023-10-17

594

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

594

安正

2023-08-31

1021

便捷、快速、稳定、高性能，以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术

在多维度的优化加持下，Alibaba Cloud Linux 3 解决了 AI 开发人员的痛点问题，让 AI 开发体验更容易更高效。

安正

1,021

类目筛选

内容类型

为什么 Lettuce 会带来更长的故障时间

用软硬协同设计下的飞天盘古降低存储系统开销

通过OOS定时升级Redis实例临时带宽

PolarDB-X用15M内存跑1G的TPCH

Ganos实时热力聚合查询能力解析与最佳实践

AIGC训练场景下的存储特征研究

SLS 大模型可观测&安全推理审计标准解决方案

使用ECS部署并使用Docker

便捷、快速、稳定、高性能，以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术