客户说|知乎基于阿里云PolarDB,实现最大数据库集群云原生升级

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
云数据库 RDS SQL Server,基础系列 2核4GB
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
简介: 近日,知乎最大的风控业务数据库集群,基于阿里云瑶池数据库完成了云原生技术架构的升级。此次升级不仅显著提升了系统的高可用性和性能上限,还大幅降低了底层资源成本。

近日,知乎最大的风控业务数据库集群,基于阿里云瑶池数据库完成了云原生技术架构的升级。此次升级不仅显著提升了系统的高可用性和性能上限,还大幅降低了底层资源成本。这一里程碑式的进展标志着知乎数据库架构在云原生技术领域迈出了重要一步,同时也为未来业务的持续增长奠定了坚实的技术基础。

未标题-2.png

作为一款国民级的高质量内容社区应用,知乎为了保障平台的健康平稳运行,需要实时对海量数据进行异常分析和实施风控措施。这些风控数据具有以下几个显著特点,为其存储和传输带来了巨大挑战

  • 数据结构复杂:不同类型的风控数据字段差异较大,通常需要用 JSON 这类灵活的数据格式进行封装存储。同时,还需要支持对 JSON 中的部分字段进行实时查询和动态更新操作。
  • 单条数据存储空间大:为了方便后续追溯与分享,风控数据往往包含了完整的上下游链路信息,导致每条记录的内容非常丰富,单条数据大小常常超过 1MB。
  • 入突发峰值高:在热点事件或遭遇黑产流量攻击时,风控数据的写入量会瞬间暴涨数倍甚至更高,对系统的瞬时写入能力提出了极高的要求。

这些特点使得风控数据的处理远比普通业务数据更加复杂。知乎风控业务原有的数据库技术架构基于自建 ETL 链路 + 自建分布式数据库组合,但随着业务规模的持续增长,这套架构逐渐暴露出一些不足和隐患

  • 性能瓶颈:自建的 ETL 链路在处理 JSON 类型数据时逻辑复杂,效率低,尤其在面对突发流量时,经常出现数据同步延迟,影响了整体服务的稳定性。
  • 高可用能力不足:当上下游数据源发生故障并进行高可用切换(HA)时,现有架构无法自动完成链路切换与联动恢复,导致系统在异常情况下的容错能力和恢复效率大幅下降,进一步增加了业务中断的可能性。

正如知乎反作弊业务研发负责人蔡熠坤所言:“每次突发业务高峰,现有架构的同步能力都逼近临界点,业务团队不得不通过手动执行脚本来应急处理。如果这种情况持续下去,业务风险将越来越大。”

为了快速排解业务风险,”长痛不如短痛“,知乎业务研发团队、知乎数据库架构团队联合阿里云瑶池数据库技术专家团队一起深入业务场景讨论技术架构改进方案,最终决策通过升级到“PolarDB+DTS”的一站式云原生架构方案上,从根本上解决这个问题。


01、云原生数据库PolarDB为业务高速增长护航

image.png

1. 存算分离,弹性扩展:阿里云瑶池旗下的云原生数据库PolarDB采用存算分离架构,计算与存储资源可独立扩展,灵活适配知乎风控场景的需求:存储持续增长,查询计算量相对固定,大幅提升了资源利用率。面对突发业务峰值,PolarDB支持分钟级计算资源扩容,快速提升集群性能。


2. 性能优化,写入提速:针对频繁的大字段读写操作,PolarDB优化了写入流程,去除了索引写锁,采用批量空间分配和无锁写入技术,支持多个大字段同时写入,实现整体数据同步性能提升3倍以上。


3. 简化逻辑,业务提效:利用PolarDB的生成列特性,在JSON数据写入时可自动解析并提取所需值存储到独立列中,同时支持JSON数据的部分更新能力,大幅简化了原有复杂的JSON处理逻辑。


4. 数据分区,容量扩展:为应对数据容量持续增长,PolarDB通过数据分区提升单实例容量上限,并支持跨分区全局索引,确保分区不影响检索效率。其中,最大单表数据量几百TB、数据记录行数几百亿行。


5. 资源节省,成本优化:借助PolarDB的SmartSSD硬件压缩技术,数百TB的数据迁移后压缩至原存储空间的40%,显著降低存储成本。此外,按需计费模式避免了自建数据库预留空间的固定投入,进一步优化了成本。


6. 全面托管,全链路监控:PolarDB提供秒级快照备份、故障自动恢复以及一键版本升级等功能,显著降低了运维复杂度。同时,PolarDB实现了从计算存储资源、数据库引擎内核到代理层的全链路监控,能够支持快速发现并精准定位问题。

02、DTS云原生架构简化复杂数据链路的迁移和同步

image.png

在数据迁移过程中,阿里云瑶池旗下的数据传输服务DTS(Data Transmission Service)发挥了重要作用:


1. 支持异构数据库迁移:DTS内置数据处理脚本,能够从多源异构数据库中提取数据并统一转换为JSON格式。这一能力有效解决了异构数据源间库表结构和数据类型不一致的问题,实现了多数据源实时同步到PolarDB同一张表的目标,显著提升了数据整合效率。


2. 支持表级过滤和脚本化配置:DTS提供表级数据过滤功能,可高效拆解任务,并通过脚本化配置实现灵活管理。结合其无感升降配能力,实现了根据数据库负载动态调整任务运行状态,在确保源库性能不受影响的前提下,以最高速率完成数据同步。


3. 支持异构数据校验:为保障迁移过程中的数据一致性,DTS提供了精准、高效的数据校验机制。通过指定排序键、构建类型映射关系以及本地排序等技术手段,DTS成功克服了异构数据库中唯一键不匹配、列类型不一致等问题,确保了数据的最终一致性。

03、未来展望:云原生技术赋能业务创新

从之前的MongoDB上云,到现在的自建ETL+分布式数据库集群升级至云原生数据库PolarDB+DTS,知乎的反作弊存储架构完成全面云原生架构升级。项目从方案沟通、迁移实施、落地验证等整个过程中,阿里云项目团队、知乎反作弊研发团队及数据库架构团队一起紧密配合,实现了业务零故障的平滑迁移。


此次数据库架构升级不仅解决了当前的业务风险问题,还为接下来的业务增长奠定了坚实基础。借助PolarDB提供的多项云原生企业级特性,包括:Serverless、多主集群、IMCI(列存索引)、冷数据归档、ePQ(弹性并行查询)、无感秒切、GDN(全球数据库网络)等能力,使知乎具备持续降低运维和开发成本的能力,让业务研发团队将更多资源投入到产品创新和服务优化中,从而进一步提升用户体验。


展望未来,阿里云与知乎进一步深化合作,充分发挥云原生技术优势,助力知乎在用户体验、内容创新和平台治理等方面实现新的突破。双方将携手打造更加安全、高效的在线内容生态,共同推动行业的技术进步与发展。

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
1月前
|
存储 关系型数据库 数据库
高性能云盘:一文解析RDS数据库存储架构升级
性能、成本、弹性,是客户实际使用数据库过程中关注的三个重要方面。RDS业界率先推出的高性能云盘(原通用云盘),是PaaS层和IaaS层的深度融合的技术最佳实践,通过使用不同的存储介质,为客户提供同时满足低成本、低延迟、高持久性的体验。
|
2月前
|
关系型数据库 数据库 RDS
【瑶池数据库训练营及解决方案本周精选(探索PolarDB,参与RDS迁移、连接训练营)】(5.30-6.8)
本周精选聚焦数据库迁移训练营、快速连接云数据库RDS训练营及智能多模态搜索解决方案。为用户提供模拟教程与实战演练,学习RDS MySQL实例连接与数据管理技能,助力企业智能化发展。每周解锁数据库实战新场景,抓紧时间,精彩不容错过!
|
2月前
|
人工智能 关系型数据库 分布式数据库
媒体声音|从亚太到欧美,阿里云瑶池数据库凭何成为中企出海的技术底气?
在中企出海的时代浪潮中,瑶池数据库正凭借其技术创新、场景化解决方案、智能化能力、全球化布局,成为企业跨越挑战、构建全球竞争力的关键伙伴;同时也以硬核的技术实力证明了中国数据库的国际竞争力。
|
2月前
|
存储 Cloud Native 关系型数据库
PolarDB开源:云原生数据库的架构革命
本文围绕开源核心价值、社区运营实践和技术演进路线展开。首先解读存算分离架构的三大突破,包括基于RDMA的分布式存储、计算节点扩展及存储池扩容机制,并强调与MySQL的高兼容性。其次分享阿里巴巴开源治理模式,涵盖技术决策、版本发布和贡献者成长体系,同时展示企业应用案例。最后展望技术路线图,如3.0版本的多写多读架构、智能调优引擎等特性,以及开发者生态建设举措,推荐使用PolarDB-Operator实现高效部署。
177 2
|
2月前
|
安全 Apache 数据库
【倒计时3天】NineData x Apache Doris x 阿里云联合举办数据库技术Meetup,5月24日深圳见!
5月24日,NineData联合Apache Doris与阿里云在深圳举办数据库技术Meetup。活动聚焦「数据实时分析」与「数据同步迁移」两大领域,邀请行业专家分享技术趋势、产品实践及解决方案,助力企业构建高效安全的数据管理体系。时间:14:00-17:30;地点:深圳新一代产业园2栋20楼会议室。线下名额有限(80人),速报名参与深度交流!
70 1
|
2月前
|
人工智能 Cloud Native 容灾
深圳农商银行三代核心系统全面投产 以云原生架构筑牢数字化转型基石
深圳农商银行完成第三代核心系统全面上云,日均交易超3000万笔,峰值处理效率提升2倍以上。扎根深圳70余年,与阿里云共建“两地三中心”分布式云平台,实现高可用体系及全栈护航。此次云原生转型为行业提供可复制样本,未来将深化云计算与AI合作,推动普惠金融服务升级。
257 17
|
3月前
|
Cloud Native Serverless 流计算
云原生时代的应用架构演进:从微服务到 Serverless 的阿里云实践
云原生技术正重塑企业数字化转型路径。阿里云作为亚太领先云服务商,提供完整云原生产品矩阵:容器服务ACK优化启动速度与镜像分发效率;MSE微服务引擎保障高可用性;ASM服务网格降低资源消耗;函数计算FC突破冷启动瓶颈;SAE重新定义PaaS边界;PolarDB数据库实现存储计算分离;DataWorks简化数据湖构建;Flink实时计算助力风控系统。这些技术已在多行业落地,推动效率提升与商业模式创新,助力企业在数字化浪潮中占据先机。
234 12
|
3月前
|
运维 Cloud Native 测试技术
极氪汽车云原生架构落地实践
随着极氪数字业务的飞速发展,背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验,并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。
|
6月前
|
人工智能 编解码 自然语言处理
AI运用爆发时代, 视频服务云原生底座“视频云”架构的全智能再进化
本文介绍了AI运用爆发时代下,视频服务云原生底座“视频云”架构的全智能再进化。随着AI技术的发展,视频内容和交互方式正经历深刻变革。文章从背景、视频AI应用挑战、视频云网端底座、AIGC时代的全智能化及未来展望五个方面展开讨论。重点阐述了云、网、端三者如何深度融合,通过AI赋能视频采集、生产、分发和消费全流程,实现视频处理的智能化和高效化。同时,展望了未来AI在视频领域的创新应用和潜在的杀手级应用。
254 0

相关产品

  • 云原生数据库 PolarDB