软件开发进阶技能之数据库进阶(六)

简介: 教程来源 https://bncne.cn/ 本节深入探讨NoSQL数据库与混合持久化架构:涵盖Redis高级用法(数据结构、RDB/AOF持久化、Sentinel/Cluster)、MongoDB索引与聚合,以及MySQL+Redis+Elasticsearch+Cassandra的电商混合存储实践,并通过游戏排行榜案例对比三种实现方案,强调性能、一致性与成本的平衡。

第七部分:NoSQL 数据库与混合持久化

关系型数据库并非万能,在特定场景下 NoSQL 数据库能提供更好的性能和灵活性。进阶开发者应当理解不同类型数据库的适用场景,并根据业务需求组合使用(混合持久化架构,Polyglot Persistence)。

7.1 常见 NoSQL 分类与选型
image.png
7.2 Redis 高级用法与持久化
Redis 不仅是缓存,还可以作为主数据库或消息队列。

7.2.1 数据结构的高级使用

# 哈希表存储对象(优于多 key)
HSET user:1001 name "Alice" age 30
HGETALL user:1001

# 有序集合做排行榜
ZADD leaderboard 100 "playerA" 95 "playerB"
ZREVRANGE leaderboard 0 2 WITHSCORES

# 位图统计日活(每个用户占用1位)
SETBIT login:2025-06-01 1001 1
BITCOUNT login:2025-06-01

7.2.2 持久化机制
RDB:快照方式,定时生成全量备份。恢复快但可能丢失最近一次快照后的数据。

AOF:追加写命令日志,更安全(可配置每秒 fsync),但文件体积大、恢复慢。

生产环境通常两者同时开启,或者使用 Redis Enterprise 的持久化方案。

7.2.3 高可用与集群
Redis Sentinel:提供主从自动切换,实现高可用。

Redis Cluster:分片方案,支持横向扩展,但部分跨 key 操作受限。

7.3 MongoDB 的索引与聚合
MongoDB 的索引机制类似关系数据库,但支持嵌套字段索引、地理空间索引、全文索引等。

聚合框架:替代复杂的分组和连接,通过管道($match, $group, $lookup)处理数据。例如,统计每个商品的销量前 10 的用户:

db.orders.aggregate([
    { $match: { status: "completed" } },
    { $group: { _id: { productId: "$product_id", userId: "$user_id" }, total: { $sum: "$amount" } } },
    { $sort: { total: -1 } },
    { $group: { _id: "$_id.productId", topUsers: { $push: { userId: "$_id.userId", total: "$total" } } } },
    { $project: { topUsers: { $slice: ["$topUsers", 10] } } }
]);

7.4 混合持久化架构示例
一个典型的电商系统可能同时使用:

MySQL:存储核心订单、用户账户(强事务、强一致性)。

Redis:缓存商品详情、用户 session、秒杀库存计数器。

Elasticsearch:商品搜索、日志分析(基于 Lucene 的搜索引擎,不是典型 NoSQL,但常与数据库配合)。

Cassandra:存储用户行为流水、点击流(写吞吐极高,可线性扩展)。

应用层通过业务规则决定数据写到哪里,并处理最终一致性问题(例如先写 MySQL,再异步同步到 Elasticsearch)。

第八部分:数据库进阶实战 —— 一个完整案例

我们以一个典型的“排名系统”为例,将上述知识串联起来。需求:一个游戏排行榜,记录每个玩家的得分,要求实时更新排名,并能高效查询前 100 名和玩家自己的排名。

8.1 方案一:关系数据库 + 索引优化
表结构:

CREATE TABLE scores (
    user_id INT PRIMARY KEY,
    score INT NOT NULL,
    updated_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    INDEX idx_score (score DESC)
);

查询前 100 名:

SELECT user_id, score FROM scores ORDER BY score DESC LIMIT 100;

查询某玩家排名:

SELECT COUNT(*) + 1 AS rank FROM scores WHERE score > (SELECT score FROM scores WHERE user_id = 123);

问题:COUNT 在大表下较慢;实时更新排名需要频繁写。适用于中等规模(千万以内)。

8.2 方案二:使用 Redis 有序集合

ZADD leaderboard 1500 playerA
ZADD leaderboard 2800 playerB
ZREVRANGE leaderboard 0 99 WITHSCORES    # 前100名
ZREVRANK leaderboard playerB             # 获取排名(0-based)

Redis 操作都是 O(log N),百万玩家轻松应对,且天然支持实时更新。但 Redis 内存昂贵,数据量太大时成本高。可以冷热分离:热数据(活跃玩家)放 Redis,冷数据(历史玩家)放 MySQL。

8.3 方案三:基于数据库的分区+缓存
如果坚持使用 MySQL,可以按 score 范围分区,例如每 1000 分一个分区,这样查询前 100 名只需扫描高分区的前几页。同时使用 Redis 作为查询缓存,score 更新时使缓存失效。

8.4 完整代码实现(应用层逻辑)
用 Python 展示排行榜服务的实现,包含缓存和降级:

import redis
import pymysql
import json

class LeaderboardService:
    def __init__(self):
        self.redis_client = redis.Redis(host='localhost', port=6379, db=0)
        self.db = pymysql.connect(host='localhost', user='app', password='xxx', database='game')

    def update_score(self, user_id, new_score):
        # 先更新数据库
        with self.db.cursor() as cursor:
            cursor.execute("INSERT INTO scores (user_id, score) VALUES (%s, %s) ON DUPLICATE KEY UPDATE score = %s",
                           (user_id, new_score, new_score))
            self.db.commit()
        # 再更新 Redis
        self.redis_client.zadd('leaderboard', {user_id: new_score})
        # 删除该用户的缓存排名(懒加载)
        self.redis_client.delete(f'rank:{user_id}')

    def get_top_n(self, n=100):
        # 优先从 Redis 读取,不存在则从 MySQL 回源并写入缓存
        cached = self.redis_client.get(f'top_{n}')
        if cached:
            return json.loads(cached)
        with self.db.cursor() as cursor:
            cursor.execute("SELECT user_id, score FROM scores ORDER BY score DESC LIMIT %s", (n,))
            rows = cursor.fetchall()
            result = [{'user_id': r[0], 'score': r[1]} for r in rows]
            # 缓存 60 秒,避免频繁穿透
            self.redis_client.setex(f'top_{n}', 60, json.dumps(result))
            # 同时预热 Redis ZSET(如果 Redis 内存允许)
            for r in rows:
                self.redis_client.zadd('leaderboard', {r[0]: r[1]})
        return result

    def get_user_rank(self, user_id):
        # 先尝试从 Redis ZSET 获取
        rank = self.redis_client.zrevrank('leaderboard', user_id)
        if rank is not None:
            return rank + 1
        # 降级查数据库
        with self.db.cursor() as cursor:
            cursor.execute("SELECT COUNT(*) + 1 FROM scores WHERE score > (SELECT score FROM scores WHERE user_id=%s)", (user_id,))
            rank = cursor.fetchone()[0]
            # 回填到 Redis
            self.redis_client.zadd('leaderboard', {user_id: self._get_user_score_from_db(user_id)})
        return rank

请记住:数据库是系统的核心,任何疏忽都可能酿成严重事故。每次对数据库的变更(加索引、改表结构、调参数)都应该在测试环境验证,并有灰度上线和回滚方案。以敬畏之心对待数据,以科学之眼分析性能,你就能成为真正的数据库专家。
来源:
https://yvyus.cn/

相关文章
|
20小时前
|
缓存 负载均衡 NoSQL
软件开发进阶技能之分布式与高并发(一)
教程来源 https://tmywi.cn/ 本文系统讲解分布式与高并发核心技能:从CAP/BASE理论、负载均衡、多级缓存(穿透/击穿/雪崩应对)、消息队列、分布式事务/锁,到微服务治理与限流熔断,涵盖原理、实战代码与真实场景,助你构建高可用、可扩展的现代系统。
|
9天前
|
JavaScript 安全 Java
软件开发进阶技能之编程语言深度运用(一)
教程来源 http://xbivx.cn/ 本文聚焦编程进阶核心——从“会用”到“用好”的跃迁。通过深度解析类型系统(泛型、类型推断、ADT/模式匹配)、内存、并发、函数式等共性机制,结合Java/Python/TS/Go实战示例,助开发者写出更安全、高效、优雅的代码。
88 0
|
1天前
|
人工智能 运维 监控
大模型价格白菜价后,为什么你的 AI 账单反而涨了?——多 Provider 成本失控的技术解法
Token 单价跌到历史低点,但企业 AI 账单不降反升。本文拆解用量爆发、词元通胀、多 Provider 账本混乱三层成本陷阱,并给出统一计费网关、会话级归因和异常检测的工程方案。
31 0
|
22小时前
|
传感器 消息中间件 调度
C++在嵌入式实时操作系统(FreeRTOS)中的任务调度与通信
FreeRTOS是一个轻量级实时操作系统内核,广泛用于微控制器(如ARMCortex-M、AVR、ESP32)。虽然FreeRTOS主要参考:https://sdfxgc.cn用C编写,但它提供了完整的C++封装,允许开发者使用C++类和对象来创建任务、队列、信号量。
24 0
|
14小时前
|
存储 缓存 JSON
【剪映小助手】添加音频接口(Add Audios)
本文档介绍草稿自动化中音频接口的集成方案,涵盖用途说明、组件依赖(含外部库与内部模块)、性能优化(下载、内存、并发)、常见错误码及排查指南,并强调以OpenAPI为准的字段与校验规范。(239字)
|
21小时前
|
人工智能 安全 数据挖掘
阿里云百炼自建智能体AI支付异常事件复盘与问题分析
大模型在场景识别、数据核验、逻辑判断上存在严重短板,无法甄别虚假交易场景;配套的支付MCP体验组件缺乏支付前置风险校验、订单真实性核验、履约能力校验的关键机制;同时模型与支付组件的协同风控逻辑完全失效,允许未核验、不真实的测试订单调用真实金融支付接口,最终造成用户资金受损、无服务履约的异常结果,也暴露了当前AI+支付场景体验版功能存在严重的安全与流程漏洞。
|
8天前
|
存储 人工智能 算法
告别无效刷屏!TrendRadar:最快30秒部署的开源热点助手,让你只看真正关心的新闻
TrendRadar 是一个轻量级、易部署的热点新闻聚合与推送工具。它能够从知乎、抖音、B站、微博、百度、华尔街见闻等11个主流平台抓取热搜榜单,然后根据你设定的关键词进行智能筛选,最终将你最关心的内容推送到手机或邮箱。
181 13
 告别无效刷屏!TrendRadar:最快30秒部署的开源热点助手,让你只看真正关心的新闻
|
9天前
|
测试技术 C++ Python
如何从零开发一个工业级的 SKILL
手把手教你搓个 Skill,亲测新手也能跑起来,实操党可以直接冲~
151 1
如何从零开发一个工业级的 SKILL
|
1天前
|
人工智能 弹性计算 开发者
2026年阿里云618年中大促全攻略:AI加速季,年度低价云服务器推荐指南
本文将为大家详细解读2026年阿里云618的活动亮点,精选值得入手的高性价比便宜云服务器,助力大家低成本上云!
100 6
|
9天前
|
机器学习/深度学习 人工智能 网络架构
深度解析:Transformer 的“灵魂”——QKV 变换的物理直觉
本文用图书馆检索等生活隐喻,从物理意义与认知科学角度解析Transformer中QKV设计的精妙本质:解耦查询(q)、键(k)、值(v)三重角色,实现语义分离、避免自注意力“自恋”,模拟人类动态信息路由的认知过程。(239字)
206 13