【计算机三级数据库技术】第13章 大规模数据库架构--附思维导图

简介: 文章概述了分布式数据库、并行数据库、云计算数据库架构和XML数据库的基本概念、目标、体系结构以及与传统数据库的比较,旨在提供对这些数据库技术的全面理解。

1.png

分布式数据库

.1 基本概念

    分布式数据库是分布式数据库系统中各场地上数据库的逻辑集合

.2 分布式数据库目标与数据分布策略

    目标
        本地自治
        非集中管理
        高可用性
        位置独立性
        数据分片独立性
        数据复制独立性
        分布式查询处理
        分布式事务管理
        硬件独立性
        操作系统独立性
        网络独立性
        数据库管理系统独立性
    数据分布策略
        基本概念
            一般先做数据分片,在做数据分配,数据分片按照一定规则将某一个全局关系划分为片段,数据分配则在此基础上将这些片段分配存储在各个场地上
        数据分片
            水平分片
            垂直分片
            导出分片
            混合分片
        数据分配
            集中式
            分割式
            全复制式
            混合式

.3 分布式数据库系统的体系结构

    参考模型结构
        全局外模式
        全局概念模式
        分片模式
        分配模式
        局部概念模式
        局部内模式
    分布透明性
        分片透明性(最高级别)
        位置透明性
        局部数据模型透明性
    分布式数据库管理系统
        全局数据库管理系统GDBMS(核心)
        全局数据字典GDD
        局部数据库管理系统LDBMS
        通信管理CM

.4 分布式数据库的相关技术

    分布式查询
        查询代价
            集中式数据库
                主要是CPU 代价和IO代价
            分布式数据库
                由于数据分布在多个不同的场地上,使得查询处理中还要考虑站点间传输数据的通信代价
        分布式查询考虑策略
            操作执行的顺序
            操作的执行算法
            不同场地间数据流动的顺序
        注意:在分布式数据库的查询中,导致数据传输量大的主要原因是数据间的连接操作和并操作
    分布式事务管理
        恢复控制
            两阶段提交协议
            三阶段提交协议
        并发控制
            封锁协议

2 并行数据库

2.1 并行数据库系统结构

    共享内存结构
    共享磁盘结构
    无共享结构
    层次结构

2.2 数据划分与并行算法

    数据划分
        基本概念
            是根据关系的某一个属性的值来划分整个关系,这个属性称为划分属性
        一维数据划分
            轮转法
            散列划分
            范围划分
        多维数据划分
            CMD多维划分法
            BERD多维划分法
            MAGIC多维划分法
    并行算法
        并行连接
        并行排序

3 云计算数据库架构

3.1 基本概念

    云计算是一种商业计算模型,它通过集中所有的计算资源,采用硬件虚拟化技术,为云计算使用者提供强大的计算力、存储和带宽资源
    云计算包含互联网上的应用服务及在数据中心提供这些服务的软硬件设施,通常包括软件即服务、平台即服务、基础设施即服务
    云计算的目标是通过网络提供越来越多的服务,实现一切即服务

3.2 体系结构

    BIgTable数据模型
        是Google的云数据库,是一个分布式的结构化数据存储系统,它用于对海量数据进行处理、存储和查询
        特点
            表中的行关键字可以是任意的字符串
            列族是由列关键字组成的集合,是访问控制的基本单位
            时间戳记录了Bigtable中每一个数据项包含的不同版本的数据的时间标识
    BigTable的体系结构
        就像一个巨大的Excel,包含了多个Table,每个Table是一个多维的稀疏表
        使用SSTable作为底层存储数据的格式
        使用了Chubby服务实现锁服务
        BigTable服务器分为一个Master服务器和多个Tablet服务器

3.3 与传统数据库比较

    缺点
        数据安全问题
        对云的管理问题
        对因特网的依赖

4 XML数据库

基本概念
    是一种支持对XML格式文档进行存储和查询等操作的数据库管理系统
三种类型
    XML Enabled Database即能处理XML的数据库
    Native XML Database 纯XML数据库
    Hybrid XML Database混合XML数据库
与传统数据库相比的优势
    XML数据库能够对半结构化数据进行有效的存取和管理
    提供对标签和路径的操作
    当数据本身具有层次特征时,由于XML数据格式能够清晰的表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作
目录
相关文章
|
5月前
|
SQL Java 数据库连接
除了JDBC,还有哪些常见的数据库访问技术?
除了JDBC,还有哪些常见的数据库访问技术?
502 2
|
5月前
|
存储 缓存 安全
某鱼电商接口架构深度剖析:从稳定性到高性能的技术密码
某鱼电商接口架构揭秘:分层解耦、安全加固、性能优化三维设计,实现200ms内响应、故障率低于0.1%。详解三层架构、多引擎存储、异步发布、WebSocket通信与全链路防护,助力开发者突破电商接口“三难”困境。
|
6月前
|
数据采集 监控 JavaScript
移动端性能监控探索:鸿蒙 NEXT 探针架构与技术实现
阿里云 ARMS 团队倾力打造的鸿蒙 NEXT SDK,为鸿蒙应用提供了业界领先的全链路监控解决方案。这不仅仅是一个 SDK,更是您洞察用户体验、优化应用性能的智能伙伴。
782 56
|
5月前
|
人工智能 自然语言处理 安全
AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教系统融合大语言模型、教育知识图谱、多模态交互与智能体架构,实现精准学情诊断、个性化辅导与主动教学。支持图文语音输入,本地化部署保障隐私,重构“教、学、评、辅”全链路,推动因材施教落地,助力教育数字化转型。(238字)
992 23
|
5月前
|
Java Linux 虚拟化
【Docker】(1)Docker的概述与架构,手把手带你安装Docker,云原生路上不可缺少的一门技术!
1. Docker简介 1.1 Docker是什么 为什么docker会出现? 假定您在开发一款平台项目,您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。 您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。 您的企业还拥有标准化的测试和生产环境,且具有自身的配置和一系列支持文件。 **要求:**希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销 问题: 要如何确保应用能够在这些环境中运行和通过质量检测? 在部署过程中不出现令人头疼的版本、配置问题 无需重新编写代码和进行故障修复
523 2
|
6月前
|
Cloud Native API 开发者
Gemini 2.5 Flash 技术拆解:从 MoE 架构到阿里云生态落地指南
2025年9月,谷歌Gemini 2.5 Flash发布,性能提升5%、成本降24%,引发行业关注。其MoE架构、百万上下文与“思考”范式,助力阿里云开发者高效构建云原生应用。本文解析技术内核,结合汽车、物流等案例,提供落地指南与避坑建议,展望大模型与流计算融合前景。
772 6
|
6月前
|
监控 Java 关系型数据库
HikariCP 高性能数据库连接池技术详解与实践指南
本文档全面介绍 HikariCP 高性能数据库连接池的核心概念、架构设计和实践应用。作为目前性能最优异的 Java 数据库连接池实现,HikariCP 以其轻量级、高性能和可靠性著称,已成为 Spring Boot 等主流框架的默认连接池选择。本文将深入探讨其连接管理机制、性能优化策略、监控配置以及与各种框架的集成方式,帮助开发者构建高性能的数据访问层。
687 8
|
6月前
|
监控 Java 关系型数据库
HikariCP 高性能数据库连接池技术详解与实践指南
本文档全面介绍 HikariCP 高性能数据库连接池的核心概念、架构设计和实践应用。作为目前性能最优异的 Java 数据库连接池实现,HikariCP 以其轻量级、高性能和可靠性著称,已成为 Spring Boot 等主流框架的默认连接池选择。本文将深入探讨其连接管理机制、性能优化策略、监控配置以及与各种框架的集成方式,帮助开发者构建高性能的数据访问层。
460 1
|
6月前
|
JSON 供应链 监控
1688商品详情API技术深度解析:从接口架构到数据融合实战
1688商品详情API(item_get接口)可通过商品ID获取标题、价格、库存、SKU等核心数据,适用于价格监控、供应链管理等场景。支持JSON格式返回,需企业认证。Python示例展示如何调用接口获取商品信息。