【计算机三级数据库技术】第13章 大规模数据库架构--附思维导图

简介: 文章概述了分布式数据库、并行数据库、云计算数据库架构和XML数据库的基本概念、目标、体系结构以及与传统数据库的比较,旨在提供对这些数据库技术的全面理解。

1.png

分布式数据库

.1 基本概念

    分布式数据库是分布式数据库系统中各场地上数据库的逻辑集合

.2 分布式数据库目标与数据分布策略

    目标
        本地自治
        非集中管理
        高可用性
        位置独立性
        数据分片独立性
        数据复制独立性
        分布式查询处理
        分布式事务管理
        硬件独立性
        操作系统独立性
        网络独立性
        数据库管理系统独立性
    数据分布策略
        基本概念
            一般先做数据分片,在做数据分配,数据分片按照一定规则将某一个全局关系划分为片段,数据分配则在此基础上将这些片段分配存储在各个场地上
        数据分片
            水平分片
            垂直分片
            导出分片
            混合分片
        数据分配
            集中式
            分割式
            全复制式
            混合式

.3 分布式数据库系统的体系结构

    参考模型结构
        全局外模式
        全局概念模式
        分片模式
        分配模式
        局部概念模式
        局部内模式
    分布透明性
        分片透明性(最高级别)
        位置透明性
        局部数据模型透明性
    分布式数据库管理系统
        全局数据库管理系统GDBMS(核心)
        全局数据字典GDD
        局部数据库管理系统LDBMS
        通信管理CM

.4 分布式数据库的相关技术

    分布式查询
        查询代价
            集中式数据库
                主要是CPU 代价和IO代价
            分布式数据库
                由于数据分布在多个不同的场地上,使得查询处理中还要考虑站点间传输数据的通信代价
        分布式查询考虑策略
            操作执行的顺序
            操作的执行算法
            不同场地间数据流动的顺序
        注意:在分布式数据库的查询中,导致数据传输量大的主要原因是数据间的连接操作和并操作
    分布式事务管理
        恢复控制
            两阶段提交协议
            三阶段提交协议
        并发控制
            封锁协议

2 并行数据库

2.1 并行数据库系统结构

    共享内存结构
    共享磁盘结构
    无共享结构
    层次结构

2.2 数据划分与并行算法

    数据划分
        基本概念
            是根据关系的某一个属性的值来划分整个关系,这个属性称为划分属性
        一维数据划分
            轮转法
            散列划分
            范围划分
        多维数据划分
            CMD多维划分法
            BERD多维划分法
            MAGIC多维划分法
    并行算法
        并行连接
        并行排序

3 云计算数据库架构

3.1 基本概念

    云计算是一种商业计算模型,它通过集中所有的计算资源,采用硬件虚拟化技术,为云计算使用者提供强大的计算力、存储和带宽资源
    云计算包含互联网上的应用服务及在数据中心提供这些服务的软硬件设施,通常包括软件即服务、平台即服务、基础设施即服务
    云计算的目标是通过网络提供越来越多的服务,实现一切即服务

3.2 体系结构

    BIgTable数据模型
        是Google的云数据库,是一个分布式的结构化数据存储系统,它用于对海量数据进行处理、存储和查询
        特点
            表中的行关键字可以是任意的字符串
            列族是由列关键字组成的集合,是访问控制的基本单位
            时间戳记录了Bigtable中每一个数据项包含的不同版本的数据的时间标识
    BigTable的体系结构
        就像一个巨大的Excel,包含了多个Table,每个Table是一个多维的稀疏表
        使用SSTable作为底层存储数据的格式
        使用了Chubby服务实现锁服务
        BigTable服务器分为一个Master服务器和多个Tablet服务器

3.3 与传统数据库比较

    缺点
        数据安全问题
        对云的管理问题
        对因特网的依赖

4 XML数据库

基本概念
    是一种支持对XML格式文档进行存储和查询等操作的数据库管理系统
三种类型
    XML Enabled Database即能处理XML的数据库
    Native XML Database 纯XML数据库
    Hybrid XML Database混合XML数据库
与传统数据库相比的优势
    XML数据库能够对半结构化数据进行有效的存取和管理
    提供对标签和路径的操作
    当数据本身具有层次特征时,由于XML数据格式能够清晰的表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作
目录
相关文章
|
19天前
|
数据库 索引
深入探索数据库索引技术:回表与索引下推解析
【10月更文挑战第15天】在数据库查询优化的领域中,回表和索引下推是两个核心概念,它们对于提高查询性能至关重要。本文将详细解释这两个术语,并探讨它们在数据库操作中的作用和影响。
42 3
|
19天前
|
数据库 索引
深入理解数据库索引技术:回表与索引下推详解
【10月更文挑战第23天】 在数据库查询性能优化中,索引的使用是提升查询效率的关键。然而,并非所有的索引都能直接加速查询。本文将深入探讨两个重要的数据库索引技术:回表和索引下推,解释它们的概念、工作原理以及对性能的影响。
36 3
|
27天前
|
存储 缓存 监控
数据库优化技术:提升性能与效率的关键策略
【10月更文挑战第15天】数据库优化技术:提升性能与效率的关键策略
54 8
|
25天前
|
存储 NoSQL 关系型数据库
数据库技术深度解析:从基础到进阶
【10月更文挑战第17天】数据库技术深度解析:从基础到进阶
55 0
|
2月前
|
存储 NoSQL 关系型数据库
非关系型数据库-MongoDB技术(二)
非关系型数据库-MongoDB技术(二)
|
2月前
|
NoSQL 关系型数据库 MongoDB
非关系型数据库-MongoDB技术(一)
非关系型数据库-MongoDB技术(一)
|
18天前
|
负载均衡 网络协议 数据库
选择适合自己的数据库多实例负载均衡技术
【10月更文挑战第23天】选择适合自己的数据库多实例负载均衡技术需要全面考虑多种因素。通过深入的分析和评估,结合自身的实际情况,能够做出明智的决策,为数据库系统的高效运行提供有力保障。
103 61
|
16天前
|
SQL Java 数据库连接
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率。本文介绍了连接池的工作原理、优势及实现方法,并提供了HikariCP的示例代码。
30 3
|
18天前
|
缓存 负载均衡 监控
数据库多实例的负载均衡技术深入
【10月更文挑战第23天】数据库多实例负载均衡技术是确保数据库系统高效运行的重要手段。通过合理选择负载均衡策略、实时监控实例状态、不断优化调整,能够实现资源的最优分配和系统性能的提升。在实际应用中,需要根据具体情况灵活运用各种负载均衡技术,并结合其他相关技术,以满足不断变化的业务需求。
|
18天前
|
Java 数据库连接 数据库
优化之路:Java连接池技术助力数据库性能飞跃
在Java应用开发中,数据库操作常成为性能瓶颈。频繁的数据库连接建立和断开增加了系统开销,导致性能下降。本文通过问题解答形式,深入探讨Java连接池技术如何通过复用数据库连接,显著减少连接开销,提升系统性能。文章详细介绍了连接池的优势、选择标准、使用方法及优化策略,帮助开发者实现数据库性能的飞跃。
25 4