开发者社区 > PolarDB开源 > PolarDB 分布式版 > 正文

分布式数据库的选型

如题,一个好的数据库选型很重要,那么需要考量哪些东西呢?跟传统的Oracle集群比,有什么优势?

展开
收起
阿飞的小飞机 2023-11-15 09:39:47 185 0
4 条回答
写回答
取消 提交回答
  • 在选择分布式数据库时,首先需要考虑的是业务场景。不同的业务场景对数据库的需求不同,因此需要选择能够最大程度满足业务需求的数据库。例如,如果业务涉及到大规模数据处理,那么选择支持分布式计算的数据库会更加合适。

    其次,需要考虑数据库的特性。分布式数据库大致可以分为三类:支持持久化存储的分布式存储系统,如MySQL,OceanBase;偏向于计算的分布式计算框架,如Hadoop HDFS,Ceph,Swift等。根据业务需求选择适合的数据库类型。

    再次,需要考虑数据库的可靠性和可用性。分布式数据库通过数据分片、冗余备份等技术提高了数据的可靠性和可用性,这对于关键业务尤为重要。

    此外,还需要考虑数据库的安全性。分布式数据库通过多副本、数据加密等技术提高了数据的安全性,保护了用户的数据不被非法访问。

    最后,需要考虑数据库的成本。分布式数据库虽然在处理大规模数据时具有优势,但其硬件和软件成本也相对较高。因此,在选择分布式数据库时,需要权衡其带来的效益和成本。

    与传统的Oracle集群相比,分布式数据库的优势在于可以处理更大规模的数据,同时也具有良好的扩展性和容错性。然而,从传统的集中式数据库转向分布式数据库也需要考虑到一些挑战,比如实施难度大,可能需要重新开发核心系统。

    2023-11-30 10:34:41
    赞同 展开评论 打赏
  • image.png

    分布式数据库技术的选型因素:

    • 数据类型:根据企业数据的特点和需求,选择适合的数据库技术,如关系型数据库适合处理结构化数据,非关系型数据库适合处理非结构化数据。

    • 可扩展性:选择能够随着业务增长和数据量增长而自动扩展的数据库技术,以满足不断变化的需求。

    • 数据一致性:选择具有较高数据一致性和事务性的数据库技术,以保证数据的安全和准确性。

    • 性能:选择具有较高读写性能和查询性能的数据库技术,以提升系统的性能和响应速度。

    • 兼容性:选择与现有系统兼容的数据库技术,以减少系统的改造成本和风险。

    可重点参考下述指标:

    1)系统数量

    考量租户能力。

    2)数据量

    考量系统承载力。

    3)系统性能指标

    TPS、QPS、RT等。

    4)并发量

    系统的最大并发数:为了节省成本,多套小系统可以共用一套数据库,但是负载很大的高并发场景还需独立搭建。

    5)业务中断时间

    系统最大可容忍的业务中断时间:分布式数据库节点宕机并不是对业务没有任何影响,主节点宕机都涉及到一个切换的问题,切换就是影响业务的时间,要充分评估业务能否忍受这么长时间的中断。

    6)系统的迁移成本
    分布式数据库不可能做到oracle、db2、mysql所有数据库的百分之百兼容,所以不同类型的数据库在迁移上都会或多或少地涉及到应用的改造。

    选型技术之外的考量因素

    成熟度、标杆应用、生态、ROI等。

    2023-11-17 00:31:54
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    数据库选型需要考虑的因素很多,包括但不限于以下几点:

    1. 数据量大小和增长速度:数据库的设计应该能够满足当前以及未来一段时间内的数据存储需求。同时也要考虑到数据的增长速度,因为数据库设计需要考虑到未来的扩容能力。
    2. 性能要求:对于处理大量并发请求、实时查询等方面的需求要明确,以确定合适的数据库类型和技术栈。
    3. 安全性:考虑数据库的安全机制和加密算法等,以保护数据免受攻击或未经授权的访问。
    4. 成本:预算也是一个重要的考量因素,包括硬件、软件许可证、维护和支持等方面的成本。
    5. 扩展性:要考虑数据库是否易于横向扩展(增加更多的服务器)或纵向扩展(升级现有服务器),以应对不断增长的数据量和业务需求。
    6. 兼容性和集成性:与现有的IT环境、工具和应用程序的兼容性也是需要考虑的重要因素。

    相比传统的Oracle集群,现代数据库(例如云原生数据库)有以下几个方面的优势:

    1. 弹性扩展:云原生数据库可以根据业务负载动态调整资源,无需提前规划和购买大量的物理硬件设备。
    2. 自动化运维:自动备份、恢复、故障切换等功能大大降低了运维复杂度和人力成本。
    3. 高可用性和安全性:通过多AZ部署、读写分离、自动故障切换等技术保障了高可用性和数据安全性。
    4. 易用性:通常提供图形化的管理界面和API接口,降低了使用门槛。
    5. 低成本:按需付费的模式可以有效降低初期投入成本,同时节省电力、机房租金等费用。
    2023-11-15 13:03:23
    赞同 展开评论 打赏
  • 在进行分布式数据库选型时,需要考虑以下几个方面:

    1. 性能:要考虑数据库能否满足业务的需求,比如吞吐量、延迟等方面的要求。
    2. 扩展性:要考虑数据库能否适应快速增长的业务规模,以及扩展所需的时间和成本。
    3. 容错能力:要考虑数据库是否具备良好的容错机制,以应对网络、硬件等问题。
    4. 易用性:要考虑数据库的开发难度、学习曲线、运维复杂度等因素。
    5. 成本:要考虑数据库的价格、维护费用等成本因素。
    6. 数据一致性:要考虑数据库的数据一致性级别,比如强一致性和弱一致性。
    7. 技术栈:要考虑数据库的技术栈与现有团队的技术背景和技术能力是否匹配。

    与传统的Oracle集群相比,分布式数据库有以下优势:

    1. 高可用性:分布式数据库可以采用多种冗余机制,比如主从复制、分区等多种策略,确保系统的高可用性。
    2. 多租户:分布式数据库可以支持多个租户共享一台物理机器,提高了资源利用率。
    3. 弹性伸缩:分布式数据库可以根据需要自动伸缩,节省了人力物力。
    4. 支持大数据:分布式数据库可以处理海量数据,支持快速查询和分析。
    5. 更低的成本:相比于购买大量昂贵的传统数据库,分布式数据库可以通过云平台按需付费,降低了硬件投入成本。

    总体来看,分布式数据库可以更好地满足大规模、高可用、低成本等要求,适合很多企业的应用场景。

    2023-11-15 10:35:57
    赞同 展开评论 打赏

PolarDB 分布式版 (PolarDB for Xscale,简称“PolarDB-X”) 采用 Shared-nothing 与存储计算分离架构,支持水平扩展、分布式事务、混合负载等能力,100%兼容MySQL。 2021年开源,开源历程及更多信息访问:OpenPolarDB.com/about

相关电子书

更多
DTCC 2022大会集锦《云原生一站式数据库技术与实践》 立即下载
阿里云瑶池数据库精要2022版 立即下载
2022 DTCC-阿里云一站式数据库上云最佳实践 立即下载