2017年数据架构师架构选型必读

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
云数据库 RDS PostgreSQL,高可用系列 2核4GB
简介:
这是最好的时代,科学技术推陈出新,各种数据库不再一家独大,关系数据库、非关系数据库(NoSQL)、混合数据库(NewSQL)各领风骚。

 

这也是最坏的时代,琳琅满目的数据库名称和特性,让我们目不暇接。一个个去研究显然时间和精力有限,随大流选一个却又担心走到坑里去,沉没成本太大。

 

刚好这又冬去春来,适合大兴土木大搞建设的时候到了,这里就来跟大家捭阖下。

 

首先还是要有个基准的判断,这个业务系统,是选用关系型数据库呢,还是非关系型数据库?是偏OLTP类型呢还是更加偏OLAP类型?

 

如果是选择传统关系型数据库,通常就只建议在这四个数据库里选择了。

 

 

Oracle虽然一直在掉分,而且分数被MySQL拉得很近,但是大家需要注意的是,这个分值并非代表使用的公司的多少,也不代表使用的套数或者数据量的大小,而主要因素是“热度”,这东西跟股市有点差不多,供参考但不能依赖。

 

 

DBAplus Newsletter第二期中是这么解读的:“其实这么看上去第一集团还是Oracle / MySQL / SQLServer,PG在快速追赶中,目前离第一集团大概还有3~4倍左右的差距,但PG作为这几个老牌数据库中斜率比较大的,大概在2013年年底有一个跳变,看时间点应该是PG 9.3的发布,随后PG一直保持了非常稳健的向上发展趋势,这个表现非常符合最近几年PostgreSQL社区的快速发展,从9.0到去年的9.6,PG面向传统企业、互联网、金融、物联网、政企等行业发布了诸多特性,在SQL兼容性与时俱进,贴近最新发布的SQL标准,从社区发布的性能测试来看,单机TPS达到了180万的水准。PostgreSQL正在以自己的方式构建一个庞大的生态体系。这个数据也是比较符合直观感受的。”

 

那么,具体要怎么选择呢?如果你是个新鲜的互联网公司,而且也有钱找得起高工资的DBA有能力控制好开发质量,那么不用多说,选择开源数据库吧,MySQL或者PG。如果JSON类LBS业务用得非常多,用PG吧,否则可以用MySQL。

 

选用MySQL,一个重要的新组件暂时还不推荐上:MySQL 5.7.17 Group Replication。从官方的性能测试结果看,性能是优于Galera PXC的,接近异步同步。但是目前在运维方面的支持上不够好,比如备份和集群客户端支持上,离实际生产环境大规模应用还是有一段距离。

 

如果你其实也不知道开发团队会设计出些什么架构,写出些什么代码,对开源数据库的特点也基本没太多经验,那么选Oracle或者SQL Server吧。业务量很大,优选Oracle,否则SQL Server也是可以的。后者几乎是“免维护”的,至少不太请专职DBA。

 

当然,优先推荐的当然是Oracle,因为12cR2已经发布了。浦发银行2017年的新项目全部采用12cR2,当然肯定是要用集群,肯定是要用PDB,肯定是要用IMO,这些技术在吉林移动、浙江移动都在核心生产上跑了好长时间了。是的,R2新出的Sharding还在考量中,虽然看起来很美。

 

MongoDB现在用的也非常多,曾经一度热度超过了PG。目前看起来还是以互联网应用为主,社群今年会有许多线下沙龙,可以多参加了解。

 

国内数据库,我们相信是绝大多数人心中的痛。这个其实也没办法,婴儿学步总要有个时间。

 

Newsletter第二期有5家国产数据库发布了新的产品消息:

 

  • 蚂蚁金服的OceanBase 1.0可申请试用

  • TiDB将发布RC2

  • 达梦发布DM v7.1.5.145 

  • 巨杉数据库发布SequoiaDB 2.6社区版

  • 南大通用发布GBase UP

  • 原文发布时间为:2017-02-25

    本文来自云栖社区合作伙伴DBAplus

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
23天前
|
存储 消息中间件 Kafka
Confluent 首席架构师万字剖析 Apache Fluss(二):核心架构
原文:https://jack-vanlightly.com/blog/2025/9/2/understanding-apache-fluss 作者:Jack Vanlightly 翻译:Wayne Wang@腾讯 译注:Jack Vanlightly 是一位专注于数据系统底层架构的知名技术博主,他的文章以篇幅长、细节丰富而闻名。目前 Jack 就职于 Confluent,担任首席技术架构师,因此这篇 Fluss 深度分析文章,具备一定的客观参考意义。译文拆成了三篇文章,本文是第二篇。
214 19
|
4月前
|
存储 BI Shell
Doris基础-架构、数据模型、数据划分
Apache Doris 是一款高性能、实时分析型数据库,基于MPP架构,支持高并发查询与复杂分析。其前身是百度的Palo项目,现为Apache顶级项目。Doris适用于报表分析、数据仓库构建、日志检索等场景,具备存算一体与存算分离两种架构,灵活适应不同业务需求。它提供主键、明细和聚合三种数据模型,便于高效处理更新、存储与统计汇总操作,广泛应用于大数据分析领域。
491 2
|
4月前
|
SQL 缓存 前端开发
如何开发进销存系统中的基础数据板块?(附架构图+流程图+代码参考)
进销存系统是企业管理采购、销售与库存的核心工具,能有效提升运营效率。其中,“基础数据板块”作为系统基石,决定了后续业务的准确性与扩展性。本文详解产品与仓库模块的设计实现,涵盖功能概述、表结构设计、前后端代码示例及数据流架构,助力企业构建高效稳定的数字化管理体系。
|
3月前
|
数据采集 缓存 前端开发
如何开发门店业绩上报管理系统中的商品数据板块?(附架构图+流程图+代码参考)
本文深入讲解门店业绩上报系统中商品数据板块的设计与实现,涵盖商品类别、信息、档案等内容,详细阐述技术架构、业务流程、数据库设计及开发技巧,并提供完整代码示例,助力企业构建稳定、可扩展的商品数据系统。
|
2月前
|
数据采集 机器学习/深度学习 搜索推荐
MIT新论文:数据即上限,扩散模型的关键能力来自图像统计规律,而非复杂架构
MIT与丰田研究院研究发现,扩散模型的“局部性”并非源于网络架构的精巧设计,而是自然图像统计规律的产物。通过线性模型仅学习像素相关性,即可复现U-Net般的局部敏感模式,揭示数据本身蕴含生成“魔法”。
146 3
MIT新论文:数据即上限,扩散模型的关键能力来自图像统计规律,而非复杂架构
|
2月前
|
JSON 供应链 监控
1688商品详情API技术深度解析:从接口架构到数据融合实战
1688商品详情API(item_get接口)可通过商品ID获取标题、价格、库存、SKU等核心数据,适用于价格监控、供应链管理等场景。支持JSON格式返回,需企业认证。Python示例展示如何调用接口获取商品信息。
|
3月前
|
数据采集 监控 数据可视化
数据量暴涨时,抓取架构该如何应对?——豆瓣电影案例调研
本案例讲述了在豆瓣电影数据采集过程中,面对数据量激增和限制机制带来的挑战,如何通过引入爬虫代理、分布式架构与异步IO等技术手段,实现采集系统的优化与扩展,最终支撑起百万级请求的稳定抓取。
131 0
数据量暴涨时,抓取架构该如何应对?——豆瓣电影案例调研
|
3月前
|
SQL 数据采集 数据处理
终于有人把数据架构讲清楚了!
本文深入浅出地解析了数据架构的核心逻辑,涵盖其定义、作用、设计方法及常见误区,助力读者构建贴合业务的数据架构。
|
4月前
|
数据采集 存储 分布式计算
一文读懂数据中台架构,高效构建企业数据价值
在数字化时代,企业面临数据分散、难以统一管理的问题。数据中台架构通过整合、清洗和管理数据,打破信息孤岛,提升决策效率。本文详解其核心组成、搭建步骤及常见挑战,助力企业高效用数。
1551 24
|
3月前
|
缓存 前端开发 BI
如何开发门店业绩上报管理系统中的门店数据板块?(附架构图+流程图+代码参考)
门店业绩上报管理是将门店营业、动销、人效等数据按标准化流程上报至企业中台或BI系统,用于考核、分析和决策。其核心在于构建“数据底座”,涵盖门店信息管理、数据采集、校验、汇总与对接。实现时需解决数据脏、上报慢、分析无据等问题。本文详解了实现路径,包括系统架构、数据模型、业务流程、开发要点、三大代码块(数据库、后端、前端)及FAQ,助你构建高效门店数据管理体系。

热门文章

最新文章