惊喜与局限并存,12c Sharding内测报告抢先看!

简介:

2017年3月,我们终于迎来了Oracle 12cR2,作为国内首批Beta测试用户,我们在2016年1月应邀进行Oracle 12c Sharding 技术测试,并于去年10月完成了12cR2 Sharding 预研报告。由于受Oracle新技术发布限制,直至今日才发布与各位分享。

 

 
 
 

一、Oracle 12c Sharding简介

 
 

 

在Oracle 12cR2之前的版本中, Oracle分区表的所有分区都是在一套数据库中,而Sharding技术,则是使用新的分片技术可以将不同的分区部署到不同的数据库(后面称之为分片节点),而这些数据库都是相互独立且没有地理位置的限制。Oracle宣称这种分片架构具有以下特性:

 

  • 支持数据水平分片,支持数据海量扩展

  • 支持按地理分布、内网部署、公有云或混合云部署方案

  • 支持全面故障隔离

  • 每个分片节点具有独立的硬件资源(CPU、内存、硬盘等)

  • 支持弹性扩展和自动重分布(Auto Rebalancing)

  • 自动部署(Auto deployment)

 

 

 
 
 

二、Oracle 12c Sharding体系结构

 
 

 

Oracle sharding技术下的sdb架构(shared database architecture),包括:shard Directors(分片路由器GSM)、shard catalog(分片目录库)、shardgroup(分片组)。

 

1. shard catalog目录库主要作用

  • 存储sdb的元数据

  • 协调数据库

  • 分片表的元数据定义和复制表存储

 

2. Shard director分片导向器主要作用

  • 提供从应用层到分片连接请求的路由导向

  • 跨数据库服务故障切换和管理

  • 连接时负载均衡

 

3. Oracle Routing(两种模式)

  • session-based Routing

所有的事务都只连接到一个单一的shard进行操作。

  • Cross-shard 模式

适用于报表类的查询

事务需要跨多个shard执行操作

 

4. Sdb模式下oracle的连接请求方式分为两种

  • ucp:带shard key的连接请求,sdb数据库是依据shard key来划分shard的,当我们使用shard key进行操作的时候,连接池会将该链接请求发送到正确的shard库中并建立链接。

  • 如果没有sharding key,sdb会将连接请求交给catalog库,它会将目标sql解析并路由请求到正确的shard库。

 

 
 
 

三、Oracle 12c Sharding测试环境搭建部署步骤

 
 

 

环境准备:测试环境使用三台虚拟机进行测试,分别为:shard0(GSM和shardcate),shard1(sh1),shard2(sh2)。

 

软件要求:12.2.0.0.3及以上版本。

 

1. GSM软件部署

 

第一步修改环境变量如下:

 

[oracle@shard0   ~]$ env |grep ORA

ORACLE_BASE=/u01/app/oracle

ORACLE_HOME=/u01/app/oracle/product/12.2.0/gsmhome_1

 

第二步解压缩GSM.zip包并且执行runInstaller脚本(这里使用了图形化界面)

 

 

直接点下一步(检查操作系统是否符合安装条件):

 

 

点next下一步:

 

 

点击install,这样GSM包就安装完成了。

 

后续的数据库软件安装就不展开介绍了,选择NO-CDB选项即可。其他均与之前版本没有任何区别。

 

2. shardcate库上用户及相关权限操作

 

ssh   shard0

su   – oracle

sqlplus   / as sysdba

alter   user gsmcatuser account unlock; --解锁gsm用户

alter   user gsmcatuser identified by passwd_gsmcatuser; --修改gsm用户密码

create   user mygdsadmin identified by passwd_mygdsadmin; --创建管理用户mygdsadmin

grant   connect, create session to mygdsadmin;--赋权限给mygdsadmin

grant   gsmadmin_role to mygdsadmin;--把gsm管理员角色赋予mygdsadmin

grant   inherit privileges on user SYS to GSMADMIN_INTERNAL;

 

3. shardcate上配置remote scheduler

 

ssh   shard0

su   - oralce

sqlplus   / as sysdba

set   echo on

set   termout on

set   time on

spool   /u01/stage/labs/config_remote_scheduler.lst  --设置配置输出的日志

execute   dbms_xdb.sethttpport(8080);--指定scheduler所使用的端口号

Commit;

@?/rdbms/admin/prvtrsch.plb

exec   DBMS_SCHEDULER.SET_AGENT_REGISTRATION_PASS('welcome');  --设置远程shard节点注册到shardcate库所需的密码               

spool   off

 

4. 分片库信息注册

 

ssh   shard1

su   – oracle

schagent   –stop --停止shard库上的守护进程

schagent   –start --停止shard库上的守护进程

schagent   –status –查看shard库上的守护进程的状态

echo   welcome |schagent -registerdatabase shard0 8080 –注册到远程shardcate库分别是密码、主机名、端口号

cd   /data/oracle

mkdir   oradata –创建shard库的数据文件存放位置

mkdir   fast_recovery_area --创建shard库的快速恢复区的位置

ssh   shard2

su   – oracle

schagent   -stop

schagent   -start

schagent   -status

echo   welcome |schagent -registerdatabase shard0 8080

cd   /data/oracle

mkdir   oradata

mkdir   fast_recovery_area

 

5. 配置GSM

 

ssh   shard0

su   – oracle    --oracle用户

gdsctl    --进入gsm交互界面

create   shardcatalog -database shard0:1521:orcl -chunks 12 -user   mygdsadmin/passwd_mygdsadmin -sdb cust_sdb -region region1

--创建shardcatalog库 –database ip(主机名):监听端口号:实例名 –chunks chunk的数量

-user   用户/密码 –sdb sdb名   –region  主端,备端

add   gsm -gsm sharddirector1 -listener 1571 -pwd passwd_gsmcatuser -catalog   shard0:1521:orcl –region -trace_level 16

--添加gsm –gsm gsm名 –listener 监听端口号 –pwd gsmcatuser用户密码 –catalog catalog库基本信息 ip(主机名):监听端口号:实例名   –region 指定是哪个region –trace_level 指定trace的级别位置LOG_DESTINATION参数控制

start   gsm -gsm sharddirector1 –启动gsm

set   _event 17

modify   catalog -agent_password welcome –修改 catalog库守护进程密码为welcome

add   credential -credential oracle_cred -osaccount oracle -ospassword oracle --   specify the operating system user that the extproc agent impersonates when   running a subprogram stored in the library

ssh   shard0

su   – oracle

gdsctl   –进入gsm命令交互模式

set   gsm -gsm sharddirector1 –设置当前分片目录为sharddirector1

connect   mygdsadmin/passwd_mygdsadmin –建立连接

add   shardgroup -shardgroup shgrp1 -deploy_as primary -region region1 –添加主分片组

add   invitednode shard1

create   shard -shardgroup shgrp1  -destination  shard1 -credential   oracle_cred –-不同的shard库添加到不同的分片组里

add   invitednode shard2

create   shard -shardgroup shgrp2  -destination shard2 -credential   oracle_cred –-不同的shard库添加到不同的分片组里

deploy   一键部署。

 

此时一套测试的sdb搭建成功,由于环境有限这里没有做容灾,Oracle提供了OGG和ADG两种方式对shard节点做容灾并且也支持一键部署。

 

 
 
 

四、Sharding适用场景限制

 
 

 

根据Oracle官方对sharding的应用场景介绍描述,Oracle分片技术主要适用以下场景:

  • 面向 OLTP 应用场景

  • 为了优化性能应用程序应该使用分片键

  • 业务场景中 80% 的事务都基于单个分片操作

  • 跨分片操作目前版本支持并不完善

 

对于已知的分片技术使用场景限制,结合浙江移动的业务特点,最后选择客户中心做为本次的测试模型,由于存储资源有限我们选择了数据量相对较小的湖州地市作为测试地市。

 

 
 
 

五、Sharding测试模型和测试结果

 
 

 

客户中心业务简介:

 

1. 客户中心储存的数据来源于原CRM系统中的三户信息和用户订购信息,承载的是客户管理业务;

 

2. 三户信息的核心是用户信息表,其中用户信息表的业务入口是bbb_id,在获取bbb_id和uuu_id的对应关系后,后续都是以uuu_id为主,查询到相应的uuu_id对应的ccc_id/aaa_id的信息,再根据ccc_id和aaa_id的值去查询对应的客户和帐户信息,而用户的订购信息都是根据uuu_id来查询的;

 

3. 对所有前台或用户发起的针对单用户的业务中,基本能保证这些业务都是在同一个分片内操作;

 

4. 用户信息会随着系统承载的用户量的增加有所增长,但这种增长的速度不是海量的扩展速度。

 

测试结果:所有的业务操作大致可以分为以下这三类:

  • 单分片查询

  • duplicate表查询

  • 跨分片查询

 

针对基于单分片的分片表查询,相比于传统的数据库查询速度提升不明显,因为uuu_id列本身加了索引查询速度已经够快了。但是当时数据库的压力提升以后,多个分片节点的sdb带来的优势预计会有一定的体现,因为所有的数据库操作被均匀地负载到多台物理主机上面,由于硬件限制我们没有做性能测试,对于duplicate表的查询本身设计就是从catalog库上通过物化视图到各个shard库里,所以对查询的速度提升没有实质的提升作用。

 

最后的跨分片查询我们在测试过程中发现Oracle不支持where条件用in或者or,我们大部分的应用都会用到这种条件的查询,所以跨分片的查询目前版本支持并不完善。

 

 
 
 

六、Sharding测试过程中的问题解决

 
 

 

1. 环境部署

  • 软件的版本需要12.2.0.0.3及以上的版本

  • 在配置GSM的时候报错信息不会很直观的展示出来,这对于安装部署有很大阻碍。

 

2. 数据导入

  • Duplicate表的数据导入是从catalog库导入,分片表的导入可以从各个shard库导入进去(由于环境有限暂时12.2.0.0.3从catalog库导入还未来得及测试)。

  • 12.2.0.0.3版本以前分片表直接从catalog库导入会报ora-600错误,而且这些错误也没有相应的psu修复。

  • 通过dblink用create table as select的方式创建会报不支持的操作类型的错误。

 

3. 业务测试

跨分片查询在 12.2.0.0.3版本支持并不完善,例如用in或者or 的查询Oracle会直接报错。我们已将改进建议提给Oracle,可能会在正式发布版本中得到解决。

 

所有的连接都经过catalog库,当连接请求并发上去后catalog将成为瓶颈,需创建多个catalog库分担压力。

 

同一schema下的各个分片表必须要有主外键关系。

 原文发布时间为:2017-03-06

本文来自云栖社区合作伙伴DBAplus

相关文章
|
2月前
|
Web App开发 编解码 数据可视化
8月更新速递丨暑气未散,热情不减!EasyV产品、组件、模板升级优化不停~ EasyV数字孪生
暑气未消,初秋已至,我们在8月对产品进行了多项优化:「帮助中心」升级为「可视化学院」,涵盖视频、文档、社区等内容,助力高效学习;帮助文档检索能力升级,精准搜索;新增组件版本更新日志,快速掌握变化;引入产品反馈模块,解决疑难问题;新增吸色笔等功能,提升设计体验;优化项目过滤器,提高操作效率;上线文字转语音组件,丰富展示场景;新增多种模板素材,满足多样化需求。诚邀您加入EasyV产研社,共同探讨可视化产品的发展与未来。
|
3月前
|
安全 数据管理 测试技术
联想服务器问题之产品力打磨如何解决
联想服务器问题之产品力打磨如何解决
35 0
|
6月前
|
消息中间件 缓存 监控
阿里P8整理的《百亿级并发系统设计》实战教程,实在是太香了
说实话,如果面试官问你这个题目,那么你必须要使出全身吃奶劲了。为啥?因为你没看到现在很多公司招聘的 JD 里都是说啥有高并发经验者优先。
|
算法 物联网 开发者
分享一个近期开源火爆全网的额温枪方案(硬件+源码)
分享一个近期开源火爆全网的额温枪方案(硬件+源码)
176 1
|
消息中间件 缓存 Java
牛掰!阿里人用7部分讲明白百亿级高并发系统(全彩版小册开源)
高并发 提到“高并发”相信你们应该都不会感到陌生!此时你脑中应该会浮现好多有关高并发的:业务急剧增长、电商购物、电商秒杀、12306抢票、淘宝天猫各种活动等;都是需要用到高并发的,那么如何去设计一个高并发系统抵挡这些冲击呢? 其实这也是一道很常见的面试题,但是大多数应聘者都不知如何回答,从何答起。对于一个Java程序员来讲,,更关注的是不是系统架构层面的呢?从原本的定时秒杀,到现在各种活动的预热、拼团、定金膨胀、百亿补贴、跨店满减以及更复杂的组合优惠,让用户摸不到头脑,虽然这些都扰乱了用户购买的节奏,但是也一直保持着持续升温的状态。
|
Java 开发者
Alibaba刚上线的JDK源码整合手册,瞬间遭受百万源码开发者追捧
随着JDK的不断迭代更新,国内的一些一线互联网大厂都安耐不住了,都开始了自己内部的JDK源码内卷,其中最受大家关注的阿里最先发布了一份号称21年最新的JDK源码整合手册,瞬间受到大批的源码开发者追捧一时风头无两!!!!
|
机器学习/深度学习 缓存 SpringCloudAlibaba
假期做了一项调研:大厂为啥都自研RPC?结果合乎情理!
五一假期过的可真快,今天开始,又要搬砖了。在五一假期当中,冰河做了一项调研,感觉结果还是挺合乎情理的。
380 0
假期做了一项调研:大厂为啥都自研RPC?结果合乎情理!
|
机器学习/深度学习 人工智能 自然语言处理
最早2026?全球优质语言数据「存量」告急!网友:杞人忧天
最早2026?全球优质语言数据「存量」告急!网友:杞人忧天
|
JavaScript 前端开发 开发工具
重"心"出发,从"质"启程--全新开源的X版2.0正式和大家见面啦~
重"心"出发,从"质"启程--全新开源的X版2.0正式和大家见面啦~
重"心"出发,从"质"启程--全新开源的X版2.0正式和大家见面啦~