Cobar 关系型数据的分布式处理系统

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群版 2核4GB 100GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用版 2核4GB 50GB
简介: 原文地址: http://code.alibabatech.com/wiki/display/cobar/Home;jsessionid=779959E690AE94BBC8079BB8F7D8B244 概述 Cobar是关系型数据的分布式处理系统,它可以在分布式的环境下看上去像传统数据库一样为您提供海量数据服务。

原文地址: http://code.alibabatech.com/wiki/display/cobar/Home;jsessionid=779959E690AE94BBC8079BB8F7D8B244

概述

Cobar是关系型数据的分布式处理系统,它可以在分布式的环境下看上去像传统数据库一样为您提供海量数据服务。

  • 产品在阿里巴巴B2B公司已经稳定运行了3年以上。
  • 目前已经接管了3000+个MySQL数据库的schema,为应用提供数据服务。
  • 据最近统计cobar集群目前平均每天处理近50亿次的SQL执行请求。

快速启动

场景描述

  • 系统对外提供的数据库名是dbtest,并且其中有两张表tb1和tb2。
  • tb1表的数据被映射到物理数据库dbtest1的tb1上。
  • tb2表的一部分数据被映射到物理数据库dbtest2的tb2上,另外一部分数据被映射到物理数据库dbtest3的tb2上。
    如下图所示:

步骤一:环境准备

  • 软件准备

    操作系统: Linux或者Windows (推荐在Linux环境下运行Cobar)
    MySQL: http://www.mysql.com/downloads/ (推荐使用5.1以上版本)
    JDK: http://www.oracle.com/technetwork/java/javase/downloads/ (推荐使用1.6以上版本)
    Cobar: http://code.alibabatech.com/wiki/display/cobar/release/ (下载tar.gz或者zip文件)

  • 数据准备

    假设本文MySQL所在服务器IP为192.168.0.1,端口为3306,用户名为test,密码为空,我们需要创建schema:dbtest1、dbtest2、dbtest3,table:tb1、tb2,脚本如下:

    数据库创建脚本
    #创建dbtest1
    drop database if exists dbtest1;
    create database dbtest1;
    use dbtest1;
    #在dbtest1上创建tb1
    create table tb1(
    id    int not null ,
    gmt   datetime);
     
    #创建dbtest2
    drop database if exists dbtest2;
    create database dbtest2;
    use dbtest2;
    #在dbtest2上创建tb2
    create table tb2(
    id    int not null ,
    val   varchar (256));
     
    #创建dbtest3
    drop database if exists dbtest3;
    create database dbtest3;
    use dbtest3;
    #在dbtest3上创建tb2
    create table tb2(
    id    int not null ,
    val   varchar (256));

步骤二:部署和配置Cobar

请确保机器上设置了JAVA环境变量JAVA_HOME
  • 下载Cobar压缩文件并解压,进入conf目录可以看到schema.xml, rule.xml, server.xml等相关的配置文件
    wget http: //code .alibabatech.com /mvn/releases/com/alibaba/cobar/cobar-server/1 .2.4 /cobar-server-1 .2.4. tar .gz
    tar zxf cobar-server-1.2.4. tar .gz
    cd cobar-server-1.2.4 #可以看到bin,conf,lib,logs四个目录
  • schema.xml配置如下(注意:schema.xml包含MySQL的IP、端口、用户名、密码等配置,您需要按照注释替换为您的MySQL信息。)
    schema.xml 配置
    <? xml version = "1.0" encoding = "UTF-8" ?>
    <!DOCTYPE cobar:schema SYSTEM "schema.dtd">
    < cobar:schema xmlns:cobar = "http://cobar.alibaba.com/" >
     
       <!-- schema定义 -->
       < schema name = "dbtest" dataNode = "dnTest1" >
         < table name = "tb2" dataNode = "dnTest2,dnTest3" rule = "rule1" />
       </ schema >
     
       <!-- 数据节点定义,数据节点由数据源和其他一些参数组织而成。-->
       < dataNode name = "dnTest1" >
         < property name = "dataSource" >
           < dataSourceRef >dsTest[0]</ dataSourceRef >
         </ property >
       </ dataNode >
       < dataNode name = "dnTest2" >
         < property name = "dataSource" >
           < dataSourceRef >dsTest[1]</ dataSourceRef >
         </ property >
       </ dataNode >
       < dataNode name = "dnTest3" >
         < property name = "dataSource" >
           < dataSourceRef >dsTest[2]</ dataSourceRef >
         </ property >
       </ dataNode >
     
       <!-- 数据源定义,数据源是一个具体的后端数据连接的表示。-->
       < dataSource name = "dsTest" type = "mysql" >
         < property name = "location" >
           < location >192.168.0.1:3306/dbtest1</ location > <!--注意:替换为您的MySQL IP和Port-->
           < location >192.168.0.1:3306/dbtest2</ location > <!--注意:替换为您的MySQL IP和Port-->
           < location >192.168.0.1:3306/dbtest3</ location > <!--注意:替换为您的MySQL IP和Port-->
         </ property >
         < property name = "user" >test</ property > <!--注意:替换为您的MySQL用户名-->
         < property name = "password" ></ property > <!--注意:替换为您的MySQL密码-->
         < property name = "sqlMode" >STRICT_TRANS_TABLES</ property >
       </ dataSource >
    </ cobar:schema >
  • rule.xml配置如下(本文仅以数字类型的id字段作为拆分字段,将数据拆分到两个库中。)
    rule.xml 配置
    <? xml version = "1.0" encoding = "UTF-8" ?>
    <!DOCTYPE cobar:rule SYSTEM "rule.dtd">
    < cobar:rule xmlns:cobar = "http://cobar.alibaba.com/" >
       <!-- 路由规则定义,定义什么表,什么字段,采用什么路由算法。-->
       < tableRule name = "rule1" >
         < rule >
           < columns >id</ columns >
           < algorithm > <![CDATA[ func1(${id})]]> </ algorithm >
         </ rule >
       </ tableRule >
     
       <!-- 路由函数定义,应用在路由规则的算法定义中,路由函数可以自定义扩展。-->
       < function name = "func1" class = "com.alibaba.cobar.route.function.PartitionByLong" >
         < property name = "partitionCount" >2</ property >
         < property name = "partitionLength" >512</ property >
       </ function >
    </ cobar:rule >
  • server.xml配置如下
    server.xml 配置
    <? xml version = "1.0" encoding = "UTF-8" ?>
    <!DOCTYPE cobar:server SYSTEM "server.dtd">
    < cobar:server xmlns:cobar = "http://cobar.alibaba.com/" >
     
       <!--定义Cobar用户名,密码-->
       < user name = "test" >
         < property name = "password" >test</ property >
         < property name = "schemas" >dbtest</ property >
       </ user >
    </ cobar:server >

步骤三:启动和使用Cobar

    • 启动Cobar,进入bin目录可以看到Cobar的启动、停止与重启脚本
      . /startup .sh #Cobar进程名为CobarStartup
    • 查看logs目录下stdout.log, 启动成功日志如下
      10 : 54 : 19 , 264 INFO  ===============================================
      10 : 54 : 19 , 265 INFO  Cobar is ready to startup ...
      10 : 54 : 19 , 265 INFO  Startup processors ...
      10 : 54 : 19 , 443 INFO  Startup connector ...
      10 : 54 : 19 , 446 INFO  Initialize dataNodes ...
      10 : 54 : 19 , 470 INFO  dnTest1: 0 init success
      10 : 54 : 19 , 472 INFO  dnTest3: 0 init success
      10 : 54 : 19 , 473 INFO  dnTest2: 0 init success
      10 : 54 : 19 , 481 INFO  CobarManager is started and listening on 9066
      10 : 54 : 19 , 483 INFO  CobarServer is started and listening on 8066
      10 : 54 : 19 , 484 INFO  ===============================================
    • 访问Cobar同访问MySQL的方式完全相同, 常用访问方式如下(注意:本文将Cobar部署在192.168.0.1这台机器上,否则请替换为您的Cobar所在IP,其他信息不变)
      #命令行
      mysql -h192. 168.0 . 1 -utest -ptest -P8066 -Ddbtest
       
      #JDBC(建议 5.1 以上的mysql driver版本)
      Class.forName( "com.mysql.jdbc.Driver" );
      Connection conn = DriverManager.getConnection( "jdbc:mysql://192.168.0.1:8066/dbtest" , "test" , "test" );
      ......
    • SQL执行示例,执行语句时与使用传统单一数据库无区别
      mysql>show databases;                                                #dbtest1、dbtest2、dbtest3对用户透明
      + ----------+
      | DATABASE |
      + ----------+
      | dbtest   |
      + ----------+
       
      mysql>show tables;                                                   #dbtest中有两张表tb1和tb2
      + -------------------+
      | Tables_in_dbtest1 |
      + -------------------+
      | tb1               |
      | tb2               |
      + -------------------+
       
      mysql> insert into tb1 (id, gmt) values (1, now());                   #向表tb1插入一条数据
      mysql> insert into tb2 (id, val) values (1, "part1" );                 #向表tb2插入一条数据
      mysql> insert into tb2 (id, val) values (2, "part1" ), (513, "part2" ); #向表tb2同时插入多条数据
      mysql> select * from tb1;                                             #查询表tb1,验证数据被成功插入
      + ----+---------------------+
      | id | gmt                 |
      + ----+---------------------+
      |  1 | 2012-06-12 15:00:42 |
      + ----+---------------------+
       
      mysql> select * from tb2;                                             #查询tb2,验证数据被成功插入
      + -----+-------+
      | id  | val   |
      + -----+-------+
      |   1 | part1 |
      |   2 | part1 |
      | 513 | part2 |
      + -----+-------+
       
      mysql> select * from tb2 where id in (1, 513);                        #根据id查询
      + -----+-------+
      | id  | val   |
      + -----+-------+
      |   1 | part1 |
      | 513 | part2 |
      + -----+-------+
    • 查看后端MySQL数据库dbtest1,dbtest2和dbtest3,验证数据分布在不同的库中
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
18天前
|
机器学习/深度学习 分布式计算 算法
联邦学习是保障数据隐私的分布式机器学习方法
【6月更文挑战第13天】联邦学习是保障数据隐私的分布式机器学习方法,它在不暴露数据的情况下,通过在各设备上本地训练并由中心服务器协调,实现全局模型构建。联邦学习的优势在于保护隐私、提高训练效率和增强模型泛化。已应用于医疗、金融和物联网等领域。未来趋势包括更高效的数据隐私保护、提升可解释性和可靠性,以及与其他技术融合,有望在更多场景发挥潜力,推动机器学习发展。
27 4
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能平台PAI产品使用合集之如何配置cluster系统自动生成分布式参数
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
14天前
|
缓存 监控 负载均衡
Java一分钟之-Ehcache:分布式缓存系统
【6月更文挑战第17天】**Ehcache是Java的开源缓存库,支持本地和分布式缓存,提供负载均衡、数据复制和容错能力。常见问题包括网络分区导致的数据不一致、缓存雪崩和配置不当引起的性能瓶颈。解决策略涉及选择强一致性策略、设置合理缓存过期时间和监控调整配置。使用Ehcache需添加相关依赖,并配置分布式缓存,如示例所示,通过CacheManager创建和管理缓存。实践中,持续监控和优化配置至关重要。**
36 1
|
20天前
|
存储 Kubernetes 监控
etcd:分布式键值存储系统技术
`etcd` 是一个用于共享配置和服务发现的高度可用键值存储系统,基于Raft算法保证数据一致性。它提供HTTP/GRPC API,常用于服务发现、配置共享和分布式锁。etcd集群包含多个节点,每个节点可为领导者或跟随者。在Kubernetes中,etcd存储集群状态,其稳定性和一致性至关重要。维护etcd涉及备份、状态监控、日志审计和安全措施。
26 2
|
3天前
|
机器学习/深度学习 分布式计算 监控
在大数据模型训练中,关键步骤包括数据收集与清洗、特征工程、数据划分;准备分布式计算资源
【6月更文挑战第28天】在大数据模型训练中,关键步骤包括数据收集与清洗、特征工程、数据划分;准备分布式计算资源,选择并配置模型如深度学习架构;通过初始化、训练、验证进行模型优化;监控性能并管理资源;最后保存模型并部署为服务。过程中要兼顾数据隐私、安全及法规遵守,利用先进技术提升效率。
11 0
|
6天前
|
消息中间件 运维 监控
淘客返利系统的分布式事务处理
淘客返利系统的分布式事务处理
|
7天前
|
消息中间件 运维 监控
淘客返利系统的分布式事务处理
淘客返利系统的分布式事务处理
|
2月前
|
传感器 存储 SQL
LabVIEW使用ModbusTCP协议构建分布式测量系统
LabVIEW使用ModbusTCP协议构建分布式测量系统
32 4
|
26天前
|
存储 缓存 NoSQL
了解Redis,第一弹,什么是RedisRedis主要适用于分布式系统,用来用缓存,存储数据,在内存中存储那么为什么说是分布式呢?什么叫分布式什么是单机架构微服务架构微服务的本质
了解Redis,第一弹,什么是RedisRedis主要适用于分布式系统,用来用缓存,存储数据,在内存中存储那么为什么说是分布式呢?什么叫分布式什么是单机架构微服务架构微服务的本质
|
2月前
|
SQL 算法
基于若依的ruoyi-nbcio流程管理系统修改代码生成的sql菜单id修改成递增id(谨慎修改,大并发分布式有弊端)
基于若依的ruoyi-nbcio流程管理系统修改代码生成的sql菜单id修改成递增id(谨慎修改,大并发分布式有弊端)
39 1

热门文章

最新文章