Apache DORIS安装使用测试报告-阿里云开发者社区

Apache Doris 代码仓库地址：[apache/incubator-doris]

* * *

Drois介绍

Doris是基于 MPP 的交互式 SQL 数据仓库，主要用于解决报表和多维分析问题

名词解释

Frontend（FE）：Doris 系统的元数据和调度节点。在导入流程中主要负责导入任务的调度工作。

Backend（BE）：Doris 系统的计算和存储节点。在导入流程中主要负责数据写入及存储。

Spark ETL：在导入流程中主要负责数据的 ETL 工作，包括全局字典构建（BITMAP类型）、分区、排序、聚合等。

Broker：Broker 为一个独立的无状态进程。封装了文件系统接口，提供 Doris 读取远端存储系统中文件的能力

环境安装部署

docker安装

yum install net-tools -y

ifconfig

更新yum仓库

yum update

安装插件

yum install -y yum-utils device-mapper-persistent-data lvm2

添加yum源阿里云

yum-config-manager --add-repo

查看可以安装的docker版本

yum list docker-ce --showduplicates | sort -r

安装docker

yum install docker-ce-18.03.1.ce

修改存储目录

vi /usr/lib/systemd/system/docker.service

ExecStart=/usr/bin/dockerd --graph /home/docker

网络环境：docker需要开启防火墙

systemctl restart firewalld.service && systemctl enable firewalld.service

master 安装:安装 etcd 及配置[root@master ~]# yum install -y etcd[root@master ~]# systemctl restart etcd

配置开机启动： [root@master ~]# systemctl enable etcd

配置etcd[root@master ~]# vim /etc/etcd/etcd.conf

修改

ETCD_LISTEN_CLIENT_URLS="ETCD_ADVERTISE_CLIENT_URLS=""

为

ETCD_LISTEN_CLIENT_URLS="

ETCD_ADVERTISE_CLIENT_URLS="

etcd 设置网段（这个网段将会分配给 flannel0 网卡）：[root@master ~]# etcdctl mk /atomic.io/network/config

'{"Network":"172.20.0.0/16","SubnetMin":"172.20.1.0","SubnetMax":"172.20.254.0"}'

[root@master ~]# etcdctl get /atomic.io/network/config

[root@master ~]# etcdctl get /

/atomic.io/network/config #此文件对应/etc/sysconfig/flannel中的

FLANNEL_ETCD_PREFIX

[root@master ~]# systemctl restart etcd #创建网段后，需要重启etcd，否则后面不能启动flannel

安装flannel

Flannel是CoreOS团队针对Kubernetes设计的一个网络规划服务，简单来说，它的功能是让集群中的不同节点主机创建的Docker容器都具有全集群唯一的虚拟IP地址。但在默认的Docker配置中，

每个节点上的Docker服务会分别负责所在节点容器的IP分配。这样导致的一个问题是，不同节点上容器可能获得相同的内外IP地址。并使这些容器之间能够之间通过IP地址相互找到，也就是相互ping通。

Flannel的设计目的就是为集群中的所有节点重新规划IP地址的使用规则，从而使得不同节点上的容器能够获得"同属一个内网"且"不重复的"IP地址，并让属于不同节点上的容器能够直接通过内网IP通信。

Flannel实质上是一种"覆盖网络(overlay network)"，即表示运行在一个网上的网（应用层网络），并不依靠ip地址来传递消息，而是采用一种映射机制，把ip地址和identifiers做映射来资源定位。也就是将TCP数据包装在另一种网络包里面进行路由转发和通信，目前已经支持UDP、VxLAN、AWSVPC和GCE路由等数据转发方式。

原理是每个主机配置一个ip段和子网个数。例如，可以配置一个覆盖网络使用10.100.0.0/16段，每个主机/24个子网。因此主机a可以接受10.100.5.0/24，主机B可以接受10.100.18.0/24的包。flannel使用etcd来维护分配的子网到实际的ip地址之间的映射。对于数据路径，flannel使用udp来封装ip数据报，转发到远程主机。选择UDP作为转发协议是因为他能穿透防火墙。例如，AWSClassic无法转发IPoIPorGRE网络包，是因为它的安全组仅仅支持TCP/UDP/ICMP。

flannel使用etcd存储配置数据和子网分配信息。flannel启动之后，后台进程首先检索配置和正在使用的子网列表，然后选择一个可用的子网，然后尝试去注册它。

etcd也存储这个每个主机对应的ip。flannel使用etcd的watch机制监视/coreos.com/network/subnets下面所有元素的变化信息，并且根据他来维护一个路由表。为了提高性能，flannel优化了UniversalTAP/TUN设备，对TUN和UDP之间的ip分片做了代理。

默认的节点间数据通信方式是UDP转发.在Flannel的GitHub页面有如下的一张原理图：

1）数据从源容器中发出后，经由所在主机的docker0虚拟网卡转发到flannel0虚拟网卡，这是个P2P的虚拟网卡，flanneld服务监听在网卡的另外一端。

2）Flannel通过Etcd服务维护了一张节点间的路由表，在稍后的配置部分我们会介绍其中的内容。

3）源主机的flanneld服务将原本的数据内容UDP封装后根据自己的路由表投递给目的节点的flanneld服务，数据到达以后被解包，然后直接进入目的节点的flannel0虚拟网卡，

然后被转发到目的主机的docker0虚拟网卡，最后就像本机容器通信一下的有docker0路由到达目标容器。

这样整个数据包的传递就完成了，这里需要解释三个问题：

1）UDP封装是怎么回事？

在UDP的数据内容部分其实是另一个ICMP（也就是ping命令）的数据包。原始数据是在起始节点的Flannel服务上进行UDP封装的，投递到目的节点后就被另一端的Flannel服务

还原成了原始的数据包，两边的Docker服务都感觉不到这个过程的存在。

2）为什么每个节点上的Docker会使用不同的IP地址段？

这个事情看起来很诡异，但真相十分简单。其实只是单纯的因为Flannel通过Etcd分配了每个节点可用的IP地址段后，偷偷的修改了Docker的启动参数。

在运行了Flannel服务的节点上可以查看到Docker服务进程运行参数（psaux|grepdocker|grep"bip"），例如“--bip=182.48.25.1/24”这个参数，它限制了所在节点容器获得的IP范围。这个IP范围是由Flannel自动分配的，由Flannel通过保存在Etcd服务中的记录确保它们不会重复。

3）为什么在发送节点上的数据会从docker0路由到flannel0虚拟网卡，在目的节点会从flannel0路由到docker0虚拟网卡？

例如现在有一个数据包要从IP为172.17.18.2的容器发到IP为172.17.46.2的容器。根据数据发送节点的路由表，它只与172.17.0.0/16匹配这条记录匹配，因此数据从docker0

出来以后就被投递到了flannel0。同理在目标节点，由于投递的地址是一个容器，因此目的地址一定会落在docker0对于的172.17.46.0/24这个记录上，自然的被投递到了docker0网卡。

Flannel环境部署记录

1）机器环境（centos7系统）

182.48.115.233部署etcd，flannel，docker主机名：node-1主控端（通过etcd）

182.48.115.235部署flannel，docker主机名：node-2被控端

2）node-1（182.48.115.233）机器操作

设置主机名及绑定hosts

[root@node-1~]# hostnamectl --static set-hostname node-1

[root@node-1~]# vim /etc/hosts

182.48.115.233node-1

182.48.115.233etcd

182.48.115.235node-2

关闭防火墙，如果开启防火墙，则最好打开2379和4001端口

[root@node-1~]# systemctl disable firewalld.service

[root@node-1~]# systemctl stop firewalld.service

先安装docker环境

[root@node-1~]# yum install -y docker

安装etcd

k8s运行依赖etcd，需要先部署etcd，下面采用yum方式安装：

[root@node-1~]# yum install etcd -y

yum安装的etcd默认配置文件在/etc/etcd/etcd.conf，编辑配置文件：

[root@node-1~]# cp /etc/etcd/etcd.conf /etc/etcd/etcd.conf.bak

[root@node-1~]# cat /etc/etcd/etcd.conf

#[member]

ETCD_NAME=master#节点名称

ETCD_DATA_DIR="/var/lib/etcd/default.etcd"#数据存放位置

#ETCD_WAL_DIR=""

#ETCD_SNAPSHOT_COUNT="10000"

#ETCD_HEARTBEAT_INTERVAL="100"

#ETCD_ELECTION_TIMEOUT="1000"

#ETCD_LISTEN_PEER_URLS="http://0.0.0.0:2380"

ETCD_LISTEN_CLIENT_URLS="http://0.0.0.0:2379,http://0.0.0.0:4001"#监听客户端地址

#ETCD_MAX_SNAPSHOTS="5"

#ETCD_MAX_WALS="5"

#ETCD_CORS=""

#[cluster]

#ETCD_INITIAL_ADVERTISE_PEER_URLS="http://localhost:2380"

# if you use different ETCD_NAME (e.g. test), set ETCD_INITIAL_CLUSTER value for this name, i.e. "test=http://..."

#ETCD_INITIAL_CLUSTER="default=http://localhost:2380"

#ETCD_INITIAL_CLUSTER_STATE="new"

#ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"

ETCD_ADVERTISE_CLIENT_URLS="http://etcd:2379,http://etcd:4001"#通知客户端地址

#ETCD_DISCOVERY=""

#ETCD_DISCOVERY_SRV=""

#ETCD_DISCOVERY_FALLBACK="proxy"

#ETCD_DISCOVERY_PROXY=""

启动etcd并验证状态

[root@node-1~]# systemctl start etcd

[root@node-1~]# ps -ef|grep etcd

etcd281451114:38?00:00:00/usr/bin/etcd--name=master--data-dir=/var/lib/etcd/default.etcd--listen-client-

urls=http://0.0.0.0:2379,http://0.0.0.0:4001

root2818524819014:38pts/100:00:00grep--color=autoetcd

[root@node-1~]# lsof -i:2379

COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME

etcd28145etcd6uIPv612838220t0TCP*:2379(LISTEN)

etcd28145etcd18uIPv612841330t0TCPlocalhost:53203->localhost:2379(ESTABLISHED)

........

[root@node-1~]# etcdctl set testdir/testkey0 0

[root@node-1~]# etcdctl get testdir/testkey0

[root@node-1~]# etcdctl -C http://etcd:4001 cluster-health

member8e9e05c52164694dishealthy:gothealthyresultfromhttp://etcd:2379

clusterishealthy

[root@node-1~]# etcdctl -C http://etcd:2379 cluster-health

member8e9e05c52164694dishealthy:gothealthyresultfromhttp://etcd:2379

clusterishealthy

安装覆盖网络Flannel

[root@node-1~]# yum install flannel

配置Flannel

[root@node-1~]# cp /etc/sysconfig/flanneld /etc/sysconfig/flanneld.bak

[root@node-1~]# vim /etc/sysconfig/flanneld

# Flanneld configuration options

# etcd url location. Point this to the server where etcd runs

FLANNEL_ETCD_ENDPOINTS="http://etcd:2379"

# etcd config key. This is the configuration key that flannel queries

# For address range assignment

FLANNEL_ETCD_PREFIX="/atomic.io/network"

# Any additional options that you want to pass

#FLANNEL_OPTIONS=""

配置etcd中关于flannel的key（这个只在安装了etcd的机器上操作）

Flannel使用Etcd进行配置，来保证多个Flannel实例之间的配置一致性，所以需要在etcd上进行如下配置（'/atomic.io/network/config'这个key与上文/etc/sysconfig/flannel中的配置项FLANNEL_ETCD_PREFIX是相对应的，错误的话启动就会出错）：

[root@node-1~]# etcdctl mk /atomic.io/network/config '{ "Network": "182.48.0.0/16" }'

{"Network":"182.48.0.0/16"}

温馨提示：上面flannel设置的ip网段可以任意设定，随便设定一个网段都可以。容器的ip就是根据这个网段进行自动分配的，ip分配后，容器一般是可以对外联网的（网桥模式，只要宿主机能上网就可以）

启动Flannel

[root@node-1~]# systemctl enable flanneld.service

[root@node-1~]# systemctl start flanneld.service

[root@node-1~]# ps -ef|grep flannel

root93059085009:12pts/200:00:00grep--color=autoflannel

root2887610May15?00:00:07/usr/bin/flanneld-etcd-endpoints=http://etcd:2379 -etcd-prefix=/atomic.io/network

启动Flannel后，一定要记得重启docker，这样Flannel配置分配的ip才能生效，即docker0虚拟网卡的ip会变成上面flannel设定的ip段

[root@node-1~]# systemctl restart docker

3）node-2（182.48.115.235）机器操作

设置主机名及绑定hosts

[root@node-2~]# hostnamectl --static set-hostname node-2

[root@node-2~]# vim /etc/hosts

182.48.115.233node-1

182.48.115.233etcd

182.48.115.235node-2

关闭防火墙，如果开启防火墙，则最好打开2379和4001端口

[root@node-2~]# systemctl disable firewalld.service

[root@node-2~]# systemctl stop firewalld.service

先安装docker环境

[root@node-2~]# yum install -y docker

安装覆盖网络Flannel

[root@node-2~]# yum install flannel

配置Flannel

[root@node-2~]# cp /etc/sysconfig/flanneld /etc/sysconfig/flanneld.bak

[root@node-2~]# vim /etc/sysconfig/flanneld

# Flanneld configuration options

# etcd url location. Point this to the server where etcd runs

FLANNEL_ETCD_ENDPOINTS="http://etcd:2379"

# etcd config key. This is the configuration key that flannel queries

# For address range assignment

FLANNEL_ETCD_PREFIX="/atomic.io/network"

# Any additional options that you want to pass

#FLANNEL_OPTIONS=""

启动Flannel

[root@node-2~]# systemctl enable flanneld.service

[root@node-2~]# systemctl start flanneld.service

[root@node-2~]# ps -ef|grep flannel

root38419649009:11pts/000:00:00grep--color=autoflannel

root2899510May15?00:00:07/usr/bin/flanneld-etcd-endpoints=http://etcd:2379 -etcd-prefix=/atomic.io/network

启动Flannel后，一定要记得重启docker，这样Flannel配置分配的ip才能生效，即docker0虚拟网卡的ip会变成上面flannel设定的ip段

[root@node-2~]# systemctl restart docker

先要放开两台主机访问的防火墙：

[root@master ~]# iptables -I INPUT -s 192.168.10.0/24 -j ACCEPT

[root@slave01 ~]# iptables -I INPUT -s 192.168.10.0/24 -j ACCEPT

4）创建容器，验证跨主机容器之间的网络联通性

首先在node-1（182.48.115.233）上容器容器，如下，登陆容器发现已经按照上面flannel配置的分配了一个ip段（每个宿主机都会分配一个182.48.0.0/16的网段）

[root@node-1~]# docker run -ti -d --name=node-1.test docker.io/nginx /bin/bash

5e403bf93857fa28b42c9e2abaa5781be4e2bc118ba0c25cb6355b9793dd107e

[root@node-1~]# docker exec -ti node-1.test /bin/bash

root@5e403bf93857:/# ip addr

1:lo:

<LOOPBACK,UP,LOWER_UP>mtu65536qdiscnoqueuestateUNKNOWNgroupdefault

link/loopback00:00:00:00:00:00brd00:00:00:00:00:00

inet127.0.0.1/8scopehostlo

valid_lftforeverpreferred_lftforever

inet6::1/128scopehost

valid_lftforeverpreferred_lftforever

2953:eth0@if2954:<BROADCAST,MULTICAST,UP,LOWER_UP>mtu1472qdiscnoqueuestateUPgroupdefault

link/ether02:42:b6:30:19:04brdff:ff:ff:ff:ff:fflink-netnsid0

inet182.48.25.4/24scopeglobaleth0

valid_lftforeverpreferred_lftforever

inet6fe80::42:b6ff:fe30:1904/64scopelink

valid_lftforeverpreferred_lftforever

接着在node-2（182.48.115.233）上容器容器

[root@node-2~]# docker exec -ti node-2.test /bin/bash

root@052a6a2a4a19:/# ip addr

1:lo:<LOOPBACK,UP,LOWER_UP>mtu65536qdiscnoqueuestateUNKNOWNgroupdefault

link/loopback00:00:00:00:00:00brd00:00:00:00:00:00

inet127.0.0.1/8scopehostlo

valid_lftforeverpreferred_lftforever

inet6::1/128scopehost

valid_lftforeverpreferred_lftforever

10:eth0@if11:

<BROADCAST,MULTICAST,UP,LOWER_UP>mtu1472qdiscnoqueuestateUPgroupdefault

link/ether02:42:b6:30:43:03brdff:ff:ff:ff:ff:fflink-netnsid0

inet182.48.67.3/24scopeglobaleth0

valid_lftforeverpreferred_lftforever

inet6fe80::42:b6ff:fe30:4303/64scopelink

valid_lftforeverpreferred_lftforever

root@052a6a2a4a19:/# ping 182.48.25.4

PING182.48.25.4(182.48.25.4):56databytes

64bytesfrom182.48.25.4:icmp_seq=0ttl=60time=2.463ms

64bytesfrom182.48.25.4:icmp_seq=1ttl=60time=1.211ms

.......

root@052a6a2a4a19:/# ping www.baidu.com

PINGwww.a.shifen.com(14.215.177.37):56databytes

64bytesfrom14.215.177.37:icmp_seq=0ttl=51time=39.404ms

64bytesfrom14.215.177.37:icmp_seq=1ttl=51time=39.437ms

.......

发现，在两个宿主机的容器内，互相ping对方容器的ip，是可以ping通的！也可以直接连接外网（桥接模式）

查看两台宿主机的网卡信息，发现docker0虚拟网卡的ip（相当于容器的网关）也已经变成了flannel配置的ip段，并且多了flannel0的虚拟网卡信息

[root@node-1~]# ifconfig

docker0:flags=4163<UP,BROADCAST,RUNNING,MULTICAST>mtu1472

inet182.48.25.1netmask255.255.255.0broadcast0.0.0.0

inet6fe80::42:31ff:fe0f:cf0fprefixlen64scopeid0x20<link>

ether02:42:31:0f:cf:0ftxqueuelen0(Ethernet)

RXpackets48bytes2952(2.8KiB)

RXerrors0dropped0overruns0frame0

TXpackets31bytes2286(2.2KiB)

TXerrors0dropped0overruns0carrier0collisions0

eth0:flags=4163<UP,BROADCAST,RUNNING,MULTICAST>mtu1500

inet182.48.115.233netmask255.255.255.224broadcast182.48.115.255

inet6fe80::5054:ff:fe34:782prefixlen64scopeid0x20<link>

ether52:54:00:34:07:82txqueuelen1000(Ethernet)

RXpackets10759798bytes2286314897(2.1GiB)

RXerrors0dropped40overruns0frame0

TXpackets21978639bytes1889026515(1.7GiB)

TXerrors0dropped0overruns0carrier0collisions0

flannel0:flags=4305<UP,POINTOPOINT,RUNNING,NOARP,MULTICAST>mtu1472

inet182.48.25.0netmask255.255.0.0destination182.48.25.0

unspec00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00txqueuelen500(UNSPEC)

RXpackets12bytes1008(1008.0B)

RXerrors0dropped0overruns0frame0

TXpackets12bytes1008(1008.0B)

TXerrors0dropped0overruns0carrier0collisions0

通过下面命令，可以查看到本机的容器的ip所在的范围

[root@node-1~]# ps aux|grep docker|grep "bip"

root20800.01.479686428168?SslMay150:18/usr/bin/dockerd-current--add-runtimedocker-runc=/usr/libexec/docker/docker-runc-current--default-runtime=docker-runc--exec-optnative.cgroupdriver=systemd--userland-proxy-path=/usr/libexec/docker/docker-proxy-current--insecure-registryregistry:5000--bip=182.48.25.1/24--ip-masq=true--mtu=1472

这里面的“--bip=182.48.25.1/24”这个参数，它限制了所在节点容器获得的IP范围。

这个IP范围是由Flannel自动分配的，由Flannel通过保存在Etcd服务中的记录确保它们不会重复

Doris

准备好装有Docker的虚拟机，这里我们部署Doris的最低配置的集群方式部署

按照官方所说，4台机器效果还可以，而且扩容也不难

1.下载doris的容器镜像

docker pull apachedoris/doris-dev:build-env-1.2

2.节点1配置FE(Leader)

创建一个Doris的容器节点，如果想外网访问该集群，需要配置端口映射，在--privileged 后面添加 -p 9030:9030等参数，具体参考官方文档，我这里就不开启了

docker run -it --name doris-node1 -h doris-node1 --network tech --privileged apachedoris/doris-dev:build-env-1.2

下载Doris的安装包

cd /opt

tar -zxvf apache-doris-0.12.0-incubating-src.tar.gz

cd apache-doris-0.12.0-incubating-src

sh build.sh

配置该节点的FE（Leader）

cd output/fe

mkdir doris-meta

mkdir log

sh bin/start_fe.sh --daemon

这个 --daemon是后台运行的意思

运行之后检查一下，是否有doris的进行，监听的端口，日志信息等等

ps -ef

netstat -ntlp 如果没有netstat命令的话，执行以下yum install net-tools -y即可

vi log/fe.log

后续的节点配置运行之后，也要执行这些命令去检查一下状态，

3.节点2配置FE（Observer）和 BE

创建一个Doris的容器节点

docker run -it --name doris-node2 -h doris-node2 --network tech --privileged apachedoris/doris-dev:build-env-1.2

下载Doris的安装包

cd /opt

解压安装

tar -zxvf apache-doris-0.12.0-incubating-src.tar.gz

cd apache-doris-0.12.0-incubating-src

sh build.sh

配置该节点的FE（Observer）

cd output/fe

mkdir doris-meta

mkdir log

修改配置文件

vi conf/fe.conf

将edit_log_port的9010改成9011防止和Leader冲突

MySQL**连接Leader节点的FE(无密码)，找一台装了mysql-client的节点去连，如果Leader节点是正常的情况下，是能后用mysql-client连接上的，没有的话自行找资料安装在Leader节点也可以**

mysql -uroot -h 192.168.124.9 -P 9030

-h**参数指定的IP为Leader节点的IP**

添加Observer的节点信息

这里的IP为Observer的IP和Observer节点的fe.conf中的edit_log_port后面的端口号

ALTER SYSTEM ADD OBSERVER "192.168.124.10:9011";

启动Observer节点

这里的IP为Leader的IP以及Leader节点的fe.conf中的edit_log_port后面的端口号

sh bin/start_fe.sh --helper 192.168.124.9:9010 --daemon

按照配置节点1 的方式去检查一下状态

另外，检查一下Leader节点是否已经添加好了Observer

用mysql-client连接FE，执行这个语句：

SHOW PROC '/frontends';

这时，查看fe.log的日志Leader和Observer都是不断滚动的，在通过心跳监测

Observer**日志**

Leader**的日志**

配置该节点的BE

cd ../be

mkdir storage

mkdir log

MySQL**连接节点一的FE(无密码)**

mysql -uroot -h 192.168.124.9 -P 9030

执行下面的语句

ALTER SYSTEM ADD BACKEND "192.168.124.10:9050";

exit;

启动

sh bin/start_be.sh --daemon

检查BE的运行情况省略

4.节点3配置BE

创建一个Doris的容器节点

docker run -it --name doris-node3 -h doris-node3 --network tech --privileged apachedoris/doris-dev:build-env-1.2

下载Doris的安装包

cd /opt

tar -zxvf apache-doris-0.12.0-incubating-src.tar.gz

cd apache-doris-0.12.0-incubating-src

sh build.sh

配置该节点的FE（Observer）

cd output/be

mkdir storage

mkdir log

MySQL**连接节点一的FE(无密码)**

mysql -uroot -h 192.168.124.9 -P 9030

ALTER SYSTEM ADD BACKEND "192.168.124.11:9050";

exit;

启动

sh bin/start_be.sh --daemon

检查BE的运行情况省略

5.节点4配置BE

创建一个Doris的容器节点

docker run -it --name doris-node4 -h doris-node4 --network tech --privileged apachedoris/doris-dev:build-env-1.2

下载Doris的安装包

cd /opt

解压安装

tar -zxvf apache-doris-0.12.0-incubating-src.tar.gz

cd apache-doris-0.12.0-incubating-src

sh build.sh

配置该节点的FE（Observer）

cd output/be

mkdir storage

mkdir log

MySQL**连接节点一的FE(无密码)**

mysql -uroot -h 192.168.124.9 -P 9030

ALTER SYSTEM ADD BACKEND "192.168.124.12:9050";

exit;

启动

sh bin/start_be.sh --daemon

检查BE的运行情况省略

6.查看BE状态

使用 mysql-client 连接到 FE，并执行 SHOW PROC '/backends'; 查看 BE 运行情况。如一切正常，isAlive 列应为 true。

查看 Follower 或 Observer 运行状态。使用 mysql-client 连接到任一已启动的 FE，并执行：SHOW PROC '/frontends'; 可以查看当前已加入集群的 FE 及其对应角色。

就按着这个步骤搭建吧

测试环境

硬件配置（3台X86服务器）

CPUIntel(R) Xeon(R) CPU E5-2650 0 @ 2.00GHz

内存64G8G*8

磁盘1TB * 8

网卡千兆

软件环境

操作系统Centos 7.8

dockerDocker version 18.03.1-ce, build 9ee9f40

虚拟网络flannel -0.7.1

分布式存储仓库etcd Version: 3.3.11

数据量

会员数据，每天413万，两年数据31亿左右

测试查询语句

with mtableas(

selectJygs, Mkt Mkt,''Channel, Sc Sc, Gz Gz, Dl Dl, Zl Zl, Xl Xl,

Ppid Ppid, Gdid Gdid, Gdname Gdname, Hylb, Hyxb, Hynl,''Ecust, Hyid,

Xfsd Xfsd, Jzdj Jzdj,

count(distinctcase hyid when'0'thenNullelse billno end) Hykds,

Sum(Hykjs) Hykjs,

Sum(Hyxfe) Hyxfe,

Sum(Hymle) Hymle,

count(distinctbillno) Kds,

Sum(Kjs) Kjs,

Sum(Xfe) Xfe,

Sum(Kds - Hykds) +count(distinctcase hyid when'0'thenNullelse hyid end ) Zxfrs,

Sum(mle) Mle,

Count(distinctcase datediff(CAST(fkrqasdate),cast('2016-01-01'asdate)) when -1then'0'whennullthen'0'else case Hyid when'0'thenNullelse Hyid end end) Xzhyrs,

Sum(case DATEDIFF(fkrq,'2016-01-01') when -1then0else1end * Hyxfe) Xzhyxfe,

round(DATEDIFF(rq,'2016-01-01')/1,0)+1asXFZQNUM,

concat_ws('--',Min(Rq), Max(Rq)) Xfzqno--消费周期段

from(

Select

Jygs ,Mkt Mkt,''Channel, Sc Sc, Gz Gz, Dl Dl, Zl Zl, Xl Xl,

Ppid Ppid, Gdid Gdid, Gdname Gdname, Hylb, Hyxb, Hynl,''Ecust, Hyid,

Xfsd Xfsd, Jzdj Jzdj,Hyxfe,billno,Kjs,Xfe,Kds,Hykds,mle,0Xzhyxfe,Hykjs,Hymle,fkrq,rq

Fromdr_selllist_gd

Where

mktin('3004')

andrqBETWEEN'2016-01-01'and'2016-05-30'

AndZl ='002-302'

AndHylbin('001','002')

AndPpid ='002-023601'

AndXfsd ='08'

) aGroupByJygs, Mkt, Sc, Gz, Dl, Zl, Xl, Ppid, Gdid, Gdname, Hylb, Hyxb, Hynl, Hyid, Xfsd, Jzdj,rq

)

Select

Jygs,

Mkt Mkt,

'v3'Channel,

Sc Sc,

Gz Gz,

Dl Dl,

Zl Zl,

Xl Xl,

Ppid Ppid,

Gdid Gdid,

Gdname Gdname,

Hylb,

Hyxb,

Hynl,

''Ecust,

Hyid,

Xfsd Xfsd,

Zkds,

Hykds,

Kdszb,

Zxfe,

Hyxfe,

Xfezb,

Zmle,

Hymle,

Mlezb,

Zkdj,

Hykdj,

XfpcasHyrs,

Zxfrs,

case Zxfrs when0then0else Round(Xfpc/Zxfrs,2) end Hyxfrszb,

Xzhyrs,

Zkjs,

Hykjs,

Kjszb,

Zkjj,

Hykjj,

Xfpc,

Xzhyxfe,

XFZQNUM,

Xfzqno,

case Xfpc when0then0else Round(Hyxfe/Xfpc,4) end Hygml,

case Xfpc when0then0else Round(Hykds / Xfpc,4) end Hypjkds

From(

Select

Jygs,

Mkt,

Channel,

Sc,

Gz,

Dl,

Zl,

Xl,

Ppid,

Gdid,

Gdname,

Xfsd,

Hylb,

Hyxb,

Hynl,

Ecust,

Hyid,

(Kds) Zkds,

(Kjs) Zkjs,

(Xfe) Zxfe,

(Mle) Zmle,

(Zxfrs) Zxfrs,

Sum(Hykds) Hykds,

Sum(Hykjs) Hykjs,

Sum(Hyxfe) Hyxfe,

Sum(Hymle) Hymle,

case Kds when0then0else Round(Sum(Hykds)/Kds,4) end Kdszb,

case Kjs when0then0else Round(Sum(Hykjs)/Kjs,4) end Kjszb,

case Xfe when0then0else Round(Sum(Hyxfe)/Xfe,4) end Xfezb,

case Mle when0then0else Round(Sum(Hymle)/Mle,4) end Mlezb,

case Kds when0then0else Round(Xfe/Kds,2) end Zkdj,

case Sum(Hykds) when0then0else Round(Sum(Hyxfe)/Sum(Hykds),2) end Hykdj,

case Kjs when0then0else Round(Xfe/Kjs,2) end Zkjj,

case Sum(Hykjs) when0then0else Round(Sum(Hyxfe)/Sum(Hykjs),2) end Hykjj,

Count(Distinct(case Hyid when'0'thenNullelse Hyid end )) Xfpc,

Xzhyrs,

Sum(Xzhyxfe) Xzhyxfe,

XFZQNUM,

Xfzqno

Frommtable

GroupByJygs,

Mkt,

Channel,

Sc,

Gz,

Dl,

Zl,

Xl,

Ppid,

Gdid,

Gdname,

Xfsd,

Hylb,

Hyxb,

Hynl,

Ecust,

Hyid,

Xfe,

Mle,

Kds,

Kjs,

Zxfrs,

XFZQNUM,

Xfzqno,Xzhyrs

) b

测试Case及结果

查询SQL说明查询时间

第一次查询1年15亿数据1s15ms

第二次查询一年15亿数据241ms

查询两年31亿数据2s95ms

第二次查询982ms

10个并发查询不同门店数据6s

20个并发查询不同门店数据6s

100个并发查询不同门店数据6-47s

500个并发查询不同门店数据6-687s

在高并发的情况下查询等待时候会很长，这个主要原因可能是因为我这边是Docker部署，虚拟网络不是很熟，部署的性能不是很好，导致了很多查询一直在等待，

整体评估性能非常不错

数据建表语句

会员行为明细数据

createtabledr_selllist_gd(

rqdate,

mktvarchar(40),

hyidvarchar(40),

hynovarchar(40),

hylbvarchar(40),

hyxbvarchar(40),

hynlvarchar(40),

hyzyvarchar(40),

hysrvarchar(40),

hyxlvarchar(40),

hyrvarchar(40),

hyfvarchar(40),

hymvarchar(40),

scvarchar(40),

bmvarchar(40),

gzvarchar(40),

dlvarchar(40),

zlvarchar(40),

xlvarchar(40),

ppidvarchar(40),

supidvarchar(40),

gdidvarchar(40),

invnovarchar(40),

kdsdecimal(20,2),

xfedecimal(20,4),

mledecimal(20,4),

hykdsdecimal(20,2),

hyxfedecimal(20,4),

hymledecimal(20,4),

hdhysdecimal(20,4),

num1decimal(20,4),

num2decimal(20,4),

num3decimal(20,4),

num4decimal(20,4),

num5decimal(20,4),

num6decimal(20,4),

num7decimal(20,4),

num8decimal(20,4),

num9decimal(20,4),

gzlxvarchar(50),

gdnamevarchar(200),

custnamevarchar(200),

ldfsvarchar(100),

jzqyvarchar(100),

addattr2varchar(100),

addattr3varchar(100),

addattr4varchar(100),

khjlvarchar(100),

jzdjvarchar(100),

ssdvarchar(100),

telyysvarchar(100),

billnovarchar(50),

syjidvarchar(100),

cyidvarchar(20),

kjsint,

hykjsint,

hyqyvarchar(40),

xfsdvarchar(40),

ldvarchar(40),

lcvarchar(40),

ppdjvarchar(40),

xzvarchar(40),

xxvarchar(40),

jrvarchar(40),

fkrqdate,

jygsvarchar(20),

rqyearint,

rqmonthint,

channel varchar(20),

ecust varchar(20),

regmkt varchar(20),

hybirth varchar(20)

)

DUPLICATE KEY(rq,mkt,hyid)

PARTITIONBYRANGE(rq) (

PARTITION P_201801VALUES[("2017-01-01"),("2017-02-01")),

PARTITION P_201801VALUES[("2017-02-01"),("2017-03-01")),

PARTITION P_201801VALUES[("2017-03-01"),("2017-04-01")),

PARTITION P_201801VALUES[("2017-04-01"),("2017-05-01")),

PARTITION P_201801VALUES[("2017-05-01"),("2017-06-01")),

PARTITION P_201801VALUES[("2017-06-01"),("2017-07-01")),

PARTITION P_201801VALUES[("2017-07-01"),("2017-08-01"))

)

DISTRIBUTEDBYHASH(mkt) BUCKETS112

PROPERTIES(

"replication_num"="2",

"in_memory"="true",

"dynamic_partition.enable"="true",

"dynamic_partition.time_unit"="MONTH",

"dynamic_partition.start"="-2147483648",

"dynamic_partition.end"="2",

"dynamic_partition.prefix"="P_",

"dynamic_partition.buckets"="112"

);

相关字典表

--企业品牌编码表

createtabledws_brand(

brand_codevarchar(10) commit'品牌编码',

brand_cnamevarchar(20) commit'品牌中文名称',

brand_enamevarchar(20) commit'品牌英文名称',

brand_classintcommit'品牌树层级',

brand_pidintcommit'本层级的上级编码',

brand_flagchar(1) commit'是否是末级'

)

DUPLICATE KEY(brand_code)

PROPERTIES(

"replication_num"="2",

"in_memory"="true"

);

--渠道表

createtabledws_channel(

channel_codevarchar(10) commit'渠道编码',

channel_cnamevarchar(20) commit'渠道中文名称',

channel_classintcommit'渠道树层级',

channel_precodeintcommit'本层级的上级编码',

channel_lastflagchar(1) commit'是否是末级',

channel_statuschar(1) commit'渠道状态'

)

DUPLICATE KEY(channel_code)

PROPERTIES(

"replication_num"="2",

"in_memory"="true"

);

--会员类型表

createtabledws_custtype(

ctcodechar(3) commit'会员类型编码',

ctnamevarchar(20) commit'会员类型名称'

)

DUPLICATE KEY(ctcode)

PROPERTIES(

"replication_num"="2",

"in_memory"="true"

);

--门店表

createtabledws_store(

store_codevarchar(5) commit'门店编号',

store_namevarchar(20) commit'门店名称',

store_typevarchar(20) commit'门店类型',

store_cityvarchar(20) commit'所属城市',

store_regionvarchar(20) commit'所属省份',

store_area_centervarchar(20) commit'所在组织架构中的所属区域中心',

store_groupvarchar(20) commit'门店所在群组',

store_addressvarchar(200) commit'门店地址',

store_opendatedatecommit'开店日期',

store_closedatedatecommit'关店日期',

store_floorsintcommit'门店总楼层',

store_sizeintcommit'营业面积'

)

DUPLICATE KEY(store_code)

PROPERTIES(

"replication_num"="2",

"in_memory"="true"

);

--会员字典表用于同步或定义会员基础数据（感觉是没用的）

createtabledws_custdict(

cust_typevarchar(10) commit'类别',

cust_idvarchar(20) commit'编号',

cust_statuschar(1) commit'状态',

cust_namevarchar(40) commit'中文名称',

cust_valuetypevarchar(10) commit'取值方式',

cust_valuevarchar(80) commit'值',

cust_mindatedatecommit'开始时间',

cust_maxdatedatecommit'结束时间',

cust_minnumintcommit'开始值',

cust_maxnumintcommit'结束值',

cust_chr1varchar(20) commit'开始字符串',

cust_chr2varchar(20) commit'结束字符串',

cust_rangevarchar(20) commit'参数定义类别'

)

DUPLICATE KEY(cust_type,cust_id,cust_status)

PROPERTIES(

"replication_num"="2",

"in_memory"="true"

);

--组织架构

createtabledws_org(

mf_codevarchar(10) commit'编码',

mf_statuschar(1) commit'状态',

mf_cglxchar(1) commit'仓柜类型',

mf_lsfschar(1) commit'门店连锁方式',

mf_cnamevarchar(20) commit'中文名称',

mf_enamevarchar(20) commit'英文名称',

mf_subjectvarchar(20) commit'核算代码',

mf_classintcommit'上级编码',

mf_fcodevarchar(20) commit'所属门店编码',

mf_pcodevarchar(20) commit'上级编码',

mf_yymjdecimal(12,4) commit'营业面积',

mf_jzareaintcommit'建筑面积',

mf_zjareaintcommit'租金面积'

)

DUPLICATE KEY(mf_code,mf_status,mf_cglx,mf_lsfs)

PROPERTIES(

"replication_num"="2",

"in_memory"="true"

);

--事业部表

createtabledws_sub(

sub_codevarchar(4) commit'编码',

sub_namevarchar(20) commit'名称',

sub_statuschar(1) commit'状态'

)

DUPLICATE KEY(mf_code,mf_status,mf_cglx,mf_lsfs)

PROPERTIES(

"replication_num"="2",

"in_memory"="true"

);

--分类表

createtabledws_catgory(

cat_codevarchar(10) commit'编码',

cat_cnamevarchar(40) commit'中文名称',

cat_enamevarchar(60) commit'英文名称',

cat_pcodevarchar(10) commit'上级编码',

cat_classTINYINTcommit'所属级次'，

cat_statuschar(1) commit'状态'

)

DUPLICATE KEY(cat_code)

PROPERTIES(

"replication_num"="2",

"in_memory"="true"

);

会员表

--会员基本信息

createtabledws_customer(

cust_codevarchar(20),

cust_namevarchar(20),

cust_idnovarchar(20),

cust_marketvarchar(20),

cust_typevarchar(20),

cust_statuschar(1),

cust_mindatedatetime,

cust_maxdatedatetime,

cust_jfbalanceint,

cust_xfjedecimal(18,2),

cust_khmodevarchar(20),

cust_sexchar(1),

cust_birthdaydate,

cust_managervarchar(20),

cust_invitedbyvarchar(20),

cust_chaidvarchar(20),

enterprise_codevarchar(10),

sub_codevarchar(10),

erp_codevarchar(10)

)

DUPLICATE KEY(cust_code,cust_name)

DISTRIBUTEDBYHASH(cust_code) BUCKETS10

PROPERTIES(

"replication_num"="3",

"in_memory"="true"

);

droptableif EXISTS dws_card_log;

createtabledws_card_log(

cdldatedatetime,

mktidvarchar(10),

ent_idvarchar(10),

cdlseqnovarchar(20),

chidvarchar(10),

cdltypevarchar(10),

cdlcnovarchar(20),

cdlcustidvarchar(10),

cdlcidvarchar(10),

cdlmktvarchar(10),

cdlmcardchar(1),

cdlflagchar(1),

cdltransvarchar(10),

billnovarchar(20),

moduleidvarchar(10),

operbyvarchar(10),

cdlchgamtdecimal(10,2),

cdlflamtdecimal(10,2),

cdlchgreasonvarchar(200),

cdlkhtypevarchar(20),

cdlchgynovarchar(20),

cdlmemovarchar(200),

tmddvarchar(20),

enterprise_codevarchar(10),

sub_codevarchar(10),

erp_codevarchar(10)

)

DUPLICATE KEY(cdldate,mktid)

PARTITIONBYRANGE(cdldate) (

PARTITION P_201701VALUES[("2017-01-01 00:00:00"),("2017-02-01 23:59:59"))

)

DISTRIBUTEDBYHASH(mktid) BUCKETS50

PROPERTIES(

"replication_num"="2",

"dynamic_partition.enable"="true",

"dynamic_partition.time_unit"="MONTH",

"dynamic_partition.start"="-2147483648",

"dynamic_partition.end"="2",

"dynamic_partition.prefix"="P_",

"dynamic_partition.buckets"="50"

);

droptableif EXISTS dws_accnt_log;

createtabledws_accnt_log(

logdatedatetime,

occur_buidvarchar(20),

ent_idvarchar(20),

group_idvarchar(20),

type_idvarchar(20),

log_seqint,

batch_idint,

cidvarchar(20),

summaryvarchar(20),

accnt_novarchar(20),

face_valuedecimal(10,2),

amountdecimal(10,2),

balancedecimal(10,2),

eff_datedate,

exp_datedate,

statuschar(1),

src_channelvarchar(20),

src_corpvarchar(20),

src_buidvarchar(20),

issue_datedate,

occur_channelvarchar(20),

occur_corpvarchar(20),

occur_termvarchar(20),

occur_invnoint,

occur_ordernovarchar(20),

occur_consseqint,

occur_worknovarchar(30),

occur_opvarchar(20),

dealtypechar(1),

transtypevarchar(20),

occur_salebillvarchar(20),

freezeamtdecimal(10,2),

tot_balancedecimal(10,2),

zxratedecimal(10,2),

reodecimal(10,2),

enterprise_codevarchar(10),

sub_codevarchar(10),

erp_codevarchar(10)

)

DUPLICATE KEY(logdate,occur_buid)

PARTITIONBYRANGE(logdate) (

PARTITION P_201701VALUES[("2017-01-01 00:00:00"),("2017-02-01 23:59:59"))

)

DISTRIBUTEDBYHASH(occur_buid) BUCKETS50

PROPERTIES(

"replication_num"="2",

"dynamic_partition.enable"="true",

"dynamic_partition.time_unit"="MONTH",

"dynamic_partition.start"="-2147483648",

"dynamic_partition.end"="2",

"dynamic_partition.prefix"="P_",

"dynamic_partition.buckets"="50"

);

droptableif EXISTS dws_cust_cons_log;

createtabledws_cust_cons_log(

cdldatedatetime,

cdlcmktvarchar(20),

ent_idint,

cdltypevarchar(20),

cdlseqnovarchar(20),

cdlrownoint,

cdljygsvarchar(20),

cdlmktvarchar(20),

cdlchannelvarchar(20),

cdlcustidvarchar(20),

cdlcnovarchar(20),

cdlflagchar(2),

cdlmcardchar(1),

cdltransvarchar(20),

cdlsyjidvarchar(20),

cdlinvnoint,

cdltracevarchar(20),

cdlmfidvarchar(50),

cdlgdidvarchar(20),

cdlgdnamevarchar(100),

cdlunitcodevarchar(20),

cdlcatidvarchar(100),

cdlppcodevarchar(100),

cdlbzhldecimal(10,2),

cdlsldecimal(10,2),

cdlsjdecimal(10,2),

cdlpricedecimal(10,2),

cdlzkjedecimal(10,2),

cdlcjjedecimal(10,2),

cdljfdecimal(10,2),

cdlyxjedecimal(10,2),

cdljfadecimal(10,2),

cdljfbdecimal(10,2),

cdljfcdecimal(10,2),

cdljfddecimal(10,2),

cdljfedecimal(10,2),

cdljffdecimal(10,2),

cdljfkdecimal(10,2),

cdlczzdecimal(10,2),

tmddvarchar(20),

enterprise_codevarchar(20),

sub_codevarchar(20),

erp_codevarchar(20)

)

DUPLICATE KEY(cdldate,cdlcmkt)

PARTITIONBYRANGE(cdldate) (

PARTITION P_201701VALUES[("2017-01-01 00:00:00"),("2017-02-01 23:59:59"))

)

DISTRIBUTEDBYHASH(cdlcmkt) BUCKETS50

PROPERTIES(

"replication_num"="2",

"dynamic_partition.enable"="true",

"dynamic_partition.time_unit"="MONTH",

"dynamic_partition.start"="-2147483648",

"dynamic_partition.end"="2",

"dynamic_partition.prefix"="P_",

"dynamic_partition.buckets"="50"

);

动态添加分区

ALTERTABLEdr_selllist_gd ADD PARTITION P_201806VALUESLESS THAN("2018-07-01");

ALTERTABLEdr_selllist_gd ADD PARTITION P_201807VALUESLESS THAN("2018-08-01");

ALTERTABLEdr_selllist_gd ADD PARTITION P_201808VALUESLESS THAN("2018-09-01");

ALTERTABLEdr_selllist_gd ADD PARTITION P_201809VALUESLESS THAN("2018-10-01");

ALTERTABLEdr_selllist_gd ADD PARTITION P_201810VALUESLESS THAN("2018-11-01");

ALTERTABLEdr_selllist_gd ADD PARTITION P_201811VALUESLESS THAN("2018-12-01");

ALTERTABLEdr_selllist_gd ADD PARTITION P_201812VALUESLESS THAN("2019-01-01");

多列分区

Doris 支持指定多列作为分区列，示例如下：

PARTITION BY RANGE(`date`, `id`)

(

PARTITION `p201701_1000` VALUES LESS THAN ("2017-02-01", "1000"),

PARTITION `p201702_2000` VALUES LESS THAN ("2017-03-01", "2000"),

PARTITION `p201703_all` VALUES LESS THAN ("2017-04-01")

)

在以上示例中，我们指定 date(DATE 类型) 和 id(INT 类型) 作为分区列。以上示例最终得到的分区如下：

* p201701_1000: [(MIN_VALUE, MIN_VALUE), ("2017-02-01", "1000") )

* p201702_2000: [("2017-02-01", "1000"), ("2017-03-01", "2000") )

* p201703_all: [("2017-03-01", "2000"), ("2017-04-01", MIN_VALUE))

注意，最后一个分区用户缺省只指定了 date 列的分区值，所以 id 列的分区值会

默认填充 MIN_VALUE。当用户插入数据时，分区列值会按照顺序依次比较，最终得到对应的分区。举例如下：

* 数据 --> 分区

* 2017-01-01, 200 --> p201701_1000

* 2017-01-01, 2000 --> p201701_1000

* 2017-02-01, 100 --> p201701_1000

* 2017-02-01, 2000 --> p201702_2000

* 2017-02-15, 5000 --> p201702_2000

* 2017-03-01, 2000 --> p201703_all

* 2017-03-10, 1 --> p201703_all

* 2017-04-01, 1000 --> 无法导入

* 2017-05-01, 1000 --> 无法导入

#PROPERTIES

在建表语句的最后 PROPERTIES 中，可以指定以下两个参数：

replication_num

每个 Tablet 的副本数量。默认为3，建议保持默认即可。在建表语句中，所有 Partition 中的 Tablet 副本数量统一指定。而在增加新分区时，可以单独指定新分区中 Tablet 的副本数量。

副本数量可以在运行时修改。强烈建议保持奇数。

最大副本数量取决于集群中独立 IP 的数量（注意不是 BE 数量）。Doris 中副本分布的原则是，不允许同一个 Tablet 的副本分布在同一台物理机上，而识别物理机即通过 IP。所以，即使在同一台物理机上部署了 3 个或更多 BE 实例，如果这些 BE 的 IP 相同，则依然只能设置副本数为 1。

对于一些小，并且更新不频繁的维度表，可以考虑设置更多的副本数。这样在 Join 查询时，可以有更大的概率进行本地数据 Join。

storage_medium & storage_cooldown_time

BE 的数据存储目录可以显式的指定为 SSD 或者 HDD（通过 .SSD 或者 .HDD 后缀区分）。建表时，可以统一指定所有 Partition 初始存储的介质。注意，后缀作用是显式指定磁盘介质，而不会检查是否与实际介质类型相符。

默认初始存储介质可通过fe的配置文件 fe.conf 中指定 default_storage_medium=xxx，如果没有指定，则默认为 HDD。如果指定为 SSD，则数据初始存放在 SSD 上。

如果没有指定 storage_cooldown_time，则默认 30 天后，数据会从 SSD 自动迁移到 HDD 上。如果指定了 storage_cooldown_time，则在到达 storage_cooldown_time 时间后，数据才会迁移。

注意，当指定 storage_medium 时，如果FE参数 enable_strict_storage_medium_check 为 True 该参数只是一个“尽力而为”的设置。即使集群内没有设置 SSD 存储介质，也不会报错，而是自动存储在可用的数据目录中。同样，如果 SSD 介质不可访问、空间不足，都可能导致数据初始直接存储在其他可用介质上。而数据到期迁移到 HDD 时，如果 HDD 介质不可访问、空间不足，也可能迁移失败（但是会不断尝试）。如果FE参数 enable_strict_storage_medium_check 为 False 则当集群内没有设置 SSD 存储介质时，会报错 Failed to find enough host in all backends with storage medium is SSD。

使用手册

ROLLUP使用

Rollup只能在Aggregate，Uniq模型上使用，不能再Duplicate使用

创建删除语法

rollup 支持如下几种创建方式：

1. 创建 rollup index

语法：

ADD ROLLUP rollup_name (column_name1, column_name2, ...)

[FROM from_index_name]

[PROPERTIES ("key"="value", ...)]

properties: 支持设置超时时间，默认超时时间为1天。

例子：

ADD ROLLUP r1(col1,col2) from r0

1.2 批量创建 rollup index

语法：

ADD ROLLUP [rollup_name (column_name1, column_name2, ...)

[FROM from_index_name]

[PROPERTIES ("key"="value", ...)],...]

例子：

ADD ROLLUP r1(col1,col2) from r0, r2(col3,col4) from r0

1.3 注意：

1) 如果没有指定 from_index_name，则默认从 base index 创建

2) rollup 表中的列必须是 from_index 中已有的列

3) 在 properties 中，可以指定存储格式。具体请参阅 CREATE TABLE

2. 删除 rollup index

语法：

DROP ROLLUP rollup_name [PROPERTIES ("key"="value", ...)]

例子：

DROP ROLLUP r1

2.1 批量删除 rollup index

语法：DROP ROLLUP [rollup_name [PROPERTIES ("key"="value", ...)],...]

例子：DROP ROLLUP r1,r2

2.2 注意：

1) 不能删除 base index

示例

首先我们先创建Base 表

CREATETABLEIFNOTEXISTS expamle_tbl

(

`user_id` LARGEINTNOTNULL,

`date`DATENOTNULL,

`city`VARCHAR(20),

`age` SMALLINT,

`sex`TINYINT,

`last_visit_date`DATETIMEREPLACE DEFAULT"2020-08-12 00:00:00",

`cost`BIGINTSUM DEFAULT"0",

`max_dwell_time`INTMAX DEFAULT"0",

`min_dwell_time`INTMIN DEFAULT"99999"

)

AGGREGATE KEY(`user_id`, `date`, `city`, `age`, `sex`)

PARTITIONBYRANGE(`date`) (

PARTITION P_202008VALUES[("2020-08-01"),("2020-09-01"))

)

DISTRIBUTEDBYHASH(`city`) BUCKETS2

PROPERTIES(

"replication_num"="2"

);

然后在Base表上创建Rollup

ALTERTABLEexpamle_tbl

ADD ROLLUP example_rollup_index(user_id,date, cost)

PROPERTIES("storage_type"="column");

ALTERTABLEexpamle_tbl

ADD ROLLUP cost_rollup_index(user_id, cost)

PROPERTIES("storage_type"="column");

ALTERTABLEexpamle_tbl

ADD ROLLUP dwell_rollup_index(user_id,date, max_dwell_time,min_dwell_time)

PROPERTIES("storage_type"="column");

在mysql命令下可以看到我们创建的rollup

然后倒入数据就可以进行查询了，示例数据如下：

10000,2020-08-01,北京,20,0,2020-08-01 06:00:00,20,10,10

10000,2020-08-01,北京,20,0,2020-08-01 07:00:00,15,2,2

10001,2020-08-01,北京,30,1,2020-08-01 17:05:45,2,22,22

10002,2020-08-02,上海,20,1,2020-08-02 12:59:12,200,5,5

10003,2020-08-02,广州,32,0,2020-08-02 11:20:00,30,11,11

10004,2020-08-01,深圳,35,0,2020-08-01 10:00:15,100,3,3

10004,2020-08-03,深圳,35,0,2020-08-03 10:20:22,11,6,6

10000,2020-08-04,北京,20,0,2020-08-04 06:00:00,20,10,10

10000,2020-08-04,北京,20,0,2020-08-04 07:00:00,15,2,2

10001,2020-08-04,北京,30,1,2020-08-04 17:05:45,2,22,22

10002,2020-08-04,上海,20,1,2020-08-04 12:59:12,200,5,5

10003,2020-08-04,广州,32,0,2020-08-04 11:20:00,30,11,11

10004,2020-08-04,深圳,35,0,2020-08-04 10:00:15,100,3,3

10004,2020-08-04,深圳,35,0,2020-08-04 10:20:22,11,6,6

10000,2020-08-05,北京,20,0,2020-08-05 06:00:00,20,10,10

10000,2020-08-05,北京,20,0,2020-08-05 07:00:00,15,2,2

10001,2020-08-05,北京,30,1,2020-08-05 17:05:45,2,22,22

10002,2020-08-05,上海,20,1,2020-08-05 12:59:12,200,5,5

10003,2020-08-05,广州,32,0,2020-08-05 11:20:00,30,11,11

10004,2020-08-05,深圳,35,0,2020-08-05 10:00:15,100,3,3

10004,2020-08-05,深圳,35,0,2020-08-05 10:20:22,11,6,6

使用Segment V2 存储格式

V2版本支持一下新特性：

bitmap 索引

内存表

page cache

字典压缩

延迟物化（Lazy Materialization）

版本支持

从0.12版本开始支持V2数据格式

使用下面这个版本编译：

启用方法

default_rowset_type：FE 一个全局变量（Global Variable）设置，默认为 "alpha"，即 V1 版本。

default_rowset_type：BE 的一个配置项，默认为 "ALPHA"，即 V1 版本。

从 BE 开启全量格式转换

在 be.conf 中添加变量 default_rowset_type=BETA 并重启 BE 节点。在之后的 compaction 流程中，数据会自动从 V1 转换成 V2。

从 FE 开启全量格式转换

通过 mysql 客户端连接 Doris 后，执行如下语句：

SET GLOBAL default_rowset_type = beta;

执行完成后，FE 会通过心跳将信息发送给 BE，之后 BE 的 compaction 流程中，数据会自动从 V1 转换成 V2。

数据模型、ROLLUP 及前缀索引

在 Doris 中，数据以表（Table）的形式进行逻辑上的描述。一张表包括行（Row）和列（Column）。Row 即用户的一行数据。Column 用于描述一行数据中不同的字段。

Column 可以分为两大类：Key 和 Value。从业务角度看，Key 和 Value 可以分别对应维度列和指标列。

Doris 的数据模型主要分为3类:

Aggregate

Uniq

Duplicate

Aggregate 模型

当我们导入数据时，对于 Key 列相同的行和聚合成一行，而 Value 列会按照设置的 AggregationType 进行聚合。 AggregationType 目前有以下四种聚合方式：

SUM：求和，多行的 Value 进行累加。

REPLACE：替代，下一批数据中的 Value 会替换之前导入过的行中的 Value。

MAX：保留最大值。

MIN：保留最小值。

示例：

CREATETABLEIFNOTEXISTS example_db.expamle_tbl

(

`user_id` LARGEINTNOTNULLCOMMENT"用户id",

`date`DATENOTNULLCOMMENT"数据灌入日期时间",

`city`VARCHAR(20) COMMENT"用户所在城市",

`age` SMALLINT COMMENT"用户年龄",

`sex`TINYINTCOMMENT"用户性别",

`last_visit_date`DATETIMEREPLACE DEFAULT"1970-01-01 00:00:00"COMMENT"用户最后一次访问时间",

`cost`BIGINTSUM DEFAULT"0"COMMENT"用户总消费",

`max_dwell_time`INTMAX DEFAULT"0"COMMENT"用户最大停留时间",

`min_dwell_time`INTMIN DEFAULT"99999"COMMENT"用户最小停留时间",

)

AGGREGATE KEY(`user_id`, `date`, `timestamp`, `city`, `age`, `sex`)

.../* 省略 Partition 和 Distribution 信息 */

表中的列按照是否设置了 AggregationType，分为 Key (维度列) 和 Value（指标列）。

没有设置 AggregationType 的，如 user_id、date、age ... 等称为 Key，而设置了 AggregationType 的称为 Value。

数据的聚合，在 Doris 中有如下三个阶段发生：

每一批次数据导入的 ETL 阶段。该阶段会在每一批次导入的数据内部进行聚合。

底层 BE 进行数据 Compaction 的阶段。该阶段，BE 会对已导入的不同批次的数据进行进一步的聚合。

数据查询阶段。在数据查询时，对于查询涉及到的数据，会进行对应的聚合。

数据在不同时间，可能聚合的程度不一致。比如一批数据刚导入时，可能还未与之前已存在的数据进行聚合。但是对于用户而言，用户只能查询到聚合后的数据。即不同的聚合程度对于用户查询而言是透明的。用户需始终认为数据以最终的完成的聚合程度存在，而不应假设某些聚合还未发生。（可参阅聚合模型的局限性一节获得更多详情。

Uniq 模型

在某些多维分析场景下，用户更关注的是如何保证 Key 的唯一性，即如何获得 Primary Key 唯一性约束。因此，引入了 Uniq 的数据模型。该模型本质上是聚合模型的一个特例，也是一种简化的表结构表示方式

Duplicate 模型

在某些多维分析场景下，数据既没有主键，也没有聚合需求。因此，我们引入 Duplicate 数据模型来满足这类需求

这种数据模型区别于 Aggregate 和 Uniq 模型。数据完全按照导入文件中的数据进行存储，不会有任何聚合。即使两行数据完全相同，也都会保留。而在建表语句中指定的 DUPLICATE KEY，只是用来指明底层数据按照那些列进行排序。（更贴切的名称应该为 “Sorted Column”，这里取名 “DUPLICATE KEY” 只是用以明确表示所用的数据模型。）。在 DUPLICATE KEY 的选择上，我们建议适当的选择前 2-4 列就可以

Doris优化

##设置执行内存

set global exec_mem_limit=2147483648;

##设置查询缓存

set global query_cache_type=1;

set global query_cache_size=134217728;

##设置查询超时时间60秒，默认300秒

set global query_timeout = 60;

###记录sql执行日志

set global is_report_success=true;

##启用V2数据存储格式

SET GLOBAL default_rowset_type = beta;

##设置时区

SET global time_zone = 'Asia/Shanghai'

##启用fe动态分区

ADMIN SET FRONTEND CONFIG ("dynamic_partition_enable" = "true")

数据导入

Kafka数据导入

支持无认证的 Kafka 访问，以及通过 SSL 方式认证的 Kafka 集群。

支持的消息格式为 csv 文本格式。每一个 message 为一行，且行尾不包含换行符。

仅支持 Kafka 0.10.0.0(含) 以上版本

示例

CREATEROUTINE LOAD retail1.kafka123ondr_selllist_gd_kafka

PROPERTIES

(

"desired_concurrent_number"="1"

)

FROMKAFKA

(

"kafka_broker_list"="192.168.9.22:6667,192.168.9.23:6667",

"kafka_topic"="selllist"

);

Insert Into

Insert Into 语句的使用方式和 MySQL 等数据库中 Insert Into 语句的使用方式类似。但在 Doris 中，所有的数据写入都是一个独立的导入作业。所以这里将 Insert Into 也作为一种导入方式介绍。

主要的 Insert Into 命令包含以下两种；

INSERT INTO tbl SELECT ...

INSERT INTO tbl (col1, col2, ...) VALUES (1, 2, ...), (1,3, ...);

其中第二种命令仅用于 Demo，不要使用在测试或生产环境中

导入语法：

INSERTINTOtable_name [WITH LABEL label] [partition_info] [col_list] [query_stmt] [VALUES];

示例：

INSERTINTOtbl2 WITH LABEL label1SELECT*FROMtbl3;

INSERTINTOtbl1VALUES("qweasdzxcqweasdzxc"), ("a");

注意

当需要使用 CTE(Common Table Expressions) 作为 insert 操作中的查询部分时，必须指定 WITH LABEL 和 column list 部分。示例

INSERTINTOtbl1 WITH LABEL label1

WITH cte1AS(SELECT*FROMtbl1), cte2AS(SELECT*FROMtbl2)

SELECTk1FROMcte1JOINcte2WHEREcte1.k1=1;

INSERTINTOtbl1 (k1)

WITH cte1AS(SELECT*FROMtbl1), cte2AS(SELECT*FROMtbl2)

SELECTk1FROMcte1JOINcte2WHEREcte1.k1=1;

partition_info

导入表的目标分区，如果指定目标分区，则只会导入符合目标分区的数据。如果没有指定，则默认值为这张表的所有分区。

col_list

导入表的目标列，可以以任意的顺序存在。如果没有指定目标列，那么默认值是这张表的所有列。如果待表中的某个列没有存在目标列中，那么这个列需要有默认值，否则 Insert Into 就会执行失败。

如果查询语句的结果列类型与目标列的类型不一致，那么会调用隐式类型转化，如果不能够进行转化，那么 Insert Into 语句会报语法解析错误。

query_stmt

通过一个查询语句，将查询语句的结果导入到 Doris 系统中的其他表。查询语句支持任意 Doris 支持的 SQL 查询语法。

VALUES

用户可以通过 VALUES 语法插入一条或者多条数据。

注意：VALUES 方式仅适用于导入几条数据作为导入 DEMO 的情况，完全不适用于任何测试和生产环境。Doris 系统本身也不适合单条数据导入的场景。建议使用 INSERT INTO SELECT 的方式进行批量导入。

WITH LABEL

INSERT 操作作为一个导入任务，也可以指定一个 label。如果不指定，则系统会自动指定一个 UUID 作为 label。

注意：建议指定 Label 而不是由系统自动分配。如果由系统自动分配，但在 Insert Into 语句执行过程中，因网络错误导致连接断开等，则无法得知 Insert Into 是否成功。而如果指定 Label，则可以再次通过 Label 查看任务结果

导入结果

Insert Into 本身就是一个 SQL 命令，其返回结果会根据执行结果的不同，分为以下几种：

结果集为空

如果 insert 对应 select 语句的结果集为空，则返回如下：

mysql> insert into tbl1 select * from empty_tbl;

Query OK, 0 rows affected (0.02 sec)

Query OK 表示执行成功。0 rows affected 表示没有数据被导入。

结果集不为空

在结果集不为空的情况下。返回结果分为如下几种情况：

Insert 执行成功并可见：

mysql> insert into tbl1 select * from tbl2;

Query OK, 4 rows affected (0.38 sec)

{'label':'insert_8510c568-9eda-4173-9e36-6adc7d35291c', 'status':'visible', 'txnId':'4005'}

mysql> insert into tbl1 with label my_label1 select * from tbl2;

Query OK, 4 rows affected (0.38 sec)

{'label':'my_label1', 'status':'visible', 'txnId':'4005'}

mysql> insert into tbl1 select * from tbl2;

Query OK, 2 rows affected, 2 warnings (0.31 sec)

{'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'visible', 'txnId':'4005'}

mysql> insert into tbl1 select * from tbl2;

Query OK, 2 rows affected, 2 warnings (0.31 sec)

{'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'committed', 'txnId':'4005'}

Query OK 表示执行成功。4 rows affected 表示总共有4行数据被导入。2 warnings 表示被过滤的行数。

同时会返回一个 json 串：

{'label':'my_label1', 'status':'visible', 'txnId':'4005'}

{'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'committed', 'txnId':'4005'}

{'label':'my_label1', 'status':'visible', 'txnId':'4005', 'err':'some other error'}

label 为用户指定的 label 或自动生成的 label。Label 是该 Insert Into 导入作业的标识。每个导入作业，都有一个在单 database 内部唯一的 Label。

status 表示导入数据是否可见。如果可见，显示 visible，如果不可见，显示 committed。

txnId 为这个 insert 对应的导入事务的 id。

err 字段会显示一些其他非预期错误。

当需要查看被过滤的行时，用户可以通过如下语句

show load where label="xxx";

返回结果中的 URL 可以用于查询错误的数据，具体见后面 查看错误行 小结。

数据不可见是一个临时状态，这批数据最终是一定可见的

可以通过如下语句查看这批数据的可见状态：

show transaction where id=4005;

返回结果中的 TransactionStatus 列如果为 visible，则表述数据可见

Apache DORIS安装使用测试报告

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Apache DORIS安装使用测试报告

热门文章

最新文章

相关课程

相关电子书

推荐镜像