1.简述
2.区别
a).数据源支持
使用最新版本Dremio 3.3.1和Drill 1.16.0
Dremio3.1.3版本开始不支持HBase,将来会开源社区版HBase连接器
b).自定义功能扩展
- Dremio无自定义功能开发API
- Drill有自定义功能开发API: 开发SQL自定义聚合函数,但该功能处于实验阶段
3.性能对比
a).Dremio聚合查询性能
- 明细数据79457153条,聚合结果510002条
- 原始数据聚合查询3分41秒,使用数据反射聚合查询小于1s
- CPU消耗:原始数据聚合时间长使用低,数据反射聚合时间短使用高
图1 Dremio聚合查询数据量及耗时
图2 Dremio聚合查询CPU使用
b).Drill聚合查询性能
- 明细数据39634975条,聚合结果500000条
- 原始数据聚合查询3分6秒
图3 Drill聚合查询
4.Dremio未开源部分
Dremio主要未开源部分如下:
a).数据安全
- 用户、组和角色的管理
- 数据源的共享
- 虚拟数据源之上的行、列级权限控制
- 个人访问令牌(PAT)
b).Wire Encryption(线加密)
- 全线加密
- ODBC / JDBC客户端加密
- 集群内加密
- 仅Web服务器加密(开源)
c).REST API
- 工作负载管理API
- 用户和令牌相关API
- 检索所有数据反射和根据摘要检索数据反射
- 仅根据Id检索数据反射、创建、修改和删除检索数据反射(开源)