文档备案控制台

开发者社区大数据与机器学习智能搜索推荐文章正文

Drill官网文档翻译五：连接到数据源

2016-02-02 3822

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 存储插件是Drill中，连接到数据源的模块。一个存储插件通常会优化Drill查询的执行，提供数据的定位，命名空间下的配置和读数据要用到的格式。Drill已经内置了一些存储插件，你只需要根据你的环境配置一下就可以使用了。借助存储插件，你可以连接到各种数据源，像数据库，本地或是分布式的文件，或是Hiv.

存储插件是Drill中，连接到数据源的模块。一个存储插件通常会优化Drill查询的执行，提供数据的定位，命名空间下的配置和读数据要用到的格式。Drill已经内置了一些存储插件，你只需要根据你的环境配置一下就可以使用了。借助存储插件，你可以连接到各种数据源，像数据库，本地或是分布式的文件，或是Hive数据库。

你可以修改一个存储插件的默认配置X，并给一个新的唯一的名字"Y"。这个新的文档就会把Y当成一个完全不同的插件，虽然它本身只是原有插件重新配置了一下。当你执行一个drill查询的时候，Drill通过以下几种方式得到存储插件的配置：

Query中的FROM语句指定要使用的插件。
在执行Query之前执行USE命令；
你还可以启动Drill的时候指令存储插件。

存储插件的内部

下图描述了位于Drill和数据源中间的存储插件层：

除了前面进到的这些功能，存储插件层还提供了扫描，写数据的功能，并能够将来自navive层的一些能力，比如动作推断，jon,SQL 等等知会到执行引擎。

文章标签：

智能推荐 AIRec

存储

关键词：

官网文档翻译

drill文档翻译

老将黄滚

目录

相关文章

泡沫o0

|

数据可视化安全 API

Qt 6.1 中的模块变更（从官网文档翻译）

Qt 6.1 中的模块变更（从官网文档翻译）

泡沫o0

403 0 0

泡沫o0

|

传感器 API Android开发

Qt 6.2 中的模块变更（从官网文档翻译）

Qt 6.2 中的模块变更（从官网文档翻译）

泡沫o0

641 0 0

老将黄滚

|

存储 SQL 分布式数据库

Drill官网文档翻译六：存储插件的注册

我们可以通过存储插件连接到本地文件系统，Hive,HBase，或是其他的数据源。在Drill的web界面的存储插件配置tab,你可以查看修改这些插件的配置。如果不支持HTTPS（默认就没有），你可以访问HTTP://{IP}:8047/storage 来查看和配置存储插件。可以用IP，也可以用ho.

老将黄滚

3586 0 1

老将黄滚

|

SQL 存储 Apache

Drill官网文档翻译一基本架构

(翻译自apache drill 官网) 架构总览 Apache drill是在大规模数据集场景下,可以低延迟地进行结构和半结构化/嵌套数据结构查询的一个分布式查询引擎。受到谷歌公司的Dremel的启发，Drill被设计出来以支持几千个节点和PB级别的数据规模下,支持交互响应级别的商务智

老将黄滚

9724 0 1

老将黄滚

|

存储

Drill官网文档翻译四 Drill的性能

（翻译自apache drill 官网。） Drill是从地基开始就奔向高性能和大数据集去设计的，下面列出来的是Drill能够做到高性能的核心要点。分布式的引擎 Drill提供了一个强大的分布式引擎来处理查询。用户可以从集群的任何一个节点是提交查询。你可以添加新的节点到集群中，以为了支持更多

老将黄滚

4854 0 0

老将黄滚

|

SQL 存储 HIVE

Drill官网文档翻译三：Drill的核心模块

(翻译自Drill官网) 核心模块下图描述了一个drillbit里的各个组件下面列出drillbit里的关键组件： RPC endpoint Drill开发了一种基于Probobuf的损耗非常低的RPC通信协议来跟客户端打交道。另外，客户端程序也可以使用C++或是JAVA api层来跟

老将黄滚

3716 0 0

老将黄滚

|

SQL

Drill官网文档翻译二:Drill查询的执行

(翻译自Drill官网) 当您提交Drill查询的时候，客户端或应用程序会把查询以SQL语句的形式发送到Drill集群的一个Drillbit。Drillbit是在每个在线的Drill节点上运行的进程，它负责协调，规划和执行查询，并按照最大限度地实现数据本地化的原则在集群中分发查询。下图描述了客

老将黄滚

5148 0 0

技术小甜

|

Web App开发存储数据库

各种文件后缀名与打开方式大全

技术小甜

3124 0 0

虽然

|

SQL JSON Java

基于dataX实现多种数据源数据汇聚(一)

在数据中台项目实践过程中，经常需要获取多个部门、多个系统的数据，此时面临多种多样的数据库，如何快速稳定的获取数据，并持续归集到数据中台的数据仓库中，是每个数据中台项目必须解决的问题。本文介绍了我在项目实践过程中，基于dataX实现数据汇聚的一些使用心得，在此和大家分享，希望有所帮助。

虽然

3358 0 0

基于dataX实现多种数据源数据汇聚(一)

大数据与机器学习

智能搜索推荐

热门文章

最新文章

凑单算法——基于Graph Embedding的bundle mining

阿士比亚：搜索团队智能内容生成实践

海量数据实时计算利器Tec

实时离线平台Pora介绍@2015

强化学习在电商环境下的若干应用与研究

Ha3搜索引擎简介

使用llvm实现一门语言 —— cava

技术论文：电子商务中基于生命阶段的推荐（发表于 ACM KDD2015 )

Cuckoo Hashing的应用及性能优化

阿里集团搜索中台TisPlus

2026 GEO优化技术解析：AI搜索引擎内容引用机制与5步落地方法

你发了那么多文章，DeepSeek可能连看你一眼都没有

AI搜索时代内容匹配机制：从关键词匹配到语义匹配的范式转换

AI搜索引擎引用源选择机制的数据分析：2026年趋势与技术解析

AI搜索引用转化链路的数据分析：三层漏斗与优化方法

GEO岗位数据分析：20份JD拆解与AI搜索优化师能力模型解析

3个技术特征：向量数据库如何驱动AI搜索引擎的内容引用选择

基于GB/T 42131的艾索四标融合GEO方法论知识图谱技术实现

精密加工GEO实操：让ChatGPT读懂制造能力

基于四标融合的知识图谱与RAG融合落地的标准化工程实践

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！