文档备案控制台

开发者社区数据库文章正文

好程序员大数据培训分享HBase Filter过滤器概述

2020-06-03 992

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

　　好程序员大数据培训分享HBase Filter过滤器概述，过滤器介绍
HBase过滤器是一套为完成一些较高级的需求所提供的API接口。
过滤器也被称为下推判断器（push-down predicates），支持把数据过滤标准从客户端下推到服务器，带有 Filter 条件的 RPC 查询请求会把 Filter 分发到各个 RegionServer，所有的过滤器都在服务端生效，使被过滤掉的数据不会被传送到客户端，这些过滤逻辑在读操作时使用，可以有效降低网络传输的压力。
过滤器组成
过滤器主要有过滤器本身、比较器和比较运算符组成。

操作符
抽象操作符，也叫比较运算符。

LESS：小于
LESS_OR_EQUAL：小于等于
EQUAL：等于
NOT_EQUAL：不等于
GREATER：大于
GREATER_OR_EQUAL：大于等于
NO_OP：排除一切值

比较器
BinaryComparator：二进制比较器，用于按字典顺序比较指定字节数组。

BinaryPrefixComparator：二进制比较器，只比较前缀是否与指定字节数组相同。
NullComparator：控制比较式，判断当前值是不是为null。
BitComparator：位比价器，通过BitwiseOp提供的AND（与）、OR（或）、NOT（非）进行比较。
RegexStringComparator：提供一个正则的比较器，支持正则表达式的值比较，仅支持 EQUAL 和非 EQUAL。
SubstringComparator：判断提供的子串是否出现在value中，并且不区分大小写。
过滤器家族
HBase 内置了多种过滤器，这些过滤器或直接或间接都继承于FilterBase抽象类。

文章标签：

云数据库 HBase 版

云原生大数据计算服务 MaxCompute

Hbase

程序员

API

大数据

分布式数据库

关键词：

云原生大数据计算服务 MaxCompute概述

云数据库 HBase 版filter

云原生大数据计算服务 MaxCompute hbase

大数据云数据库 HBase 版

云原生大数据计算服务 MaxCompute filter

好程序员

目录

相关文章

武子康

|

分布式计算资源调度 Hadoop

大数据-80 Spark 简要概述系统架构部署模式与Hadoop MapReduce对比

大数据-80 Spark 简要概述系统架构部署模式与Hadoop MapReduce对比

武子康

556 2 2

土木林森

|

Java 大数据分布式数据库

Spring Boot 与 HBase 的完美融合：探索高效大数据应用开发的新途径

【8月更文挑战第29天】Spring Boot是一款广受好评的微服务框架，以其便捷的开发体验著称。HBase则是一个高性能的大数据分布式数据库系统。结合两者，可极大简化HBase应用开发。本文将对比传统方式与Spring Boot集成HBase的区别，展示如何在Spring Boot中优雅实现HBase功能，并提供示例代码。从依赖管理、连接配置、表操作到数据访问，Spring Boot均能显著减少工作量，提升代码可读性和可维护性，使开发者更专注业务逻辑。

土木林森

1091 1 1

武子康

|

存储分布式计算 API

大数据-107 Flink 基本概述适用场景框架特点核心组成生态发展处理模型组件架构

大数据-107 Flink 基本概述适用场景框架特点核心组成生态发展处理模型组件架构

武子康

1039 0 0

喜欢猪猪

|

存储分布式计算分布式数据库

深入理解Apache HBase：构建大数据时代的基石

在大数据时代，数据的存储和管理成为了企业面临的一大挑战。随着数据量的急剧增长和数据结构的多样化，传统的关系型数据库（如RDBMS）逐渐显现出局限性。

喜欢猪猪

2020 12 12

武子康

|

分布式计算 Hadoop Shell

Hadoop-36 HBase 3节点云服务器集群 HBase Shell 增删改查全程多图详细列族 row key value filter

Hadoop-36 HBase 3节点云服务器集群 HBase Shell 增删改查全程多图详细列族 row key value filter

武子康

349 3 3

武子康

|

存储消息中间件大数据

大数据-68 Kafka 高级特性物理存储日志存储概述

大数据-68 Kafka 高级特性物理存储日志存储概述

武子康

222 1 1

1941623231718325

|

存储 SQL 分布式计算

Hadoop生态系统概述：构建大数据处理与分析的基石

【8月更文挑战第25天】Hadoop生态系统为大数据处理和分析提供了强大的基础设施和工具集。通过不断扩展和优化其组件和功能，Hadoop将继续在大数据时代发挥重要作用。

1941623231718325

1060 3 3

土木林森

|

分布式计算大数据分布式数据库

"揭秘HBase MapReduce高效数据处理秘诀：四步实战攻略，让你轻松玩转大数据分析！"

【8月更文挑战第17天】大数据时代，HBase以高性能、可扩展性成为关键的数据存储解决方案。结合MapReduce分布式计算框架，能高效处理HBase中的大规模数据。本文通过实例展示如何配置HBase集群、编写Map和Reduce函数，以及运行MapReduce作业来计算HBase某列的平均值。此过程不仅限于简单的统计分析，还可扩展至更复杂的数据处理任务，为企业提供强有力的大数据技术支持。

土木林森

499 1 1

武子康

|

存储分布式计算 NoSQL

大数据-144 Apache Kudu 基本概述数据模型使用场景

大数据-144 Apache Kudu 基本概述数据模型使用场景

武子康

316 0 0

武子康

|

SQL 存储 OLAP

大数据-133 - ClickHouse 基础概述全面了解

大数据-133 - ClickHouse 基础概述全面了解

武子康

570 0 0

热门文章

最新文章

阿里云大数据利器之-RDS迁移到Maxcompute实现动态分区

MaxCompute问答整理之9月

AI加持的阿里云飞天大数据平台技术揭秘

2016大数据创新大赛——机场客流量的时空分布预测模型解析

阿里云TSDB在大数据集群监控中的方案与实战

如何使用Tunnel SDK上传/下载MaxCompute复杂类型数据

elasticsearch|大数据|kibana的安装（https+密码）

案例酷 | 九阳股份：小家电，大数据，精准营销圈粉新生代

大数据技术之Clickhouse---入门篇---数据类型、表引擎

北京城市学院-阿里大数据学院

【赵渝强老师】HBase的物理存储结构

【赵渝强老师】HBase的逻辑存储结构

Ubuntu22.04下搭建Hadoop3.3.6+Hbase2.5.6+Phoenix5.1.3开发环境的指南

【赵渝强老师】HBase的体系架构

分布式存储数据恢复—hbase和hive数据库数据恢复案例

在 HBase 集群中，Prometheus 通常监控哪些类型的性能指标？

如何使用 HBase Shell 进行数据的实时监控和备份？

如何使用 HBase Shell 进行数据的批量导入和导出？

【赵渝强老师】HBase的体系架构

【赵渝强老师】HBase的表结构

相关课程

更多

大数据Impala教程

大数据Spark2020最新课程（知识精讲与实战演练）第二阶段

大数据Spark2020版（知识精讲与实战演练）第三阶段

大数据Spark2020版（知识精讲与实战演练）第四阶段

2020版大数据实战项目之DMP广告系统（第二阶段）

2020版大数据实战项目之DMP广告系统（第七阶段）

相关电子书

更多

MaxCompute Serverless 架构演进

Data+AI时代大数据平台应该如何建设

大数据AI一体化的解读

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！