八十四、KeyValue元数据

KeyValue元数据

由于HBase在内部将数据存储为KeyValue对,因此KeyValue元数据过滤器(KeyValue Metadata Filters)会评估一行中是否存在键(即,ColumnFamily:列限定符),而不是前一节中的值。

FamilyFilter

FamilyFilter可用于过滤ColumnFamily。在扫描(Scan)中选择ColumnFamilies通常比在过滤器(Filter)中选择ColumnFamilies更好。

QualifierFilter

QualifierFilter可用于基于列(aka Qualifier)名称进行过滤。

ColumnPrefixFilter

ColumnPrefixFilter可用于基于列(又名限定符)名称的主要部分进行过滤。

ColumnPrefixFilter提前查找匹配每行前缀和每个涉及列族的第一列。它可以用来高效地获取非常宽的行中的一个列的子集。

注意:同一列限定符可用于不同的列族。此过滤器将返回所有匹配的列。

示例:查找以“abc”开头的行和家族中的所有列

Table t = ...;
byte[] row = ...;
byte[] family = ...;
byte[] prefix = Bytes.toBytes("abc");
Scan scan = new Scan(row, row); // (optional) limit to one row
scan.addFamily(family); // (optional) limit to one family
Filter f = new ColumnPrefixFilter(prefix);
scan.setFilter(f);
scan.setBatch(10); // set this if there could be many columns returned
ResultScanner rs = t.getScanner(scan);
for (Result r = rs.next(); r != null; r = rs.next()) {
  for (KeyValue kv : r.raw()) {
    // each kv represents a column
  }
rs.close();

MultipleColumnPrefixFilter

MultipleColumnPrefixFilter的行为类似于ColumnPrefixFilter,但允许指定多个前缀。

像ColumnPrefixFilter一样,MultipleColumnPrefixFilter可以高效地搜索与最低前缀匹配的第一列,并且在前缀之间查找过去的列范围。它可以用来从很宽的行中有效地获得不连续的列集。

示例:查找以“abc”或“xyz”开头的行和家族中的所有列

Table t = ...;
byte[] row = ...;
byte[] family = ...;
byte[][] prefixes = new byte[][] {Bytes.toBytes("abc"), Bytes.toBytes("xyz")};
Scan scan = new Scan(row, row); // (optional) limit to one row
scan.addFamily(family); // (optional) limit to one family
Filter f = new MultipleColumnPrefixFilter(prefixes);
scan.setFilter(f);
scan.setBatch(10); // set this if there could be many columns returned
ResultScanner rs = t.getScanner(scan);
for (Result r = rs.next(); r != null; r = rs.next()) {
  for (KeyValue kv : r.raw()) {
    // each kv represents a column
  }
rs.close();

ColumnRangeFilter

ColumnRangeFilter允许有效的帧内行扫描。

ColumnRangeFilter可以为每个涉及的列族寻找第一个匹配列。它可以用来有效地获得非常宽的行的“切片”。即,你连续有一百万列,但你只想看看列bbbb-bbdd。

注意:同一列限定符可用于不同的列族。此过滤器将返回所有匹配的列。

示例:查找“bbbb”(含)和“bbdd”(含)之间的行和族中的所有列

Table t = ...;
byte[] row = ...;
byte[] family = ...;
byte[] startColumn = Bytes.toBytes("bbbb");
byte[] endColumn = Bytes.toBytes("bbdd");
Scan scan = new Scan(row, row); // (optional) limit to one row
scan.addFamily(family); // (optional) limit to one family
Filter f = new ColumnRangeFilter(startColumn, true, endColumn, true);
scan.setFilter(f);
scan.setBatch(10); // set this if there could be many columns returned
ResultScanner rs = t.getScanner(scan);
for (Result r = rs.next(); r != null; r = rs.next()) {
  for (KeyValue kv : r.raw()) {
    // each kv represents a column
  }
rs.close();

文章永久链接:https://ddkk.com/?p=12542