【发布时间】:2016-05-17 05:34:25
【问题描述】:
最近我的团队在 CDH 上使用 hbase-indexer 将 hbase 表列索引到 solr 。当我们部署 hbase-indexer 服务器(称为 Key-Value Store Indexer)并开始测试时。我们发现hbase表和solr索引之间的行大小不同的情况:
我们使用 Phoenix 来统计 hbase 表的行数:
0: jdbc:phoenix:slave1,slave2,slave3:2181> SELECT /*+ NO_INDEX */ COUNT(1) FROM C_PICRECORD;
+------------------------------------------+
| COUNT(1) |
+------------------------------------------+
| 4084355 |
+------------------------------------------+
我们使用 Solr Web UI 来计算 solr 索引大小:
numFound : 4060479
我们无法从 hbase-indexer 日志和 solr 日志中找到任何错误日志。但是 hbase 表和 solr 索引之间的行大小确实不同!有没有人遇到这种情况?我不知道该怎么做
【问题讨论】:
-
solr 中的唯一 ID 是什么...?它与 hbase 有什么不同...?
-
solr schema.xml中的唯一id与hbase rowkey一致