【发布时间】:2017-12-20 07:22:59
【问题描述】:
我正在尝试使用 mongo-spark-connector 2.2.0 和 _id 字段上的过滤器从 MongoDB 读取数据集。
例如:
MongoSpark.loadAndInferSchema(session,ReadConfig.create(session)).filter(col("_id").getItem("oid").equalTo("590755cd7b868345d6da1f40"));
这个查询在一个大集合上需要很长时间。看起来这个查询没有使用我在集合上的默认 _id 索引,因为过滤器使用字符串而不是 objectId。如何让它使用索引?
【问题讨论】:
标签: mongodb apache-spark apache-spark-dataset