【发布时间】:2017-08-01 15:33:58
【问题描述】:
我正在尝试使用带有 pyspark mongodb 连接器的聚合函数查询 MongoDB 集合,但我无法执行与 null 的匹配。
我已经在管道中尝试过这个:
{'$match' : {'deleted_at': null}}
{'$match' : {'deleted_at': 'null'}}
{'$match' : {'deleted_at': None}}
{'$match' : {'deleted_at': False}}
{'$match' : {'deleted_at': 0}}
但似乎没有任何效果。有什么想法吗?
【问题讨论】:
-
你用 Spark SQL 尝试过
df.filter($"deleted_at" === null)吗?
标签: mongodb apache-spark pyspark aggregation-framework