【发布时间】:2019-12-28 01:46:38
【问题描述】:
我有一个带有 ID 列表的数据框。我想将其过滤为一组 ID,我使用 .filter() 来完成。
我遇到了这个错误。
java.lang.RuntimeException: Unsupported literal type class scala.collection.immutable.HashSet$HashTrieSet
我的代码很简单。
val setofID = Set("112", "113", "114", "121", "118", "120")
val my_dfFiltered = my_df.filter($"id".isin(setofID)).persist
【问题讨论】:
-
查看此答案:stackoverflow.com/a/32560177/2639647。
.isin()接受一个可变参数列表,而不是一个可迭代的。.isin(setofID:_*)可能有用。
标签: scala apache-spark apache-spark-sql