【发布时间】:2017-03-31 20:01:20
【问题描述】:
如果我有一个列名列表,并且如果这些列的值大于零,我想对行进行过滤,我可以做类似的事情吗?
columns = ['colA','colB','colC','colD','colE','colF']
new_df = df.filter(any([df[c]>0 for c in columns]))
这会返回:
ValueError: Cannot convert column to bool: please use '&' for 'and', '|' for 'or', '~' for 'not' 构建 DataFrame 布尔值 表达式
我想我可以将这些列和过滤器仅在一列上求和(因为我没有负数。但如果我有求和技巧就行不通了。无论如何,如果我必须过滤这些列与总和不同的另一个条件,我怎么能做我想做的事? 有什么想法吗?
【问题讨论】:
标签: python apache-spark pyspark apache-spark-sql pyspark-sql