【发布时间】:2020-01-27 07:56:37
【问题描述】:
我有一本这样的字典
dict = {
"ColA": "A",
"ColB": "B"
}
我想使用此字典删除数据框中的一行 df,前提是该行与字典中的每个值完全匹配。
所以使用输入数据框
+------+------+
| ColA | ColB |
+------+------+
| A | A |
| A | B |
| B | B |
+------+------+
输出将是
+------+------+
| ColA | ColB |
+------+------+
| A | A |
| B | B |
+------+------+
我尝试过类似的方法
for col in dict:
df = df.filter(df_to_upsert[col] != row[col])
但是,这只会过滤掉 row_dict 中具有任何匹配值的行,因此在这种情况下,数据框中的每一行都会被过滤掉。
【问题讨论】:
标签: python apache-spark filter pyspark