【发布时间】:2020-03-13 14:53:35
【问题描述】:
【问题讨论】:
-
您对 spark 数据框或 pandas 数据框有疑问吗?
-
这是 spark 数据框。
-
spark.apache.org/docs/latest/api/python/…,您可以使用how=any,并将所有列子集,除了供应商ID,因为它有\r。
-
对,我还有一个替代解决方案来摆脱整行,
ddf = ddf.where(ddf['VendorId']!='\r') -
@palash 如果您确定要删除的唯一行将“\r”作为供应商 ID,则它是有效的。通用解决方案将 dropna 与 how=all 和 subset=all 列一起使用,除了 vendorid
标签: pyspark pyspark-dataframes