【发布时间】:2020-12-25 10:47:14
【问题描述】:
我在一个数据框中有一个名为 null 的奇怪列,其中包含其他列中的一些缺失值。一列是名为location 的经纬度坐标,另一列是表示名为level 的目标变量的整数。在location 或level 缺少值的某些但不是所有情况下,应该存在的值在此null 列中。这是一个例子df:
pd.DataFrame(
{'null': {0: '43.70477575,-72.28844073', 1: '2', 2: '43.70637091,-72.28704334', 3: '4', 4: '3'},
'location': {0: nan, 1: nan, 2: nan, 3: nan, 4: nan},
'level': {0: nan, 1: nan, 2: nan, 3: nan, 4: nan}
}
)
我需要能够根据值是整数还是字符串来过滤null 列,然后在此基础上用适当的值填充适当列中的缺失值。我尝试在 for 循环中使用 .apply() 和 lambda 函数以及 .match()、.contains() 和 in,但到目前为止没有运气。
【问题讨论】:
-
你的预期输出是什么
-
我需要能够根据值是整数还是字符串来过滤空列,然后在此基础上,在适当的列中填充缺失值(字符串在'location' 和 'level' 中的整数)。
-
检查我的答案,让我知道它是否有效~
标签: python regex pandas null fillna