填充空数据集答案

【问题标题】：Filling In Empty Data Sets填充空数据集
【发布时间】：2020-06-23 05:40:11
【问题描述】：

我目前正在从事一个数据科学项目，其数据集如下所示：

示例数据集：

在清理数据集时，我注意到第一列 (1,2,3,5) 中的前 4 个值具有相同的“补丁区域”2500，其余的也相同。但是给我的数据集只将“补丁区域”放在类别的第一行。有没有什么方法可以用相应的区域填充空单元格，所以它看起来像这样：

我用 markdown 创建了这个图表，所以我实际上不知道如何编码。

【问题讨论】：

【解决方案1】：

你可以试试 pandas：

d = pandas.read_csv('your_file.csv')
d.fillna(method='ffill', inplace=True)
d.to_csv('new_file.csv', index=False)

“基本上，这只是用最近的实际值向前填充每列中的空单元格。”

【讨论】：

【解决方案2】：

您可以这样做以根据条件满足列

df = pandas.read_csv('your_file.csv')
df.loc[df['Patch Area'] == '', 'Patch Area'] = 2500

这里写着for all value in 'Patch Area', select empty value, and set 2500

【讨论】：