【问题标题】:Filling In Empty Data Sets填充空数据集
【发布时间】:2020-06-23 05:40:11
【问题描述】:

我目前正在从事一个数据科学项目,其数据集如下所示:

示例数据集:

在清理数据集时,我注意到第一列 (1,2,3,5) 中的前 4 个值具有相同的“补丁区域”2500,其余的也相同。但是给我的数据集只将“补丁区域”放在类别的第一行。有没有什么方法可以用相应的区域填充空单元格,所以它看起来像这样:

我用 markdown 创建了这个图表,所以我实际上不知道如何编码。

【问题讨论】:

    标签: python pandas numpy data-science


    【解决方案1】:

    你可以试试 pandas:

    d = pandas.read_csv('your_file.csv')
    d.fillna(method='ffill', inplace=True)
    d.to_csv('new_file.csv', index=False)
    

    “基本上,这只是用最近的实际值向前填充每列中的空单元格。”

    答案来自 https://stackoverflow.com/a/38443822/12460726

    【讨论】:

      【解决方案2】:

      您可以这样做以根据条件满足列

      df = pandas.read_csv('your_file.csv')
      df.loc[df['Patch Area'] == '', 'Patch Area'] = 2500
      

      这里写着for all value in 'Patch Area', select empty value, and set 2500

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2015-02-08
        • 2018-10-16
        • 2023-03-20
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多