【问题标题】:Adding a variable with missing observations to an existing pandas df without loosing observations in the larger df在现有的 pandas df 中添加一个缺少观测值的变量,而不会丢失较大 df 中的观测值
【发布时间】:2020-03-05 21:28:54
【问题描述】:

我有两个数据框。一个名为 ENFORE 的观测值有 139 个:

citation    Enfore
0170/0952   1
0175/0686   1
0184/0521   1
0183/0726   1
0178/0595   0

还有另一个名为 CITATIONS 的数据框,其中包含 668 个观察值,也有列引用,但没有 Enfore。 ENFORE 中的所有引文都在 CITATIONS 数据框中。

我想将 Enfore 列添加到 CITATIONS 数据框中,并用“X”填写 ENFORE 数据框中不存在的观察结果。

使用此代码的各种变体(合并和连接)

enfore_merged = pd.merge(enfore , harrington_citations, on = 'citation')

我无法创建上面描述的数据框。

【问题讨论】:

  • 我已经添加了一个答案。如果它不起作用,您能否展示一个 CITATIONS 数据框的示例?

标签: python pandas dataframe merge missing-data


【解决方案1】:

你快到了:

enfore_merged = harrington_citations.merge(enfore, how='left', on='citation')
enfore_merged['Enfore'] = enfore_merged['Enfore'].fillna('X')

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-08-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-11-23
    • 2021-05-08
    • 1970-01-01
    相关资源
    最近更新 更多