【发布时间】:2014-01-05 07:28:11
【问题描述】:
我对在 Pandas 中加入/合并数据还是很陌生,因此非常感谢任何帮助来执行以下操作。我有以下三个数据的 SQL 表(转换为 DataFrames):
df1
Out[14]:
---- fruit price qty
2010 apple 1.0 2.0
2011 apple 3.0 4.0
2010 banana 0.5 1.5
2011 banana 7.0 8.0
df2
Out[15]:
---- fruit weight
2010 apple 10
2010 banana 12
df3
Out[16]:
-- fruit colour
0 apple red
1 banana yellow
df2 的结果与 df1 相同,但年份不同(我几乎完全确定 df2 的年份是 df1 的一个子集,尽管找到一种方法会很好,它允许 df2 中的年份不包含在 df1) 中。 df3 是一个表格,其中包含 df2 和 df1 中包含的所有水果的字符。我想将这三个表合并在一起,因此新组合 DataFrame 中的每一行都有年份、水果、价格、数量、重量(可能是 NaN)和颜色。我不确定这样的数据结构是否最好包含在 Panel 或 DataFrame 中 - 对此的输入也非常受欢迎。谢谢!
【问题讨论】: