【发布时间】:2016-07-25 13:57:21
【问题描述】:
我有以下数据框'df',我想根据它创建一个新的df'new_df'。我在获取新的 df 时遇到了一些麻烦。
Cust-id Sex Country Orders Products
0 'Cu1' 'F' 'FR' 'ord1 + ord2' 'A+G'
1 'Cu2' 'M' 'US' 'ord3' 'C'
2 'Cu3' 'M' 'UK' 'ord4 + ord5' 'H+Z'
3 'Cu4' 'F' 'RU' 'ord6' 'K'
4 'Cu5' 'M' 'US' 'ord7' 'T'
5 NaN 'M' 'UK' 'ord#' 'K'
6 'Cu6' 'F' 'US' 'ord8+ord9+ord10' 'R+D+S'
7 'Cu7' 'M' 'UK' 'ord11' 'A'
我希望“new_df”为每个“订单”和相应的“产品”包含一行。所有其他列保留其内容。此外,如果“Cust-id”列中的一行是 NaN,则应删除完整的行(即不存在于新的 df 中)。这将给出以下 new_df:
Cust-id Sex Country Orders Products
0 'Cu1' 'F' 'FR' 'ord1' 'A'
1 'Cu1' 'F' 'FR' 'ord2' 'G'
2 'Cu2' 'M' 'US' 'ord3' 'C'
3 'Cu3' 'M' 'UK' 'ord4' 'H'
4 'Cu3' 'M' 'UK' 'ord5' 'Z'
5 'Cu4' 'F' 'RU' 'ord6' 'K'
6 'Cu5' 'M' 'US' 'ord7' 'T'
7 'Cu6' 'F' 'US' 'ord8' 'R'
8 'Cu6' 'F' 'US' 'ord9' 'D'
9 'Cu6' 'F' 'US' 'ord10' 'S'
10 'Cu7' 'M' 'UK' 'ord11' 'A'
感谢任何帮助/指导。
【问题讨论】: