【发布时间】:2021-05-31 17:27:34
【问题描述】:
*这不是第一次在这里被问到但我没有看到任何与多列相关的Q
示例数据:
1 2 3 ........
Orange |a |d |e
Orange |b |b |e
Black |y |z |nan
Black |x |y |nan
Black |z |nan |nan
Black |w |x |y
Blue |g |h |i
Blue |i |nan |nan
..
我正在尝试加入相同的索引行,并删除重复项 即橙色:a b d e
通过以下方式连接相同的索引行:
df = df.groupby(df.index).agg(lambda z: ','.join(z.astype(str)))
之后,我将所有行都用逗号连接起来,这些逗号只是镶嵌在某些列中。 我试图将它们移动到不同的列:
df = df.columns.str.split(',',expand=True)
但它不起作用。
将它们移动到单独的列后,我将使用 drop_duplicates()。
在展开部分需要帮助。
已编辑(不需要顺序):
1 2 3 4 5 6 7....
Orange |a |b |d |e
Black |y |z |x |w
Blue |g |h |i
【问题讨论】: