【问题标题】:Merging several rows together and making turning into an numpy array将几行合并在一起并变成一个numpy数组
【发布时间】:2021-04-26 16:35:36
【问题描述】:

我有一个已解析的 .csv 文件(我已使用 pd.read_file 完成此操作)。 这是 csv 文件:

Id A B C
1  7 6 5
1  4 3 2
2  1 0 0

是否可以把它变成这个(在一个 numpy 数组中):

[
[[7,6,5],[4,3,2]],
[[1,0,0],[0,0,0]]
]

【问题讨论】:

  • 这能回答你的问题吗? Convert pandas dataframe to NumPy array
  • @Ananda - 我认为没有,因为没有添加 [0,0,0]
  • 补充 jezrael 的观点,不幸的是没有,但我找到了一个答案,虽然它回答了我问题的第一部分。但不是添加 [0,0,0] 的部分转向,直到它是一个具有均匀形状的矩阵。这是回答第一部分的答案:stackoverflow.com/questions/65840573/…

标签: python pandas numpy csv tensorflow


【解决方案1】:

先用GroupBy.cumcount 加上DataFrame.unstackSeries.stack 加上缺失的行,然后转换成嵌套列表:

L = (df.set_index(['Id', df.groupby('Id').cumcount()])
        .unstack(fill_value=0)
        .stack()
        .groupby('Id')
        .apply(lambda x: x.to_numpy().tolist())
        .tolist()
        )
print (L)
[[[7, 6, 5], [4, 3, 2]], [[1, 0, 0], [0, 0, 0]]]

【讨论】:

    猜你喜欢
    • 2014-03-22
    • 2019-03-15
    • 1970-01-01
    • 1970-01-01
    • 2017-10-03
    • 1970-01-01
    • 2013-07-26
    • 1970-01-01
    • 2013-05-20
    相关资源
    最近更新 更多