【问题标题】:Save structured numpy array using np.savetxt with header使用带有标题的 np.savetxt 保存结构化的 numpy 数组
【发布时间】:2018-06-25 15:51:50
【问题描述】:

我有一个

形式的结构数组
output = np.zeros(names.size, dtype=[('name', 'U32'), ('r', float),('m',float)])

然后我尝试使用 np.savetxt 将其保存到 csv 文件中。我想知道是否有办法也可以将每列的标签保存为 csv 文件的标题?

提前谢谢你。

【问题讨论】:

  • output.dtype.names 是这些字段名称的列表。您可以使用该格式作为标题行,例如' '.join(output.dtype.names)
  • @hpaulj 那不是只给了我三列,我的所有数据都将出现在第一列中吗?
  • 标题行不影响数据的布局。这由答案中指定的fmt 处理。对于savetxt,标头只是它与注释字符一起写入的字符串。

标签: python numpy save structured-array


【解决方案1】:

您可以尝试类似于this SO answer 的解决方案来透视数据

dtypes = [('name', 'U32'), ('r', float),('m',float)]
a = np.zeros(5, dtype=dtypes)
b = numpy.vstack(map(list, a))

您将列表映射到recarray 元组上,然后垂直堆叠它们。

那么你可以做以下...

names = [n for n, t in dtypes]
numpy.savetxt('test.csv', b, header=','.join(names), fmt=','.join(['%s']*b.shape[1]))

【讨论】:

    【解决方案2】:

    下面是示例代码:

    output = np.zeros(names.size, dtype=[('name', 'U32'), ('r', float),('m',float)])
    np.savetxt("foo.csv", output, delimiter=",", header="name,r,m", fmt="%s,%f,%f", comments='')
    

    作为documented here

    【讨论】:

    • 它以这种方式给了我 3 列,但所有数据似乎都在第一列中。我猜这是因为结构化数组的每个元素都以'name float float'的形式出现。有没有办法将每个元素分成 3 列?
    【解决方案3】:

    我发现自己经常遇到这个问题,所以我编写了一个函数来生成标题和格式化字符串以与np.savetxt 一起使用:

    你可以在GitHub Gist找到代码。

    我没有对它进行广泛的测试,但它可以处理大多数数据类型并生成(可选)自动填充输出。输出格式良好且易于阅读,支持拖放到 excel 中,并且可以轻松读回其中的字段名称和 dtypes 是自动检测的(大部分情况下)。

    样本输出:

    # x     y1       y2 bools   verylongnamewithshortcontent                     bytes                              objects
      0    -25  3.9e+03     1                              a      b'AvvOkBhFJZIUQsxdg'  {'key1': 12423, 'key2': 'asdfjkl;'}
      1    255    8e+03     1                              a                b'SxKvotv'  {'key1': 12423, 'key2': 'asdfjkl;'}
      2   -211  2.5e+03     0                              a              b'tvBQXgqqS'  {'key1': 12423, 'key2': 'asdfjkl;'}
      3   -830  5.7e+02     1                              a        b'NCFrZHfniaZjeUg'  {'key1': 12423, 'key2': 'asdfjkl;'}
      4  -3468  8.7e+03     0                              a          b'RxzuvyKCxKBsz'  {'key1': 12423, 'key2': 'asdfjkl;'}
      5   4644  2.2e+03     1                              a              b'yHijSVfCv'  {'key1': 12423, 'key2': 'asdfjkl;'}
      6  27946    4e+03     0                              a            b'ywyZeQICJrY'  {'key1': 12423, 'key2': 'asdfjkl;'}
      7 313770  3.2e+03     1                              a    b'HBEufqJuASVxHRIxpjd'  {'key1': 12423, 'key2': 'asdfjkl;'}
      8 -76304  7.7e+02     0                              a                     b'UX'  {'key1': 12423, 'key2': 'asdfjkl;'}
      9 427810  8.4e+03     0                              a            b'jmnOEWCvTWg'  {'key1': 12423, 'key2': 'asdfjkl;'}
    
    

    输入/输出数据类型:

    [('x', '<i4'), ('y1', '<i4'), ('y2', '<f8'), ('bools', '?'), ('verylongnamewithshortcontent', '<U7'), ('bytes', 'S20'), ('objects', 'O')]
    
    [('x', '<i4'), ('y1', '<i4'), ('y2', '<f8'), ('bools', '<i4'), ('verylongnamewithshortcontent', '<U1'), ('bytes', '<U22'), ('objects', '<U35')]
    

    【讨论】:

      猜你喜欢
      • 2015-09-29
      • 2018-03-13
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-04-12
      • 2015-06-24
      • 1970-01-01
      相关资源
      最近更新 更多