列表列表到 numpy 数组中答案

【问题标题】：List of lists into numpy array列表列表到 numpy 数组中
【发布时间】：2012-05-07 22:45:21
【问题描述】：

如何将简单的列表列表转换为 numpy 数组？这些行是单独的子列表，每一行都包含子列表中的元素。

【问题讨论】：

【解决方案1】：

如果您的列表列表包含具有不同数量元素的列表，那么 Ignacio Vazquez-Abrams 的答案将不起作用。相反，至少有 3 个选项：

1) 制作数组数组：

x=[[1,2],[1,2,3],[1]]
y=numpy.array([numpy.array(xi) for xi in x])
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'numpy.ndarray'>

2) 制作一个列表数组：

x=[[1,2],[1,2,3],[1]]
y=numpy.array(x)
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'list'>

3) 首先使列表长度相等：

x=[[1,2],[1,2,3],[1]]
length = max(map(len, x))
y=numpy.array([xi+[None]*(length-len(xi)) for xi in x])
y
>>>array([[1, 2, None],
>>>       [1, 2, 3],
>>>       [1, None, None]], dtype=object)

【讨论】：

谢谢，为此而来。使用 numpy 已经有一段时间了，发现这种行为并非易事。感谢您花时间解释这个更一般的案例。
dtype=float 也可以，它将None 转换为np.nan，这可能很有用。
在 python 3.9 上，我不得不在第三个解决方案中使用 (np.vectorize(len)(x)).max() 而不是 max(map(len, x))
你会收到一个警告：VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray return array(a, dtype, copy=False, order=order)

【解决方案2】：

>>> numpy.array([[1, 2], [3, 4]]) 
array([[1, 2], [3, 4]])

【讨论】：

这会自动转换二维数组中的列表列表，因为所有包含列表的长度都是相同的。你知道怎么做吗：即使所有列表的长度相同，也要创建一个列表数组？或者是否可以将 2D 数组转换为 1D 数组的 1D 数组（高效我的意思是，没有迭代方法或 python 映射的东西）
如果这对您不起作用，因为您的子列表大小不一，请参阅the following answer。
@NikanaReklawyks 看了答案后我很困惑，但您的评论很有帮助。我发现我的列表不应该是锯齿状的。
相对于参数的长度有多快？我在文档中没有看到好的答案？

【解决方案3】：

由于这是在 Google 上将列表列表转换为 Numpy 数组的热门搜索，因此尽管这个问题已有 4 年历史，但我仍会提供以下内容：

>>> x = [[1, 2], [1, 2, 3], [1]]
>>> y = numpy.hstack(x)
>>> print(y)
[1 2 1 2 3 1]

当我第一次想到这样做时，我对自己很满意，因为它太简单了。但是，在使用更大的列表对其进行计时后，这样做实际上会更快：

>>> y = numpy.concatenate([numpy.array(i) for i in x])
>>> print(y)
[1 2 1 2 3 1]

请注意，@Bastiaan 的答案 #1 并没有列出一个连续的列表，因此我添加了 concatenate。

无论如何...我更喜欢 hstack 方法，因为它可以优雅地使用 Numpy。

【讨论】：

虽然有些人可能正在寻找这个，但我很确定 OP 想要一个多维 nparr。

【解决方案4】：

很简单：

>>> lists = [[1, 2], [3, 4]]
>>> np.array(lists)
array([[1, 2],
       [3, 4]])

【讨论】：

【解决方案5】：

再次，在搜索了将N级嵌套列表转换为N维数组的问题后，我一无所获，所以这是我的解决方法：

import numpy as np

new_array=np.array([[[coord for coord in xk] for xk in xj] for xj in xi], ndmin=3) #this case for N=3

【讨论】：

请注意，如果您已经拥有嵌套列表结构，则不需要 [...[...[...]]] 部分。您只需拨打np.array 和ndmin=number-of-list-layers。（尽管在我的情况下，出于某种原因我需要ndmin=number-of-list-layers-minus-1，否则创建了一个额外的层——需要调查）
啊，好吧，我的问题是，对于最深的“列表层”，列表的长度并不相同，这导致np.array 只是“包装”那些最深的列表而不是将它们转换为 numpy 数组。
xi = [[[3, 4], [3, 4]], [[3, 4], [3, 4]]] 给出array([[[3, 4], [3, 4]], [[3, 4], [3, 4]]])。我在这里只看到外层的数组。我认为问题是将所有内容都转换为 numpy 数组？还是我选错了例子？

【解决方案6】：

OP 指定“行是单独的子列表，每一行包含子列表中的元素”。

假设不禁止使用numpy（鉴于OP中已添加flair numpy），请使用vstack：

import numpy as np

list_of_lists= [[1, 2, 3], [4, 5, 6], [7 ,8, 9]]

array = np.vstack(list_of_lists)
# array([[1, 2, 3],
#        [4, 5, 6],
#        [7, 8, 9]])

或更简单（如另一个答案中所述），

array = np.array(list_of_lists)

【讨论】：

【解决方案7】：

我有一个等长的列表。即便如此，Ignacio Vazquez-Abrams 的回答对我来说也没有奏效。我有一个 1-D numpy 数组，其元素是列表。如果你遇到同样的问题，你可以使用下面的方法

使用numpy.vstack

import numpy as np

np_array = np.empty((0,4), dtype='float')
for i in range(10)
     row_data = ...   # get row_data as list
     np_array = np.vstack((np_array, np.array(row_data)))

【讨论】：

如果您知道自己有 10 个列表，为什么还要继续堆叠，为什么不使用 np.empty((10, 4)) 然后将其填满？

【解决方案8】：

只使用熊猫

list(pd.DataFrame(listofstuff).melt().values)

这仅适用于列表列表

如果你有一个列表列表，你可能想尝试一些类似的东西

lists(pd.DataFrame(listofstuff).melt().apply(pd.Series).melt().values)

【讨论】：

问题是关于 numpy，而不是 pandas。
@Rishan，感谢您的贡献。很高兴看到替代品。