【发布时间】:2012-05-07 22:45:21
【问题描述】:
如何将简单的列表列表转换为 numpy 数组?这些行是单独的子列表,每一行都包含子列表中的元素。
【问题讨论】:
如何将简单的列表列表转换为 numpy 数组?这些行是单独的子列表,每一行都包含子列表中的元素。
【问题讨论】:
如果您的列表列表包含具有不同数量元素的列表,那么 Ignacio Vazquez-Abrams 的答案将不起作用。相反,至少有 3 个选项:
1) 制作数组数组:
x=[[1,2],[1,2,3],[1]]
y=numpy.array([numpy.array(xi) for xi in x])
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'numpy.ndarray'>
2) 制作一个列表数组:
x=[[1,2],[1,2,3],[1]]
y=numpy.array(x)
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'list'>
3) 首先使列表长度相等:
x=[[1,2],[1,2,3],[1]]
length = max(map(len, x))
y=numpy.array([xi+[None]*(length-len(xi)) for xi in x])
y
>>>array([[1, 2, None],
>>> [1, 2, 3],
>>> [1, None, None]], dtype=object)
【讨论】:
dtype=float 也可以,它将None 转换为np.nan,这可能很有用。
(np.vectorize(len)(x)).max() 而不是 max(map(len, x))
VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray return array(a, dtype, copy=False, order=order)
>>> numpy.array([[1, 2], [3, 4]])
array([[1, 2], [3, 4]])
【讨论】:
由于这是在 Google 上将列表列表转换为 Numpy 数组的热门搜索,因此尽管这个问题已有 4 年历史,但我仍会提供以下内容:
>>> x = [[1, 2], [1, 2, 3], [1]]
>>> y = numpy.hstack(x)
>>> print(y)
[1 2 1 2 3 1]
当我第一次想到这样做时,我对自己很满意,因为它太简单了。但是,在使用更大的列表对其进行计时后,这样做实际上会更快:
>>> y = numpy.concatenate([numpy.array(i) for i in x])
>>> print(y)
[1 2 1 2 3 1]
请注意,@Bastiaan 的答案 #1 并没有列出一个连续的列表,因此我添加了 concatenate。
无论如何...我更喜欢 hstack 方法,因为它可以优雅地使用 Numpy。
【讨论】:
很简单:
>>> lists = [[1, 2], [3, 4]]
>>> np.array(lists)
array([[1, 2],
[3, 4]])
【讨论】:
再次,在搜索了将N级嵌套列表转换为N维数组的问题后,我一无所获,所以这是我的解决方法:
import numpy as np
new_array=np.array([[[coord for coord in xk] for xk in xj] for xj in xi], ndmin=3) #this case for N=3
【讨论】:
[...[...[...]]] 部分。您只需拨打np.array 和ndmin=number-of-list-layers。 (尽管在我的情况下,出于某种原因我需要ndmin=number-of-list-layers-minus-1,否则创建了一个额外的层——需要调查)
np.array 只是“包装”那些最深的列表而不是将它们转换为 numpy 数组。
xi = [[[3, 4], [3, 4]], [[3, 4], [3, 4]]] 给出array([[[3, 4], [3, 4]], [[3, 4], [3, 4]]])。我在这里只看到外层的数组。我认为问题是将所有内容都转换为 numpy 数组?还是我选错了例子?
OP 指定“行是单独的子列表,每一行包含子列表中的元素”。
假设不禁止使用numpy(鉴于OP中已添加flair numpy),请使用vstack:
import numpy as np
list_of_lists= [[1, 2, 3], [4, 5, 6], [7 ,8, 9]]
array = np.vstack(list_of_lists)
# array([[1, 2, 3],
# [4, 5, 6],
# [7, 8, 9]])
或更简单(如另一个答案中所述),
array = np.array(list_of_lists)
【讨论】:
我有一个等长的列表。即便如此,Ignacio Vazquez-Abrams 的回答对我来说也没有奏效。我有一个 1-D numpy 数组,其元素是列表。如果你遇到同样的问题,你可以使用下面的方法
使用numpy.vstack
import numpy as np
np_array = np.empty((0,4), dtype='float')
for i in range(10)
row_data = ... # get row_data as list
np_array = np.vstack((np_array, np.array(row_data)))
【讨论】:
只使用熊猫
list(pd.DataFrame(listofstuff).melt().values)
这仅适用于列表列表
如果你有一个列表列表,你可能想尝试一些类似的东西
lists(pd.DataFrame(listofstuff).melt().apply(pd.Series).melt().values)
【讨论】: