【问题标题】:List of lists into numpy array列表列表到 numpy 数组中
【发布时间】:2012-05-07 22:45:21
【问题描述】:

如何将简单的列表列表转换为 numpy 数组?这些行是单独的子列表,每一行都包含子列表中的元素。

【问题讨论】:

    标签: python list numpy


    【解决方案1】:

    如果您的列表列表包含具有不同数量元素的列表,那么 Ignacio Vazquez-Abrams 的答案将不起作用。相反,至少有 3 个选项:

    1) 制作数组数组:

    x=[[1,2],[1,2,3],[1]]
    y=numpy.array([numpy.array(xi) for xi in x])
    type(y)
    >>><type 'numpy.ndarray'>
    type(y[0])
    >>><type 'numpy.ndarray'>
    

    2) 制作一个列表数组:

    x=[[1,2],[1,2,3],[1]]
    y=numpy.array(x)
    type(y)
    >>><type 'numpy.ndarray'>
    type(y[0])
    >>><type 'list'>
    

    3) 首先使列表长度相等:

    x=[[1,2],[1,2,3],[1]]
    length = max(map(len, x))
    y=numpy.array([xi+[None]*(length-len(xi)) for xi in x])
    y
    >>>array([[1, 2, None],
    >>>       [1, 2, 3],
    >>>       [1, None, None]], dtype=object)
    

    【讨论】:

    • 谢谢,为此而来。使用 numpy 已经有一段时间了,发现这种行为并非易事。感谢您花时间解释这个更一般的案例。
    • dtype=float 也可以,它将None 转换为np.nan,这可能很有用。
    • 在 python 3.9 上,我不得不在第三个解决方案中使用 (np.vectorize(len)(x)).max() 而不是 max(map(len, x))
    • 你会收到一个警告:VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray return array(a, dtype, copy=False, order=order)
    【解决方案2】:
    >>> numpy.array([[1, 2], [3, 4]]) 
    array([[1, 2], [3, 4]])
    

    【讨论】:

    • 这会自动转换二维数组中的列表列表,因为所有包含列表的长度都是相同的。你知道怎么做吗:即使所有列表的长度相同,也要创建一个列表数组?或者是否可以将 2D 数组转换为 1D 数组的 1D 数组(高效我的意思是,没有迭代方法或 python 映射的东西)
    • 如果这对您不起作用,因为您的子列表大小不一,请参阅the following answer
    • @NikanaReklawyks 看了答案后我很困惑,但您的评论很有帮助。我发现我的列表不应该是锯齿状的。
    • 相对于参数的长度有多快?我在文档中没有看到好的答案?
    【解决方案3】:

    由于这是在 Google 上将列表列表转换为 Numpy 数组的热门搜索,因此尽管这个问题已有 4 年历史,但我仍会提供以下内容:

    >>> x = [[1, 2], [1, 2, 3], [1]]
    >>> y = numpy.hstack(x)
    >>> print(y)
    [1 2 1 2 3 1]
    

    当我第一次想到这样做时,我对自己很满意,因为它太简单了。但是,在使用更大的列表对其进行计时后,这样做实际上会更快:

    >>> y = numpy.concatenate([numpy.array(i) for i in x])
    >>> print(y)
    [1 2 1 2 3 1]
    

    请注意,@Bastiaan 的答案 #1 并没有列出一个连续的列表,因此我添加了 concatenate

    无论如何...我更喜欢 hstack 方法,因为它可以优雅地使用 Numpy。

    【讨论】:

    • 虽然有些人可能正在寻找这个,但我很确定 OP 想要一个多维 nparr。
    【解决方案4】:

    很简单:

    >>> lists = [[1, 2], [3, 4]]
    >>> np.array(lists)
    array([[1, 2],
           [3, 4]])
    

    【讨论】:

      【解决方案5】:

      再次,在搜索了将N级嵌套列表转换为N维数组的问题后,我一无所获,所以这是我的解决方法:

      import numpy as np
      
      new_array=np.array([[[coord for coord in xk] for xk in xj] for xj in xi], ndmin=3) #this case for N=3
      

      【讨论】:

      • 请注意,如果您已经拥有嵌套列表结构,则不需要 [...[...[...]]] 部分。您只需拨打np.arrayndmin=number-of-list-layers。 (尽管在我的情况下,出于某种原因我需要ndmin=number-of-list-layers-minus-1,否则创建了一个额外的层——需要调查)
      • 啊,好吧,我的问题是,对于最深的“列表层”,列表的长度并不相同,这导致np.array 只是“包装”那些最深的列表而不是将它们转换为 numpy 数组。
      • xi = [[[3, 4], [3, 4]], [[3, 4], [3, 4]]] 给出array([[[3, 4], [3, 4]], [[3, 4], [3, 4]]])。我在这里只看到外层的数组。我认为问题是将所有内容都转换为 numpy 数组?还是我选错了例子?
      【解决方案6】:

      OP 指定“行是单独的子列表,每一行包含子列表中的元素”。

      假设不禁止使用numpy(鉴于OP中已添加flair numpy),请使用vstack

      import numpy as np
      
      list_of_lists= [[1, 2, 3], [4, 5, 6], [7 ,8, 9]]
      
      array = np.vstack(list_of_lists)
      # array([[1, 2, 3],
      #        [4, 5, 6],
      #        [7, 8, 9]])
      

      或更简单(如另一个答案中所述),

      array = np.array(list_of_lists)
      

      【讨论】:

        【解决方案7】:

        我有一个等长的列表。即便如此,Ignacio Vazquez-Abrams 的回答对我来说也没有奏效。我有一个 1-D numpy 数组,其元素是列表。如果你遇到同样的问题,你可以使用下面的方法

        使用numpy.vstack

        import numpy as np
        
        np_array = np.empty((0,4), dtype='float')
        for i in range(10)
             row_data = ...   # get row_data as list
             np_array = np.vstack((np_array, np.array(row_data)))
        

        【讨论】:

        • 如果您知道自己有 10 个列表,为什么还要继续堆叠,为什么不使用 np.empty((10, 4)) 然后将其填满?
        【解决方案8】:

        只使用熊猫

        list(pd.DataFrame(listofstuff).melt().values)
        

        这仅适用于列表列表

        如果你有一个列表列表,你可能想尝试一些类似的东西

        lists(pd.DataFrame(listofstuff).melt().apply(pd.Series).melt().values)
        

        【讨论】:

        • 问题是关于 numpy,而不是 pandas。
        • @Rishan,感谢您的贡献。很高兴看到替代品。
        猜你喜欢
        • 2019-05-06
        • 1970-01-01
        • 1970-01-01
        • 2016-08-04
        • 1970-01-01
        • 2021-02-21
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多