【发布时间】:2019-11-02 02:19:21
【问题描述】:
我有许多由一维数据组成的列表。如下:
list1 = [1,2,3,4...]
list2 = ['a','b','c'...]
现在,我必须创建如下数据框:
df = [[1,'a'],[2,'b'],[3,'c']]
我需要这个数据框,以便我可以使用 pandas_profiling 来分析每一列。 请提出建议。
我试过了
list1+list2
但它给出的数据如下:
list3=[1,2,3,4...'a','b'...]
也使用了 numpy hpstack,但无法正常工作
import pandas as pd
import pandas_profiling
import numpy as np
list3 = np.hstack([[list1],[list2]])
array([[1,2,3,4,'a','b','c'..]],dtype='<U5')
【问题讨论】:
-
Numpy 仅用于数字数组,使用 pandas,google 一些 pandas 教程应该在前几章中
-
zip是正确的答案,但这是你可以在 numpy 中完成的:np.vstack((list1, list2)).T -
对于列表
+是一个简单的连接。使用hstack表达式,您可以在最后一维上连接 (1,n) 数组,生成 (1,2n) 数组。column_stack将创建一个 (n,2) 数组,但字符串 dtype。 pythonzip在迭代数字和字符串元素方面做得更好。
标签: python python-3.x pandas numpy pandas-profiling