【发布时间】:2016-01-14 10:18:55
【问题描述】:
我正在查看Fastest way to iterate through a pandas dataframe?,但我不确定它是否适用于我的情况。我想在 DataFrame 中制作样本和特征的字典
#DF_gex is a DataFrame
D_sample_Data = {}
class Sample:
def __init__(self,D_key_value):
self.D_key_value = D_key_value
for i in range(DF_gex.shape[0]):
D_key_value = {}
sample = DF_gex.index[i]
for j in range(DF_gex.shape[1]):
key = DF_gex.columns[j]
value = DF_gex.iloc[i,j]
D_key_value[key] = value
D_sample_Data[sample].D_key_value = D_key_value
在这种情况下,我基本上有一个名为 Sample 的类,在 Sample 类中,我为每个实例(D_key_value)存储了一个字典。现在我正在遍历每一行和每一列。
有更快的方法吗?我知道 Pandas 是基于具有特殊索引功能的 Numpy 数组。可以使用其中一种方法吗?
最后,我将有一个字典对象 D_sample_Data,我在其中输入一个样本名称并获取一个类实例。在该类实例中,将有一个对该示例键唯一的字典对象。
【问题讨论】:
-
您能更新一下您要查找的输出类型吗?
-
@AnandSKumar 我添加了输出类型。它基本上是一个字典,其中 D_sample_Data 指向一个类实例,并且该实例具有一些字典和其他对象。这是我能想到的最简单的例子
标签: python numpy pandas machine-learning dataframe