【发布时间】:2019-03-16 13:43:55
【问题描述】:
我已经写了这段代码:
class_1500_strings = ['transistor', 'resistor', 'diode', 'processor', 'thermistor', '555-timer', 'microcontroller']
class_1500 = {'conductivity' : gaussian_sample(100, 10, 250),
'price_per_unit' : gaussian_sample(10, 2, 250),
'number_bought' : categorical_sample(0, 10, 250),
'manufacturer' : string_sample(250, class_1500_strings),
'acquisition_date' : date_random_sample("1/1/2008 1:30 PM", "1/1/2009 4:50 AM", col_length=250),
'runtime' : gaussian_sample(1000, 200, 250)
def generate_table(class_dict, class_label, number_of_samples):
X, y = [], []
for table_idx in range(number_of_samples):
df = pd.DataFrame(class_dict)
label = class_label
X.append(df)
y.append(label)
return X, y
X, y = generate_table(class_1500, 0, 5)
目的是构建样本人工数据框。我遇到的问题是 X 是相同数据帧的列表,而不是在类字典中调用随机生成器。如何使函数生成不同数据集的列表(即每次运行循环时调用采样器)?
【问题讨论】:
标签: python python-3.x function dictionary for-loop