【问题标题】:How can I start writing a program in python where it reads an excel file with few records and generate more record for testing purpose如何开始在 python 中编写一个程序,它读取一个记录很少的 excel 文件并生成更多记录用于测试目的
【发布时间】:2025-12-10 11:35:01
【问题描述】:

我有一个包含 5 行和多列的文件,当程序读取它时,它应该生成 100 条记录,然后可以将这些记录加载到数据库中。 格式可以是excel或者csv

【问题讨论】:

  • 尝试看一下 SMOTE 算法,它会从您现有的数据中创建新数据。 (说实话,5 可能有点低)

标签: python python-3.x pandas data-generation msdatasetgenerator


【解决方案1】:

让我们为您保存一个文件file.csv。将其读入数据帧并根据需要多次从中采样。将结果写入新的数据框或 csv。

import pandas as pd

df = pd.read_csv('file.csv')
new_df = df.sample(n=100, replace=True) # n could be as big as you want

# new df can now be exported
new_df.to_csv('new_df.csv')

【讨论】:

  • 但我不想复制相同的数据。可以使用一些包并生成类似于该列中数据的新数据
最近更新 更多