【发布时间】:2025-12-10 11:35:01
【问题描述】:
我有一个包含 5 行和多列的文件,当程序读取它时,它应该生成 100 条记录,然后可以将这些记录加载到数据库中。 格式可以是excel或者csv
【问题讨论】:
-
尝试看一下 SMOTE 算法,它会从您现有的数据中创建新数据。 (说实话,5 可能有点低)
标签: python python-3.x pandas data-generation msdatasetgenerator
我有一个包含 5 行和多列的文件,当程序读取它时,它应该生成 100 条记录,然后可以将这些记录加载到数据库中。 格式可以是excel或者csv
【问题讨论】:
标签: python python-3.x pandas data-generation msdatasetgenerator
让我们为您保存一个文件file.csv。将其读入数据帧并根据需要多次从中采样。将结果写入新的数据框或 csv。
import pandas as pd
df = pd.read_csv('file.csv')
new_df = df.sample(n=100, replace=True) # n could be as big as you want
# new df can now be exported
new_df.to_csv('new_df.csv')
【讨论】: