【发布时间】:2016-07-15 09:06:59
【问题描述】:
我有一个没有标题的 csv 文件,我正在使用 pandas 将其导入 python。最后一列是目标类,其余列是图像的像素值。如何继续使用 pandas (80/20) 将此数据集拆分为训练集和测试集?
此外,一旦完成,我将如何拆分这些集合中的每一个,以便我可以定义 x(除最后一列之外的所有列)和 y(最后一列)?
我已使用以下方式导入我的文件:
dataset = pd.read_csv('example.csv', header=None, sep=',')
谢谢
【问题讨论】:
-
你尝试过 Pandas 中的
sample函数吗:pandas.pydata.org/pandas-docs/stable/generated/…?
标签: python csv pandas scikit-learn