【发布时间】:2017-07-14 22:39:03
【问题描述】:
我想创建自己的数据集,并在 scikit-learn 中使用它。 Scikit-learn 有一些数据集,如“波士顿住房数据集”(.csv),用户可以通过以下方式使用它:
from sklearn import datasets
boston = datasets.load_boston()
下面的代码可以得到这个数据集的data和target:
X = boston.data
y = boston.target
问题是如何创建我自己的数据集并以这种方式使用? 感谢任何答案,谢谢!
【问题讨论】:
-
你有数据吗?喜欢 csv 或 text 或类似的东西?
-
请澄清:您想使用自己的数据,您希望其他人能够使用您的数据,还是您想创建人工数据?
-
@Vivek Kumar,是的,我之前在Demo.csv中创建了一个小数据集,现在我只是想我应该创建两个.csv文件夹来分别存储数据和目标吗?
-
@kazemakase,你好,误会了,我想使用我自己从一些实验中收集的数据。
-
好的。你想用这些数据做什么......执行机器学习?哪种?
标签: python csv machine-learning scikit-learn dataset