【发布时间】:2020-03-23 15:03:19
【问题描述】:
【问题讨论】:
-
如果你有
scikit-learn库,它有很好的test train split函数,可以让拆分数据帧变得非常简单和容易。 -
仅供参考,关于您的表格,推荐数据的格式通常采用
user, product, rating的形式。您的矩阵的问题在于,将有许多具有空评级或零评级的值(如果零表示非评级)。这将导致一个具有大量内存开销的巨大表,并且会随着您的用户/产品数据增长而呈指数增长。
标签: python pandas pivot-table train-test-split