luban

数据说明:MovieLens数据集,它包含来自于943个用户以及精选的1682部电影的100K个电影打分。每个用户至少为20部电影打分,数据类型user id | item id | rating | timestamp. 

地址:https://grouplens.org/datasets/movielens/

1、引入pandas,numpy包

2、读取数据:首先,文件如果不在默认路径下,需要更改路径,使用下面两行命令,另外要注意正反斜杠的应用。

os.getcwd()

os.chdir("新的路径")

3、由于数据包含了打分数据,用户数据,但在两个文件里,因此需要合并。首先,使用header=[\'l列名1\',\'列名2\'.....]格式给两个文件添加列名

然后数据合并

结果:

将文件转换成字典类型,并按照列名读取两列

 数据统计分析,data.describe()

 

 

分类:

技术点:

相关文章:

  • 2021-10-15
  • 2021-12-14
  • 2021-08-08
  • 2022-12-23
  • 2021-12-04
  • 2021-12-14
  • 2021-07-03
猜你喜欢
  • 2021-07-01
  • 2022-01-28
  • 2021-12-03
  • 2021-11-21
  • 2021-04-07
  • 2021-08-20
  • 2021-12-12
相关资源
相似解决方案