【发布时间】:2017-09-14 06:54:01
【问题描述】:
我有一个如下所示的数据框:
top_ten_movies:
movieId count mean
1 247 3.872470
2 107 3.401869
6 104 3.884615
10 122 3.450820
25 101 3.742574
32 196 3.923469
34 148 3.601351
36 104 3.937500
39 120 3.550000
47 201 4.034826
电影:
movieId title genres
1 Toy Story (1995) Adventure
2 Jumanji (1995) Children|Fantasy
3 Grumpier Old Men (1995) Comedy|Romance
4 Waiting to Exhale (1995) Comedy|Drama|Romance
5 Father of the Bride Part II (1995) Comedy
6 Heat (1995) Action|Crime|Thriller
7 Sabrina (1995) Comedy|Romance
8 Tom and Huck (1995) Adventure|Children
9 Sudden Death (1995) Action
我需要根据movieId进行合并,所以:
required_data=pd.merge(top_ten_movies, movies)
required_data=pd.merge(top_ten_movies, movies, on='movieId', how='outer')
这两个语句都引发了错误。有人可以帮忙吗...?
【问题讨论】:
-
知道错误会很有用,你不觉得吗?您确定两个 dfs 的
movieIddtypes 相同吗? IE。一个是数字,另一个是字符串?
标签: python-3.x pandas numpy jupyter-notebook