【发布时间】:2015-03-09 17:21:21
【问题描述】:
我正在尝试为我看过的所有电影创建一个关系数据库。
我使用 IMDb 对我看过的电影进行评分,并使用该网站的导出功能来获取我上传到 Microsoft Access 的 .csv 文件中的数据。但是,“流派”列是多对多关系,我希望将其转变为一对多关系。
我想要一个名为 GENRE_ID 的表,它为每个流派分配一个数字 ID。然后我会有另一个表,其中每个实例都有movie ID(“const”)、line item number 和GENRE_ID。
所以它可能看起来像:
const line_item MOVIE_ID
tt0068646 1 1 (if MOVIE_ID: 1 = "crime")
tt0068646 2 2 (if MOVIE_ID: 2 = "drama")
这是我的数据库当前状态图像的链接。非常感谢你的帮助。这是我正在做的一个项目,目的是利用自己的时间了解更多信息。
【问题讨论】:
-
我不太清楚你想用这个数据库做什么以及你想如何报告它。 Wraith 的回答是有道理的,直到您想要按电影标题获取报告,并在其旁边列出所有类型,然后它变成一个换位查询并变得混乱。因此,在确定存储数据的最佳方式之前,您需要弄清楚您最关心的是什么。
-
我最终希望能够使用 Excel 的回归和相关方程来找出我观看的电影类型、我对这些电影的评分以及电影在 IMDb 上获得的评分之间的关系。我想我可以把“流派”从我的模型中去掉,但我有兴趣在数据库上解决这个问题。我正在寻找一个查询来编写以自动化这个过程。我同意我不想拥有与电影拥有的类型数量相同的实例数量。