【问题标题】:Does IMDb provide an api or a data dump to get all title IDs?IMDb 是否提供 api 或数据转储来获取所有标题 ID?
【发布时间】:2011-09-21 17:17:28
【问题描述】:

IMDB 提供用户可以下载和使用的纯文本文件,可以在此处找到:IMDB Plain Text Files 这很棒,但我没有在任何文件中看到用于每部电影的 ID。

鉴于 IMDB 在其使用条件中明确规定不要使用抓取工具、数据收集器等,如果它们不包含在任何纯文本文件中,如何为每部电影获取标题 ID http://www.imdb.com/title/tt1133985/

我注意到其他人构建的一些 API 确实包含此 ID,所以我想知道他们是如何做到这一点的。

【问题讨论】:

    标签: web-services imdb


    【解决方案1】:

    你可以试试 TMDb。您可以在此处查看文档 - http://docs.themoviedb.apiary.io/。您可以使用 append_to_response 并可以获取 IMDB id 以及其他详细信息。我知道有一个替代解决方案。解决方案是在 PHP 中。这是链接 - http://blogs.niteshapte.com/2013-07-01-how-to-fetch-movie-identifier-id-from-imdb-using-php.htm。您可能需要根据自己的要求对其进行调整。

    【讨论】:

    • 我听说只有 80,000 个标题。 IMDB 数以百万计。
    【解决方案2】:

    您可以使用位于

    的 IMDB API

    www.omdbapi.com

    你可以像这样搜索电影名称 -

    http://www.omdbapi.com/?t=hangover%202

    {
    "Title":"The Hangover Part II",
    "Year":"2011",
    "Rated":"R",
    "Released":"26 May 2011",
    "Genre":"Comedy",
    "Director":"Todd Phillips",
    "Writer":"Craig Mazin, Scot Armstrong",
    "Actors":"Bradley Cooper, Zach Galifianakis, Ed Helms, Justin Bartha",
    "Plot":"Right after the bachelor party in Las Vegas, Phil, Stu, Alan, and Doug jet to Thailand for Stu's wedding. Stu's plan for a subdued pre-wedding brunch, however, goes seriously awry.",
    "Poster":"http://ia.media-imdb.com/images/M/MV5BMTM2MTM4MzY2OV5BMl5BanBnXkFtZTcwNjQ3NzI4NA@@._V1_SX320.jpg","
    Runtime":"1 hr 42 mins",
    "Rating":"7.1",
    "Votes":"13547",
    "ID":"tt1411697",
    "Response":"True"
    } 
    

    您可以从此 JSON 响应中获取“ID”(tt1411697)。

    【讨论】:

    • 我知道已经存在的 Web 服务,例如您链接的那个,但是我必须自己做些什么才能获得 ID。我是否必须用电影名称点击搜索页面并从第 1 个匹配项中提取 ID?如果我想为 1000 部电影这样做呢?这就是 imdbapi 和其他 Web 服务的作用吗?
    • 是的,您必须使用 IMDB API 为每部电影一一进行。没别的了!
    • 所以 imdbapi 没有将所有标题 ID 都存储在某处,而是根据您搜索的名称动态提取它?这是否本质上不是意味着 imdbapi 充当搜索大量电影的人的刮板,这应该违反 IMDB 的使用条件?
    • 是的,我想这违反了 IMDB 的政策
    • 如果我的 API 确实从 IMDb.com 获取了数据,那将是真的;)
    【解决方案3】:

    如前所述,IMDB 没有网络服务。 imdbapi 通过屏幕抓取工作。可供下载的平面文件是 IMDB 亚马逊之前时代的遗产,那里的信息不完整。 (您无法仅使用可用文件构建自己的 IMDB)

    不过,Rotten Tomatoes 确实有一个不错的 Web 界面,它可以在 alternate_ids 部分中返回电影的 imdb id 等信息。因此,您可以使用Rotten Tomatoes API 获取imdb id,而无需直接对imdb 进行屏幕抓取。

    Rotten Tomatoes 的数据库不如 IMDB 的广泛,但它在现代(1995 年以上)美国版本中做得很好。

    【讨论】:

      猜你喜欢
      • 2010-12-30
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-06-19
      • 2013-04-12
      • 2011-07-10
      • 1970-01-01
      相关资源
      最近更新 更多