【问题标题】:Get data from Wiki to CSV file / database从 Wiki 获取数据到 CSV 文件/数据库
【发布时间】:2012-06-19 18:57:20
【问题描述】:

从维基百科获取一些数据的最简单方法是什么?我想将其作为 CSV 文件获取。

基本上,我想要获得的数据只是名称列表。例如,此页面中所有英国演员的姓名:http://en.wikipedia.org/wiki/List_of_British_actors_and_actresses (所有来自 A-Z 和名字就足够了)。

这可能吗?而且这只会做一次,所以不需要缓存或类似的东西。只是简单的获取数据执行。但是我真的不知道该怎么做。

PHP、JS、Jquery、JSON 会很好。没有 java 或类似的东西!

【问题讨论】:

  • 请问这是什么问题,为什么是-1?

标签: csv web-scraping data-mining


【解决方案1】:

看看 DBPedia 和 Google Refine。 IIRC Google Refine 有一个从 Wikipedia (see video tutorial) 提取和清理数据的示例。 DBPedia 已经是 Wikipedia 的数据库副本。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2013-05-12
    • 1970-01-01
    • 2013-04-25
    • 1970-01-01
    • 2022-01-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多