【问题标题】:web data extraction, getting data from tables to CSV网络数据提取,从表格中获取数据到 CSV
【发布时间】:2012-05-15 03:03:49
【问题描述】:

我想从网页中的表格中获取数据,这些表格似乎是使用“Excel Publish as Web Page Wizard”发布的。我知道有很多抓取工具(对于这样的任务来说似乎很先进)并且知道我可以编写一个脚本,但我想指出一些非常简单的东西,特别是数据是使用自动化发布的工具。

我更喜欢使用 Rails 解决方案。

数据为统计健康数据,here are links to some samples

【问题讨论】:

    标签: html web-scraping html-table data-extraction web-scripting


    【解决方案1】:

    是的,结构非常简单。在您的位置上,我只会使用您知道的任何语言,并且不会花时间学习第三方抓取工具。就个人而言,我使用 C# 来完成此类任务。

    【讨论】:

    • 没错,我正计划使用 Rails,有一个名为 open-uri 的不错的 gem,有一个关于使用它的不错的博客:igvita.com/2007/02/04/ruby-screen-scraper-in-60-seconds 但我认为这种常见的数据结构可以使用.也许我应该在 stat.exchange 中询问,非常感谢。
    猜你喜欢
    • 2020-12-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-11-16
    • 1970-01-01
    • 2019-05-20
    • 2011-11-02
    相关资源
    最近更新 更多