【发布时间】:2012-05-15 03:03:49
【问题描述】:
我想从网页中的表格中获取数据,这些表格似乎是使用“Excel Publish as Web Page Wizard”发布的。我知道有很多抓取工具(对于这样的任务来说似乎很先进)并且知道我可以编写一个脚本,但我想指出一些非常简单的东西,特别是数据是使用自动化发布的工具。
我更喜欢使用 Rails 解决方案。
数据为统计健康数据,here are links to some samples。
【问题讨论】:
标签: html web-scraping html-table data-extraction web-scripting