【发布时间】:2012-08-31 00:32:41
【问题描述】:
我需要将网站(.html 页面)导出到 XML 文件。该网站包含一个表格,其中包含一些我需要在我的网络项目中使用的数据。网站中的表格是使用一些javascript形成的,所以我无法通过获取页面源来获取数据。请告诉我如何使用 php/python/javascript/perl 将网站中的表格导出到 XML 文件。
【问题讨论】:
-
这可能不相关,但Yahoo! Pipes 对您没有帮助吗?
-
我不知道该怎么做。以前我使用 perl 脚本获取网站的源代码,但现在我什么都做不了。请帮忙。
-
您需要一个浏览器引擎来加载页面并传递 html
-
@njzk2 — 这是另一种可行的方法。我会推荐它,但 OP 表示优先考虑的是执行速度,这使得 troelskn 建议对代码进行逆向工程(不需要程序使用浏览器引擎)成为更合适的解决方案。
标签: php javascript python xml perl