【问题标题】:Export a website to an XML Page [closed]将网站导出到 XML 页面 [关闭]
【发布时间】:2012-08-31 00:32:41
【问题描述】:

我需要将网站(.html 页面)导出到 XML 文件。该网站包含一个表格,其中包含一些我需要在我的网络项目中使用的数据。网站中的表格是使用一些javascript形成的,所以我无法通过获取页​​面源来获取数据。请告诉我如何使用 php/python/javascript/perl 将网站中的表格导出到 XML 文件。

【问题讨论】:

  • 这可能不相关,但Yahoo! Pipes 对您没有帮助吗?
  • 我不知道该怎么做。以前我使用 perl 脚本获取网站的源代码,但现在我什么都做不了。请帮忙。
  • 您需要一个浏览器引擎来加载页面并传递 html
  • @njzk2 — 这是另一种可行的方法。我会推荐它,但 OP 表示优先考虑的是执行速度,这使得 troelskn 建议对代码进行逆向工程(不需要程序使用浏览器引擎)成为更合适的解决方案。

标签: php javascript python xml perl


【解决方案1】:

您可以尝试对 javascript 代码进行逆向工程。也许它正在向服务发出 ajax 请求,将数据作为 json 传递。使用您的浏览器开发者工具/网络选项卡查看发生了什么。

【讨论】:

  • 我需要以更快的方式完成此操作。只有这样我才能在我的项目中获得所需的输出。上面的解决方案加载会不会太费时间?
  • @HarikrishnanT — 不,开发需要时间。它具有所有替代方案中最快的执行时间。
猜你喜欢
  • 1970-01-01
  • 2013-02-21
  • 1970-01-01
  • 2010-12-02
  • 1970-01-01
  • 2017-06-25
  • 2017-05-16
  • 2013-09-14
  • 1970-01-01
相关资源
最近更新 更多