【问题标题】:Dynamically web scrape tables for a CMSCMS 的动态网页抓取表
【发布时间】:2012-09-25 02:16:16
【问题描述】:

当我无法访问服务器端脚本时,是否有人建议我如何从网站上抓取每天更新的表格?具体来说,我正在使用 CMS - Drupal - 并且无法访问托管服务器,也无法创建或修改模块。我相信这排除了使用 Python、PHP 等的可能性。

有没有什么方法可以仅使用 Javascript 来抓取网站的 HTML、解析表格并在我的网页上显示其数据(或显示整个表格)?我读过 Node.js 和其他依赖于 PHP 等语言的脚本,但正如我所说,我不相信我可以运行这些。

任何建议或线索都会很有帮助。我对这些功能的运行方式不是最了解的。

编辑 --- 我应该提到它具有相同的域。动态更新的内容位于我无法访问的子目录中。我想这听起来有点傻,但这就是我所处的情况。

【问题讨论】:

    标签: javascript python drupal web-scraping html-table


    【解决方案1】:

    由于same origin policy,您无法通过javascript访问外部网站。

    但是,如果该站点位于同一域中,我想您可以将答案中提供的代码调整为 this question

    【讨论】:

    • 我应该提到它具有相同的域。动态更新的内容位于我无法访问的子目录中。我想这听起来有点傻,但这就是我所处的情况。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2019-01-13
    • 2018-05-31
    • 1970-01-01
    • 1970-01-01
    • 2015-07-04
    • 1970-01-01
    • 2021-10-15
    相关资源
    最近更新 更多