【问题标题】:Web Data Extraction and Form fillingWeb 数据提取和表单填写
【发布时间】:2015-06-08 15:16:08
【问题描述】:

我目前正在开始从 Web 平台开发(UI?)备份。这不是我们的平台,我无权访问源代码。

我只有我输入的元素的表单数据的 HTML 渲染视图。

所以任务是浏览到 HTML,存储数据 (XML/JSON),然后登录网站再次填写表单以重新提交数据...

目前我正在使用 C++ QtWebEngine 进行原型设计。

完成此类任务的最佳方法是什么?什么是“浏览”网络和分析 HTML 的好框架?

首选 c++/java/javascript(或 firefox 插件?)中的解决方案。

感谢您的帮助!

【问题讨论】:

    标签: java javascript c++ firefox-addon-sdk


    【解决方案1】:

    与 DSL 语言解释器一样使用“文档对象模型 (DOM)” 我的建议:C# webform 应用程序和 webbrowser 控件:

    • webbrowser.navigate([url])
    • WebBrowser.DocumentCompleted 事件
    • WebBrowser.Document(阅读有关“System.Windows.Forms.HtmlDocument”的文档和帮助)
    • 可能需要在
    • 中注入一些java脚本

    /* 请不要将此信息用于黑客攻击 */

    【讨论】:

    • 感谢您的建议,但我在 Linux 下工作,并不想深入研究 Mono。 (我只是想将它用于所用平台不提供的备份/恢复)
    【解决方案2】:

    您绝对可以使用 Firefox 的 Addon SDK 来做这样的事情。特别是您应该查看PageWorker 模块,该模块允许您在不显示页面的情况下加载和运行针对网页的 JS 代码 - 一切都在后台进行。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2019-04-10
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-07-30
      • 1970-01-01
      • 2013-06-25
      • 1970-01-01
      相关资源
      最近更新 更多