【问题标题】:How to programmatically submit a filled form and scrape the resulting page?如何以编程方式提交填写的表单并抓取结果页面?
【发布时间】:2012-03-27 17:22:43
【问题描述】:

我想检索一组结果,其中包含由(循环)一个请求表单字段的所有选项产生的所有结果。

我正在使用 Java 语言和 HtmlUnit API。

我已经设法使用 URL 来“填充”字段的变量来完成这个循环表单填充(我不知道它是否是最好的方法,实际上我很担心它是最糟糕的方法之一......但它是我可以用我所拥有的知识做的事)。

但我无法弄清楚如何让程序提交表单以到达结果页面,以及如何在移动到下一个页面之前下载(scrape)该页面。

注意事项:

-如果您有更好的方式填写“请求表”,我们也欢迎。


更新:

这解决了使用 HtmlUnit API 时的问题(谢谢touti):

HtmlPage resultado = pageNow.getElementByName("buscar").click();
System.out.println(resultado.asText());

一种比同时加载请求和响应页面更好的方法仍然非常受欢迎!

【问题讨论】:

    标签: java javascript forms post screen-scraping


    【解决方案1】:

    您可以使用 Jquery 模拟单击​​您的提交输入,如下所示 $("#submit_id").trigger("click");

    【讨论】:

    • 是的,谢谢...我忘记告诉我使用的是什么 API [已修复]...并且无法弄清楚 click() 的事情...
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-05-17
    • 2012-05-11
    • 1970-01-01
    • 2020-10-03
    • 2010-11-22
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多