【发布时间】:2012-03-27 17:22:43
【问题描述】:
我想检索一组结果,其中包含由(循环)一个请求表单字段的所有选项产生的所有结果。
我正在使用 Java 语言和 HtmlUnit API。
我已经设法使用 URL 来“填充”字段的变量来完成这个循环表单填充(我不知道它是否是最好的方法,实际上我很担心它是最糟糕的方法之一......但它是我可以用我所拥有的知识做的事)。
但我无法弄清楚如何让程序提交表单以到达结果页面,以及如何在移动到下一个页面之前下载(scrape)该页面。
注意事项:
-如果您有更好的方式填写“请求表”,我们也欢迎。
更新:
这解决了使用 HtmlUnit API 时的问题(谢谢touti):
HtmlPage resultado = pageNow.getElementByName("buscar").click();
System.out.println(resultado.asText());
一种比同时加载请求和响应页面更好的方法仍然非常受欢迎!
【问题讨论】:
标签: java javascript forms post screen-scraping