【问题标题】:How to get a HTML page using HtmlUnit如何使用 HtmlUnit 获取 HTML 页面
【发布时间】:2012-02-19 22:53:49
【问题描述】:

我知道你可能认为这个问题很愚蠢,但我需要使用 HtmlUnit。但是,它以 XML 或文本的形式返回页面。

我不知道如何获取纯 HTML(与浏览器返回的源代码相同)

我需要这个,因为我需要使用一些书面模块。有什么想法吗?

【问题讨论】:

标签: java htmlunit


【解决方案1】:

您可以使用以下代码来实现您的目标:

WebClient webClient = new WebClient();
Page page = webClient.getPage("http://example.com");
WebResponse response = page.getWebResponse();
String content = response.getContentAsString();

javadocs of the WebResponse.html#getContentAsString() method

【讨论】:

  • 谢谢! :) 我在看到你的评论之前发现了它!
  • 但是有一个问题,它没有显示 标签中的文本!
  • webClient.getOptions().setJavaScriptEnabled(true) - 添加这个
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-02-12
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多