【问题标题】:How to Convert an HTML String to XML DOM如何将 HTML 字符串转换为 XML DOM
【发布时间】:2012-08-23 16:46:49
【问题描述】:

我正在使用 HTTP 客户端 4.1.2。我想访问 Outlook Web 并获取邮件数据。这是我所做的代码。

CredentialsProvider credsProvider = new BasicCredentialsProvider();
    credsProvider.setCredentials(new AuthScope(AuthScope.ANY_HOST,         
            AuthScope.ANY_PORT,AuthScope.ANY_REALM, AuthPolicy.BASIC),
    new UsernamePasswordCredentials(Username, password));
DefaultHttpClient Client= new DefaultHttpClient();
HttpContext localContext = new BasicHttpContext();

 HttpGet get= new HttpGet(uri);
 HttpEntity entity = response.getEntity();

String html=null;   
if(!entity.equals(null)){
html=EntityUtils.toString(entity,HTTP.UTF_8);
}

输出是来自String的HTML页面。如何将其转换为XML?

【问题讨论】:

    标签: java xml html-parsing


    【解决方案1】:

    从技术上讲,格式良好的 HTML 是 XML 的一种形式,或者至少这是我们的目标。

    但我们在这里谈论的是微软......

    我使用 Cobra 与 HTML 交互,就像它是 XML 一样,允许我使用 xPath 之类的东西来搜索文档或访问普通的旧 DOM。

    【讨论】:

    • 如果我可以将 HTML 转换为普通 DOM,我可以获取数据
    • 如果您使用 Cobra(并且 HTML 格式良好),那么您已经使用了(拥有 DOM)...... 是的......
    • 谢谢。我会试试 Cobra
    猜你喜欢
    • 1970-01-01
    • 2021-04-27
    • 2011-03-07
    • 2020-09-28
    • 2015-07-11
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多