【发布时间】:2011-10-14 16:40:49
【问题描述】:
在 HTML Agility Pack 方面需要一些帮助!
基本上我想用 HTML 的 body 节点抓取 plain-text。 到目前为止,我已经在 vb.net 中尝试过,但它无法返回内部文本含义 没有看到任何变化,至少从我所看到的来看。
Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)
Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")
If Not htmldoc Is Nothing Then
For Each node In paragraph
node.ParentNode.RemoveChild(node, True)
Next
End If
Return htmldoc.DocumentNode.WriteContentTo
我试过这个:
Return htmldoc.DocumentNode.InnerText
但还是没有运气!
有什么建议吗???
【问题讨论】:
标签: c# html vb.net html-agility-pack