【发布时间】:2015-04-07 15:39:35
【问题描述】:
我在尝试使用 HtmlAgilityPack 库解析这些 html 内容时遇到了很大的麻烦。
在这段代码中,我想只检索引用 uploaded.net 的 url (href),但我无法确定该 url引用它。
<div class='downloads' id='download_block'>
<h5 style='text-align:center'>FREE DOWNLOAD LINKS</h5>
<h4>uploadable.ch</h4>
<ul class='parts'>
<li>
<a href="http://url/..." target="_blank"> text here</a>
</li>
</ul>
<h4>uploaded.net</h4>
<ul class='parts'>
<li>
<a href="http://url/..." target="_blank"> text here</a>
</li>
</ul>
<h4>novafile.com</h4>
<ul class='parts'>
<li>
<a href="http://url/..." target="_blank"> text here</a>
</li>
</ul>
</div>
这是网页上的样子
这就是我所拥有的:
nodes = myHrmlDoc.DocumentNode.SelectNodes(".//div[@class='downloads']/ul[@class='parts']")
我不能只使用数组索引来确定位置,例如:
nodes(0) = uploadable.ch node
nodes(1) = uploaded.net node
nodes(2) = novafile.com node
...因为它们可以更改节点的数量及其托管位置。
请注意,网址也不包含主机名称,重定向如下:
http://xxxxxx/r/YEHUgL44xONfQAnCNUVw_aYfY5JYAy0DT-i--
在 C# 或 VB.Net 中我能做什么?
【问题讨论】:
标签: c# html .net vb.net html-agility-pack