【发布时间】:2014-08-06 16:37:21
【问题描述】:
我成功地从 a[@href] 中的网络获取值,但我收到的所有值都不需要。我在网络源中看到我不想要的元素如下:
<a href="http//www.notneeded.com/xxxxxxxxxxxxxgcid=C12289x460&amp;keyword=xxxxxxx">1,507 available from $122</a>"
我需要的所有值都是这样的:
<a href="http//differenturl.com/xxx/xxx/_/id/245/xxxx;xxxx">needed value;M</a>
所有需要的值都是这样开始的:
<a href="http://differenturl.com/xxx/xxx/
然后 id 和值显然与我需要的不同。
请告诉我如何在我将拥有的代码中设置,而不是所有的“a hrefs”,它们的值以“http://differenturl.com/xxx/xxx/”开头的特定a hrefs
对不起我的英语。
代码如下:
var teams = from hyperlink in teamTags.SelectNodes(".//a[@href]")
where hyperlink != null
select hyperlink.InnerText;
谢谢!
【问题讨论】:
标签: xml linq parsing html-agility-pack