【发布时间】:2012-02-29 21:05:04
【问题描述】:
您好,我正在尝试使用 HTML Agilty Pack 解析网页以获取图像的 src。这是页面的结构。
<div class="post_body">
<div style="text-align: center;">
<a href="http://www.engadget.com/2012/02/29/qualcomm-windows-8/">
<img src="http://www.blogcdn.com/www.engadget.com/media/2012/02/201202297192-1330536971.jpg" style="border-width: 0px; border-style: solid; margin: 4px;">
</a>
</div>
<div>
现在我正在使用此代码来尝试获取 src
HtmlWeb hw = new HtmlWeb();
HtmlDocument doc = hw.Load("http://www.engadget.com/2012/02/29/qualcomm-windows-8");
HtmlNode baseNode = doc.DocumentNode.SelectSingleNode("//div[@class='post_content permalink ']");
string Description = baseNode.SelectSingleNode("//div[@class='post_body']").InnerText.Replace("\n", "").Replace("\r", "").Trim();
string href = baseNode.SelectSingleNode("//div[@class='post_body']//img[@src]").InnerText;
但是字符串总是返回 null :/
有什么想法可能是我的 xpath 表达式不好?
【问题讨论】: