【发布时间】:2012-01-20 11:43:00
【问题描述】:
我正在开发一个应用程序,我必须在其中从网站获取数据。网站格式为:
<div id="id1" class="class1">
<ol class="cls_ol">
<li>
<div class="class2">Content 1</div>
<div class="cls_img">
*** Code for some image ***
</div>
Content 2
</li>
<li> *** Same like above <li> *** </li>
<li> *** Same like above <li> *** </li>
</ol>
</div>
我使用代码来获取这个...
protected void Button1_Click(object sender, EventArgs e)
{
var obj = new HtmlWeb();
var document = obj.Load(" ** url of a website ** ");
var bold = document.DocumentNode.SelectNodes("//div[@class='class1']");
foreach (var i in bold)
{
Response.Write(i.InnerHtml);
}
但是,我的代码的问题是,它还获取了<div class="cls_img"></div> 的图像。我不需要这张图。那么,如何在不从<div class="cls_img">获取图像的情况下获取<div id="id1" class="class1">的所有内容。
【问题讨论】:
标签: c# .net html-agility-pack