【发布时间】:2012-07-12 01:29:19
【问题描述】:
我正在使用 WatiN 并尝试根据字段类从网络链接中抓取图像 URL。查看站点代码图像信息显示如下:
//images code
<div class="doc-banner-icon">
<img src="https://website.com/image.jpg">
</div>
//text code
<div id="doc-original-text">
Once upon a time, in a land far far away...
</div>
我想要做的是使用 WatiN 调用来查找 img 链接。我想我可以使用类似Find.ByClass() 调用来专门查找代码的那个区域,但我似乎无法弄清楚如何获取该类中包含的文本行。当我在不同的字段上使用Find.ById() 并发送到字符串时,它会提取该区域的文本内容。下面是我正在尝试的。
using (myIE)
{
//loads the website
myIE.GoTo(txtbxWeblink.Text);
string infoText = myIE.Div(Find.ByClass("doc-banner-icon")).ToString();
//This will successfully return the text fields text.
string imageText = myIE.Div(Find.ById("doc-original-text")).ToString();
}
编辑 - 看来我可能需要在 myIE 上使用不同的调用,还有 myIE.Image、myIE.Link 等,我对此知之甚少,所以不确定Div是正确的选择。
【问题讨论】:
标签: c# html winforms watin scrape