如何使用 WatiN 按类查找和抓取？答案

【问题标题】：How can I find and scrape by Class using WatiN?如何使用 WatiN 按类查找和抓取？
【发布时间】：2012-07-12 01:29:19
【问题描述】：

我正在使用 WatiN 并尝试根据字段类从网络链接中抓取图像 URL。查看站点代码图像信息显示如下：

//images code
<div class="doc-banner-icon">
    <img src="https://website.com/image.jpg">
</div>

//text code
<div id="doc-original-text">
    Once upon a time, in a land far far away...
</div>

我想要做的是使用 WatiN 调用来查找 img 链接。我想我可以使用类似Find.ByClass() 调用来专门查找代码的那个区域，但我似乎无法弄清楚如何获取该类中包含的文本行。当我在不同的字段上使用Find.ById() 并发送到字符串时，它会提取该区域的文本内容。下面是我正在尝试的。

using (myIE)
{
    //loads the website
    myIE.GoTo(txtbxWeblink.Text);            

    string infoText = myIE.Div(Find.ByClass("doc-banner-icon")).ToString();

    //This will successfully return the text fields text.
    string imageText = myIE.Div(Find.ById("doc-original-text")).ToString();
}

编辑 - 看来我可能需要在 myIE 上使用不同的调用，还有 myIE.Image、myIE.Link 等，我对此知之甚少，所以不确定Div是正确的选择。

【问题讨论】：

标签： c# html winforms watin scrape

【解决方案1】：

试试这个...

string infoText = myIE.Div(Find.ByClass("doc-banner-icon")).Images.First().Src;
string imageText = myIE.Div(Find.ById("doc-original-text")).Text;

【讨论】：

繁荣，谢谢您，先生。这很完美。甚至只返回了网址！完美。