【问题标题】:How can I find and scrape by Class using WatiN?如何使用 WatiN 按类查找和抓取?
【发布时间】:2012-07-12 01:29:19
【问题描述】:

我正在使用 WatiN 并尝试根据字段类从网络链接中抓取图像 URL。查看站点代码图像信息显示如下:

//images code
<div class="doc-banner-icon">
    <img src="https://website.com/image.jpg">
</div>

//text code
<div id="doc-original-text">
    Once upon a time, in a land far far away...
</div>

我想要做的是使用 WatiN 调用来查找 img 链接。我想我可以使用类似Find.ByClass() 调用来专门查找代码的那个区域,但我似乎无法弄清楚如何获取该类中包含的文本行。当我在不同的字段上使用Find.ById() 并发送到字符串时,它会提取该区域的文本内容。下面是我正在尝试的。

using (myIE)
{
    //loads the website
    myIE.GoTo(txtbxWeblink.Text);            

    string infoText = myIE.Div(Find.ByClass("doc-banner-icon")).ToString();

    //This will successfully return the text fields text.
    string imageText = myIE.Div(Find.ById("doc-original-text")).ToString();
}

编辑 - 看来我可能需要在 myIE 上使用不同的调用,还有 myIE.ImagemyIE.Link 等,我对此知之甚少,所以不确定Div是正确的选择。

【问题讨论】:

    标签: c# html winforms watin scrape


    【解决方案1】:

    试试这个...

    string infoText = myIE.Div(Find.ByClass("doc-banner-icon")).Images.First().Src;
    string imageText = myIE.Div(Find.ById("doc-original-text")).Text;
    

    【讨论】:

    • 繁荣,谢谢您,先生。这很完美。甚至只返回了网址!完美。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-12-26
    • 1970-01-01
    相关资源
    最近更新 更多