【问题标题】:Selenium web scraping information into a listSelenium 网页抓取信息到列表中
【发布时间】:2015-05-13 00:16:15
【问题描述】:

我想从以下网站链接中抓取 ISBN 号:http://bookscouter.com/tools/recent.php

我想从列表中每本书的粗体明文中提取 ISBN 编号,并将它们全部放入一个数组中。我打算通过使用 xPath 来做到这一点,但这就是我有点卡住的地方。由于我是 selenium w/Java 的新手,我很难理解如何让整个事情正常工作。我知道每本书的每个 ISBN 号码都位于一个名为“recent-table”的表类中,但我并不完全熟悉如何从那里开始。任何指导将不胜感激。谢谢。

【问题讨论】:

    标签: java selenium xpath selenium-webdriver selenium-ide


    【解决方案1】:

    假设您想要包含 ISBN 的文本

    以下代码将等待 10 秒加载所有元素并返回一个列表。之后打印所有元素的文本。

    By byXpath = By.xpath("//strong[contains(text(),'ISBN')]");
    
    List<WebElement> iSBNList = (new WebDriverWait(driver , 10).until(ExpectedConditions.presenceOfAllElementsLocatedBy(byXpath)));
    
    for (WebElement element :iSBNList){
        System.out.println(element.getText());
    }
    

    【讨论】:

    • 感谢您的帮助。这对我有很大帮助。那么这段代码将返回一个列表,其中包含页面上的第一个 ISBN 或所有 ISBN 编号?看起来它只是第一个 ISBN,但我想先和你确认一下。
    • @John123 它是页面上所有 ISBN 的列表
    • 感谢您的澄清。
    猜你喜欢
    • 2021-07-03
    • 1970-01-01
    • 1970-01-01
    • 2016-08-28
    • 2020-03-17
    • 2018-11-13
    • 2013-11-13
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多