Selenium 网页抓取信息到列表中

【问题标题】：Selenium web scraping information into a listSelenium 网页抓取信息到列表中
【发布时间】：2015-05-13 00:16:15
【问题描述】：

我想从以下网站链接中抓取 ISBN 号：http://bookscouter.com/tools/recent.php

我想从列表中每本书的粗体明文中提取 ISBN 编号，并将它们全部放入一个数组中。我打算通过使用 xPath 来做到这一点，但这就是我有点卡住的地方。由于我是 selenium w/Java 的新手，我很难理解如何让整个事情正常工作。我知道每本书的每个 ISBN 号码都位于一个名为“recent-table”的表类中，但我并不完全熟悉如何从那里开始。任何指导将不胜感激。谢谢。

【问题讨论】：

标签： java selenium xpath selenium-webdriver selenium-ide

【解决方案1】：

假设您想要包含 ISBN 的文本

以下代码将等待 10 秒加载所有元素并返回一个列表。之后打印所有元素的文本。

By byXpath = By.xpath("//strong[contains(text(),'ISBN')]");

List<WebElement> iSBNList = (new WebDriverWait(driver , 10).until(ExpectedConditions.presenceOfAllElementsLocatedBy(byXpath)));

for (WebElement element :iSBNList){
    System.out.println(element.getText());
}

【讨论】：

感谢您的帮助。这对我有很大帮助。那么这段代码将返回一个列表，其中包含页面上的第一个 ISBN 或所有 ISBN 编号？看起来它只是第一个 ISBN，但我想先和你确认一下。
@John123 它是页面上所有 ISBN 的列表
感谢您的澄清。