【发布时间】:2018-07-29 05:24:12
【问题描述】:
我终于让 IntelliJ 工作了。我正在使用下面的代码。它工作完美。我需要它一遍又一遍地循环并从电子表格中提取链接,以一遍又一遍地找到不同商品的价格。我有一个电子表格,其中 C 列从第 2 行开始有几个示例 URL。如何让 JSOUP 使用此电子表格中的 URL,然后输出到 D 列?
public class Scraper {
public static void main(String[] args) throws Exception {
final Document document = Jsoup.connect("examplesite.com").get();
for (Element row : document.select("#price")) {
final String price = row.select("#price").text();
System.out.println(price);
}
}
提前感谢您的帮助! 埃里克
【问题讨论】:
-
看来你这里有三个问题。 1.读取xls文件,2.用Jsoup抓取,3.编辑保存xls文件。
-
克里斯蒂安,感谢您的回复。你什么意思?该程序现在完美运行,它从我需要的站点读取我需要的内容。我只需要它从工作表中拉出然后导出到工作表,你有什么想法吗? XLS 比 CSV 更受欢迎吗?再次感谢。
-
XLS 不优于 CSV,但重要的是要知道您要阅读和编辑哪一个。 CSV 可以逐行读取为文本文件,但 XLS 需要额外的库。那么它是 XLS 还是 CSV? C 列是最后一个吗?
-
Krystian,可以是任何格式!现在我们的工作表设置为 Product ID |产品名称 |网址 |价格 | URL 是我们试图从中提取的内容,而 Price 是我们希望提取的数据去往的地方。该视频可能与我正在尝试的类似,所以它一定是可能的,但我根本不确定如何到达那里! youtube.com/watch?v=gdi_uekRTeA
标签: java excel web-crawler jsoup scrape