【发布时间】:2015-04-11 15:06:28
【问题描述】:
我将网页的文本存储在字符串中。但是网页的某些内容没有存储在字符串中。我不知道为什么不存储类似 div 的元素中的内容。即使是 div 内的链接也无法使用我实现的网络爬虫访问。谁能帮我解决这个问题!!!。
List<String> tags = new ArrayList<String>();
for(int i=0;i<8;i++)
{
Document doc = Jsoup.connect("some link here").get();
Elements taglinks = doc.select("html");
for (Element link : taglinks) {
tags.add(link.text());}
System.out.println(tags);
【问题讨论】:
-
你能分享一些你到目前为止尝试过的代码吗?
-
请编辑您的答案,而不是在 cmets 中添加您的代码
-
它适用于某些链接,但不适用于所有链接
标签: java html web web-crawler jsoup