【发布时间】:2012-05-22 14:13:38
【问题描述】:
我正在使用 jsoup 解析一些页面的链接,然后使用 httpclient 来测试链接以查看它们是否正常工作。我页面上的一些链接是 ,我想忽略这些。
当我的代码尝试从中获取链接时,它返回空白。我可以从我的支票中排除所有空白,但有时我的网站上创建的链接可能是空白的(偶然),我想捕获这些空白以便我可以修复。
所以我想要做的是能够识别一个链接何时是一个 javascript 弹出窗口,这样我就可以忽略这个特定链接上的链接测试。我解析链接的代码如下:
private void setLinks(){
String link;
try {
Document doc = response.parse();
Elements element = doc.select(htmlElementTarget+" a[href]");
for (Element page : element){
link = page.absUrl("href");
if (validateUrl(link)){
linksText.add(page.text());
links.add(link);
}
}
} catch (IOException e) {
System.out.println(e);
}
}
欢迎对我的代码提出任何其他批评
【问题讨论】:
-
我希望能够识别链接何时是 javascript 弹出窗口,href 返回空白。我希望能够检查它是否是 javascript 弹出窗口,但不知道如何。