【发布时间】:2017-04-04 18:05:28
【问题描述】:
我正在尝试通过此 ligne 代码从 jsoup 中的维基百科页面获取网址:
Elements linksOnPage = document.select("a[href~=\"/wiki/\"(([A-Za-z])*|_)]");
获取链接看起来像:https://en.wikipedia.org/wiki/United_Stat 或 https://en.wikipedia.org/wiki/English_people ....etc,但它对我不起作用,所以我希望从匹配的标签中获取链接:/wiki/[A- Za-z]*|_ 而不是这样的:https://en.wikipedia.org/wiki/Wikipedia:Administrators%27_noticeboard
【问题讨论】:
标签: java regex web-crawler jsoup wikipedia