【发布时间】:2014-11-06 14:37:28
【问题描述】:
我使用这行代码来提取两个字符串“Origin”和“//”之间的所有文本。我试图排除所有数字,但这不起作用,它会抓取包括数字在内的所有内容。我的正则表达式不正确吗?
Pattern p = Pattern.compile(Pattern.quote("ORIGIN") + "(.*?[^0-9])" + Pattern.quote("//"), Pattern.DOTALL);
【问题讨论】:
-
例子会更好。
-
您的正则表达式显然不符合您的解释建议;你至少能明白为什么吗? (提示:
[^0-9]上没有量词) -
是的,我尝试了 [^0-9]+,但也没有用。我迷路了!
标签: java regex web-scraping