先来看个例子
final static String text = "<b>999</b>www.chinoukin&<b>888</b>";
final static String regex = "<b>.*</b>";
public static void main(String[] args) {
Pattern r = Pattern.compile(regex);
Matcher m = r.matcher(text);
while (m.find()) {
String res = m.group();
System.out.println(res);
}
}
预想输出结果
<b>999</b>
<b>888</b>
实际输出结果
<b>999</b>www.chinoukin.com&<b>888</b>
很显然这个正则表达式已经被贪婪的匹配了,不是我们想要的结果
分析:
将字符串拆成2段如下:
第一段:<b>
第二段:999</b>www.chinoukin.com&<b>888</b>
可以发现第二段也满足了正则表达式的后半部分“.*</b>”
方案一
正则表达式尽量准确,让其更细粒度的匹配,此时可以将正则表达式修改为
final static String regex = "<b>\\d*</b>";
方案二
使用非贪婪模式,可以将正则表达式修改为
final static String regex = "<b>.*?</b>";
?在正则表达式中也有另外一个作用,就是打开非贪婪的模式,组内第一次匹配就返回结果
更多推荐
正则表达式-非贪婪匹配
发布评论