先来看个例子

    final static String text = "<b>999</b>www.chinoukin&<b>888</b>";
    final static String regex = "<b>.*</b>";

    public static void main(String[] args) {
        Pattern r = Pattern.compile(regex);
        Matcher m = r.matcher(text);
        while (m.find()) {
            String res = m.group();
            System.out.println(res);
        }
    }

预想输出结果

<b>999</b>
<b>888</b>

实际输出结果

<b>999</b>www.chinoukin.com&<b>888</b>

很显然这个正则表达式已经被贪婪的匹配了,不是我们想要的结果
分析:
将字符串拆成2段如下:

第一段:<b>
第二段:999</b>www.chinoukin.com&<b>888</b>

可以发现第二段也满足了正则表达式的后半部分“.*</b>”

方案一
正则表达式尽量准确,让其更细粒度的匹配,此时可以将正则表达式修改为

    final static String regex = "<b>\\d*</b>";

方案二
使用非贪婪模式,可以将正则表达式修改为

    final static String regex = "<b>.*?</b>";

?在正则表达式中也有另外一个作用,就是打开非贪婪的模式,组内第一次匹配就返回结果

更多推荐

正则表达式-非贪婪匹配