正则表达式的基本概念

正则表达式,又称规则表达式是计算机科学的一个概念。

(英语:Regular Expression,在代码中常简写为regex、regexp或RE)

正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,

就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

正则表达式是一种文本模式,该模式描述在搜索文本时要匹配的一个或多个字符串。

正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

许多程序设计语言都支持利用正则表达式进行字符串操作。

顾名思义,就是一个有规则的表达式,按照这个规则的表达式去搜索匹配这个规则的字符串。

如AXXX;BXXX;这种规则表达式。

 

正则表达式在数据库的应用

MySQL可以通过 LIKE ...% 来进行模糊匹配。

%、_、[a-d]与一些字符组合而成的匹配规则式就是正则表达式,这是在SQL里最常用的用法。

 

更复杂的正则表达式

MySQL 同样也支持其他正则表达式的匹配, MySQL中使用 REGEXP 操作符来进行正则表达式匹配。

如果您了解PHP或Perl,那么操作起来就非常简单,因为MySQL的正则表达式匹配与这些脚本的类似。

一般这种复杂的写法不用,用%、_、[abc]这些匹配模式基本也够用了。

下表中的正则模式可应用于 REGEXP 操作符中。

模式描述
^匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置。='a%'
$匹配输入字符串的结束位置。如果设置了RegExp 对象的 Multiline 属性,$ 也匹配 '\n' 或 '\r' 之前的位置。='%a'
.匹配除 "\n" 之外的任何单个字符。要匹配包括 '\n' 在内的任何字符,请使用像 '[.\n]' 的模式。
[...]字符集合。匹配所包含的任意一个字符。例如, '[abc]' 可以匹配 "plain" 中的 'a'。只匹配单个字符,该字符在方括号内即可。
[^...]负值字符集合。匹配未包含的任意字符。例如, '[^abc]' 可以匹配 "plain" 中的'p'。^是否定意思的脱字号。只匹配单个字符,该字符在方括号内即可。
p1|p2|p3匹配 p1 或 p2 或 p3。例如,'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 则匹配 "zood" 或 "food"。
*匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。
+匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。
{n}n 是一个非负整数。匹配确定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的两个 o。 ='%oo%',当然也会匹配到fooo,因为也符合%oo%。
{n,m}m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,o{2,5},匹配2到5个o。也没有限制前后是否还可以再出现o,如果大于5也是可以匹配到的。因为foooooooo也符合该表达式。

 

实例

了解以上的正则需求后,我们就可以根据自己的需求来编写带有正则表达式的SQL语句。

以下我们将列出几个小实例(表名:person_tbl )来加深我们的理解:

 

查找name字段中以'st'为开头的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP '^st';

等于SELECT name FROM person_tbl WHERE name like 'st%';

 

查找name字段中以'ok'为结尾的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP 'ok$';

 

查找name字段中包含'mar'字符串的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP 'mar';

 

查找name字段中以元音字符开头或以'ok'字符串结尾的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP '^[aeiou]|ok$';

I为‘或’ = or

 

更多推荐

SQL——正则表达式