MySQL正则表达式

使用MySQL正则表达式 __MySQL必知必会

正则表达式作用是匹配方本,将一个模式(正则表达式)与一个文本串进行比较。

MySQL用WHERE子句对正则表达式提供了初步的支持,允许你指定用正则表达式过滤SELECT检索出的数据。

MySQL仅支持多数正则表达式实现的一个很小的子集。


9.2.1  基本字符匹配

REGEXP后所跟的东西作为正则表达式处理。

复制代码

1 2 3 4 5 6 7 SELECT prod_name FROM products WHERE prod_name REGEXP 8 9 ' 10 11 1000 12 13 ' 14 15 ORDER BY prod_name; 16 17 ------ 18 19 返回 20 21 ------ 22 23 24 25 +------------------------+ 26 27 28 29 | 30 31 prod_name 32 33 | 34 35 36 37 +------------------------+ 38 39 40 41 | 42 43 JetPack 44 45 1000 46 47 48 49 | 50 51 52 53 +------------------------+ 54 55 56 57

复制代码

 

 

.  表示匹配任意一个字符。

复制代码

1 2 3 4 5 6 7 SELECT prod_name FROM products WHERE prod_name REGEXP 8 9 ' 10 11 .000 12 13 ' 14 15 ORDER BY prod_name; 16 17 ------------ 18 19 返回 20 21 ----------- 22 23 24 25 +-------------------------+ 26 27 28 29 | 30 31 prod_name 32 33 | 34 35 36 37 +-------------------------+ 38 39 40 41 | 42 43 JetPack 44 45 1000 46 47 48 49 | 50 51 52 53 | 54 55 JetPack 56 57 2000 58 59 60 61 | 62 63 64 65 +-------------------------+ 66 67 68 69

复制代码

 

MySQL中的正则表达式匹配不区分大小写。

为区分大小写,可使用BINARY关键字。

如:WHERE prod_name REGEXP BINARY 'JetPack .000'

 

9.2.2  进行OR匹配

为搜索两个串之一(或者这个串,或者为另一个串),使用 | 。

| 作为OR操作符,表示匹配其中之一。可给出两个以上的OR条件。

复制代码

1 2 3 4 5 6 7 SELECT prod_name FROM products WHERE prod_name REGEXP 8 9 ' 10 11 1000 | 2000 12 13 ' 14 15 ORDER BY prod_name; 16 17 ------------ 18 19 返回 20 21 ------------ 22 23 24 25 +----------------------+ 26 27 28 29 | 30 31 prod_name 32 33 | 34 35 36 37 +----------------------+ 38 39 40 41 | 42 43 JetPack 44 45 1000 46 47 48 49 | 50 51 52 53 | 54 55 JetPack 56 57 2000 58 59 60 61 | 62 63 64 65 +----------------------+ 66 67 68 69

复制代码

 

[ ] 匹配任何单一字符。

[123]定义一组字符,意思是匹配1或2或3.

[ ]是另外一种形式的OR语句,[123] Ton  就是  [1 | 2 | 3] Ton 的缩写。

^ 否定一个字符集合,将匹配除指定字符外的任何东西。[^123]将匹配除这些字符外的任何东西。

复制代码

1 2 3 4 5 6 7 SELECT prod_name FROM products WHERE prod_name REGEXP 8 9 ' 10 11 [123] Ton 12 13 ' 14 15 ORDER BY prod_name; 16 17 ------------- 18 19 返回 20 21 ------------ 22 23 24 25 +--------------------+ 26 27 28 29 | 30 31 prod_name 32 33 | 34 35 36 37 +--------------------+ 38 39 40 41 | 42 43 44 45 1 46 47 ton anvil 48 49 | 50 51 52 53 | 54 55 56 57 2 58 59 ton anvil 60 61 | 62 63 64 65 +--------------------+ 66 67 68 69

复制代码

 

匹配范围

[0123456789] 或 [0-9] 将匹配数字0到9

[a-z] 匹配任意字母符号

复制代码

1 2 3 4 5 6 7 SELECT prod_name FROM products WHERE prod_name REGEXP 8 9 ' 10 11 [1-5] Ton 12 13 ' 14 15 ORDER BY prod_name; 16 17 ---------- 18 19 返回 20 21 ----------- 22 23 24 25 +-------------------+ 26 27 28 29 | 30 31 prod_name 32 33 | 34 35 36 37 +-------------------+ 38 39 40 41 | 42 43 . 44 45 5 46 47 ton anvil 48 49 | 50 51 52 53 | 54 55 56 57 1 58 59 ton anvil 60 61 | 62 63 64 65 | 66 67 68 69 2 70 71 ton anvil 72 73 | 74 75 76 77 +-------------------+ 78 79 80 81

复制代码

 

匹配特殊字符

\  为前导。即转义.正则表达式内具有特殊意义的所有字符都必须以这种方式转义。

\-  表示查找 -

\.  表示查找 .

复制代码

1 2 3 4 5 6 7 SELECT prod_name FROM vendors WHERE vend_name REGEXP 8 9 ' 10 11 \\. 12 13 ' 14 15 ORDER BY vend_name; 16 17 ------------- 18 19 返回 20 21 ------------- 22 23 24 25 +----------------------+ 26 27 28 29 | 30 31 vend_name 32 33 | 34 35 36 37 +----------------------+ 38 39 40 41 | 42 43 Furball Inc. 44 45 | 46 47 48 49 +----------------------+ 50 51 52 53

复制代码

 

\  也用来引用元字符(具有特殊意义的字符)

1 2 3 4 5 6 7 \\f 换页 \\n 换行 \\r 回车 \\t 制表 \\v 纵向制表 8 9 10 11

 

匹配字符类

复制代码

1 2 3 4 5 6 7 [:a;num:] 任意字母和数字(同 [a 8 9 - 10 11 zA 12 13 - 14 15 Z0 16 17 - 18 19 9 20 21 ][:alpha:] 任意字符(同 [a 22 23 - 24 25 zA 26 27 - 28 29 Z][:blank:] 空格和制表(同 [\\t][:cntrl:] ASCII控制字符(ASCII 0到31和127) [:digit:] 任意数字(同[0 30 31 - 32 33 9 34 35 ][:graph:][ 36 37 " 38 39 print:] 相同,但不包括空格 40 41 42 43 [:lower:] 任意小写字线(同 [a 44 45 - 46 47 z][: 48 49 print 50 51 :] 任意可打印字符 [:punct:] 既不在 [:alnum:] 又不在 [:cntrl:] 中的任意字符 [space:] 包括空格在内的任意空白字符(同 [\\f\\n\\t\\r\\v][:upper:] 任意大小字母(同 [A 52 53 - 54 55 Z][:xdigit:] 任意十六进制数字(同 [a 56 57 - 58 59 fA 60 61 - 62 63 F0 64 65 - 66 67 9 68 69 ]70 71 72 73

复制代码

 

匹配多个实例

复制代码

1 2 3 4 5 6 7 元字符 说明 8 9 * 10 11 0个或多个匹配 12 13 + 14 15 1个或多个匹配(等于 { 16 17 1 18 19 , }) ? 0个或1个匹配(等于 {0, 20 21 1 22 23 }{n} 指定数目的匹配 {n, } 不少于指定数目的匹配 {n ,m} 匹配数目的范围(m不超过255) 24 25 26 27

复制代码

 

以下例子:s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现。

复制代码

1 2 3 4 5 6 7 SELECT prod_name FROM products WHERE prod_name REGEXP 8 9 ' 10 11 \\([0-9] sticks?\\) 12 13 ' 14 15 ORDER BY prod_name; 16 17 ------------ 18 19 返回 20 21 ------------ 22 23 24 25 +-----------------------+ 26 27 28 29 | 30 31 prod_name 32 33 | 34 35 36 37 +-----------------------+ 38 39 40 41 | 42 43 TNT ( 44 45 1 46 47 stick) 48 49 | 50 51 52 53 | 54 55 TNT ( 56 57 5 58 59 sticks) 60 61 | 62 63 64 65 +-----------------------+ 66 67 68 69

复制代码

 

匹配连在一直的4位数字:WHERE prod_name REGEXP '[[:digit:]]{4}'

 

定位符

1 2 3 4 5 6 7 ^ 8 9 文本的开始 $ 文本的末尾 [[: 10 11 < 12 13 :]] 词的开始 [[: 14 15 > 16 17 :]] 词的结尾 18 19 20 21

 

复制代码

1 2 3 4 5 6 7 SELECT prod_name FROM products WHERE prod_name REGEXP 8 9 ' 10 11 ^[0-9\\.] 12 13 ' 14 15 ORDER BY prod_name; 16 17 ----------- 18 19 返回 20 21 ---------- 22 23 24 25 +---------------------+ 26 27 28 29 | 30 31 prod_name 32 33 | 34 35 36 37 +---------------------+ 38 39 40 41 | 42 43 . 44 45 5 46 47 ton anvil 48 49 | 50 51 52 53 | 54 55 56 57 1 58 59 ton anvil 60 61 | 62 63 64 65 | 66 67 68 69 2 70 71 ton anvil 72 73 | 74 75 76 77 +---------------------+ 78 79 80 81

复制代码

 

^的双重用途:在集合中(用[ ]定义),用它来否定该集合。否则,用来指串的开始和。

LIKE 匹配整个串,而REGEXP匹配子串。

    简单的正则表达式测试  可以在不使用数据库的情况下用SELECT来测试正则表达式。

    REGEXP检查总是返回0(没有匹配)或1(匹配),可以用带文字串的REGEXP来测

    试表达式,并试验它们。相应的语法如下:

        SELECT 'hello' REGEXP '[0-9]'

    这个例子返回0(因为文本hello中没有数字)。

代码交流 2021