[转帖]正则表达式及在Jmeter中的应用

正则表达式,jmeter,应用 · 浏览次数 : 0

小编点评

**3.常用正则表达式及在线工具** * **正则表达式在线测试** | 菜鸟工具在线正则表达式测试 * **4.Jmeter之正则表达式提取器** * **4.2 View Results Tree 中Regular Exp.**的使用 View Results Tree 中Regular Exp. 可以验证正则表达式是否匹配到预期结果。 * **4.3 Dubug Sapmpler检测正常表达式取值正确性** * **4.5 Jmeter正则表达式提取数组类型的数据 eg** * **4.6 Jmeter正则表达式如何提取多个参数值 eg**

正文

目录

1.正则表达式

1.1 什么是正则表达式

1.2 为什么使用正则表达式

2.语法

2.1 普通字符

2.2 限定符

2.3 非打印字符

2.4 特殊字符

2.5 定位符

2.6 修饰符(标记)

2.7 选择

2.8 运算符优先级

3.常用正则表达式及在线工具

4.Jmeter之正则表达式提取器

4.1 Regular Expression Extractor

4.2 View Results Tree 中Regular Exp.的使用

4.3 Dubug Sapmpler检测正常表达式取值正确性

4.4 Jmeter 常用的正则表达式语法

4.5 Jmeter正则表达式提取数组类型的数据

4.6 Jmeter正则表达式如何提取多个参数值


1.正则表达式

1.1 什么是正则表达式

1)正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。

2)构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与运算符可以将小的表达式结合在一起来创建更大的表达式。

3)正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。

4)正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")组成的文字模式。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。

1.2 为什么使用正则表达式

1)测试字符串内的模式。

例如,可以测试输入字符串,以查看字符串内是否出现电话号码模式或信用卡号码模式。这称为数据验证。

2)替换文本。

可以使用正则表达式来识别文档中的特定文本,完全删除该文本或者用其他文本替换它。

3)基于模式匹配从字符串中提取子字符串。

可以查找文档内或输入域内特定的文本。

2.语法

2.1 普通字符

普通字符包括没有显式指定为元字符的所有可打印和不可打印字符。这包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号。

字符描述备注
[ABC]匹配 [...] 中的所有字符
[^ABC]匹配除了 [...] 中字符的所有字符
[A-Z][A-Z] 表示一个区间,匹配所有大写字母,[a-z] 表示所有小写字母。
.匹配除换行符(\n、\r)之外的任何单个字符,相等于 [^\n\r]。
[\s\S]匹配所有。\s 是匹配所有空白符,包括换行,\S 非空白符,不包括换行。
\w匹配字母、数字、下划线。等价于 [A-Za-z0-9_]

2.2 限定符

限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有 * 或 + 或 ? 或 {n} 或 {n,} 或 {n,m} 共6种。

限定符备注
*匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。
+匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。
?匹配前面的子表达式零次或一次。例如,"do(es)?" 可以匹配 "do" 、 "does" 中的 "does" 、 "doxy" 中的 "do" 。? 等价于 {0,1}。
{n}n 是一个非负整数。匹配确定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的两个 o。
{n,}n 是一个非负整数。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
{n,m}m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。

*和+限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个 ? 就可以实现非贪婪或最小匹配。

.*:贪婪匹配,即在匹配成功的情况下尽可能多的匹配

.*?:非贪婪匹配,即在匹配成功的情况下尽可能少的匹配

2.3 非打印字符

非打印字符也可以是正则表达式的组成部分。

非打印字符备注
\cx

匹配由x指明的控制字符。

例如: \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则,将 c 视为一个原义的 'c' 字符。
\f匹配一个换页符。等价于 \x0c 和 \cL。
\n匹配一个换行符。等价于 \x0a 和 \cJ。
\r匹配一个回车符。等价于 \x0d 和 \cM。
\s匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。注意 Unicode 正则表达式会匹配全角空格符。
\S匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\t匹配一个制表符。等价于 \x09 和 \cI。
\v匹配一个垂直制表符。等价于 \x0b 和 \cK。

2.4 特殊字符

特殊字符,就是一些有特殊含义的字符。若要匹配这些特殊字符,必须首先使字符"转义",即,将反斜杠字符\ 放在它们前面。

特别字符描述
$匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 '\n' 或 '\r'。要匹配 $ 字符本身,请使用 \$。
( )标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符,请使用
*匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 \*。
+匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 \+。
.匹配除换行符 \n 之外的任何单字符。要匹配 . ,请使用 \. 。
[标记一个中括号表达式的开始。要匹配 [,请使用 \[。
?匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。要匹配 ? 字符,请使用 \?。
\将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如, 'n' 匹配字符 'n'。'\n' 匹配换行符。序列 '\\' 匹配 "\",而 '\(' 则匹配 "("。
^匹配输入字符串的开始位置,除非在方括号表达式中使用,当该符号在方括号表达式中使用时,表示不接受该方括号表达式中的字符集合。要匹配 ^ 字符本身,请使用 \^。
{标记限定符表达式的开始。要匹配 {,请使用 \{。
|指明两项之间的一个选择。要匹配 |,请使用 \|。


2.5 定位符

定位符用来描述字符串或单词的边界。

定位符描述
^匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与 \n 或 \r 之后的位置匹配。
$匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与 \n 或 \r 之前的位置匹配。
\b匹配一个单词边界,即字与空格间的位置。
\B非单词边界匹配。

注意:不能将限定符与定位符一起使用。由于在紧靠换行或者单词边界的前面或后面不能有一个以上位置,因此不允许诸如 ^* 之类的表达式。

\b 字符的位置是非常重要的。如果它位于要匹配的字符串的开始,它在单词的开始处查找匹配项。如果它位于字符串的结尾,它在单词的结尾处查找匹配项。

\B 非单词边界运算符,位置并不重要,因为匹配不关心究竟是单词的开头还是结尾。

2.6 修饰符(标记)

标记也称为修饰符,正则表达式的标记用于指定额外的匹配策略。标记不写在正则表达式里,标记位于表达式之外。

修饰符含义描述
iignore - 不区分大小写将匹配设置为不区分大小写,搜索时不区分大小写: A 和 a 没有区别。
gglobal - 全局匹配查找所有的匹配项。
mmulti line - 多行匹配使边界字符 ^ 和 $ 匹配每一行的开头和结尾,记住是多行,而不是整个字符串的开头和结尾。
s特殊字符圆点 . 中包含换行符 \n默认情况下的圆点 . 是 匹配除换行符 \n 之外的任何字符,加上 s 修饰符之后, . 中包含换行符 \n。

2.7 选择

用圆括号 () 将所有选择项括起来,相邻的选择项之间用 | 分隔。

() 表示捕获分组,() 会把每个分组里的匹配的值保存起来, 多个匹配值可以通过数字 n 来查看(n 是一个数字,表示第 n 个捕获组的内容)。

但用圆括号会有一个副作用,使相关的匹配会被缓存,此时可用 ?: 放在第一个选项前来消除这种副作用。

非捕获元:?:  ?= ?!

?= :正向预查,在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜索字符串

?! :负向预查,在任何开始不匹配该正则表达式模式的位置来匹配搜索字符串

 ?=、?<=、?!、?<! 的使用区别:

exp1(?=exp2):查找 exp2 前面的 exp1。

(?<=exp2)exp1:查找 exp2 后面的 exp1。

exp1(?!exp2):查找后面不是 exp2 的 exp1。

(?<!exp2)exp1:查找前面不是 exp2 的 exp1。

2.8 运算符优先级

正则表达式从左到右进行计算,并遵循优先级顺序,这与算术表达式非常类似。

相同优先级的从左到右进行运算,不同优先级的运算先高后低。下表从最高到最低说明了各种正则表达式运算符的优先级顺序:

运算符描述
\转义符
(), (?:), (?=), []圆括号和方括号
*, +, ?, {n}, {n,}, {n,m}限定符
^, $, \任何元字符、任何字符定位点和序列(即:位置和顺序)
|替换,"或"操作
字符具有高于替换运算符的优先级,使得"m|food"匹配"m"或"food"。若要匹配"mood"或"food",请使用括号创建子表达式,从而产生"(m|f)ood"。

3.常用正则表达式及在线工具

详见:正则表达式在线测试 | 菜鸟工具

在线正则表达式测试

4.Jmeter之正则表达式提取器

4.1 Regular Expression Extractor

1.添加路径:

2.功能用法:

1)Name of created variable :即引用名称,自己定义的变量名称,后续请求将要引用到的变量名。如 pay_payInfo,后续引用方式即${pay_payInfo}。一般会有[refname]_g(匹配数量)、[refname]_g0 (整体)、[refname]_gn(某个具体匹配值)等多个变量。

2)Regular Expression:即正则表达式,填写提取内容对应的正则表达式。

3)Template:即模板,用$$引用表示。如果在正则表达式中有多个正则表达式,则可以是$2$,$3$等,表示解析到的第几个值给引用名称。若只有一个表达式,只需要$1$。$0$ 引用整个表达式匹配的内容。

4)Match No.:即匹配数字。正则表达式匹配数据的结果可以看做一个数组,表示如何取值,0:随机取值;-1:全部匹配的值;1:第一个匹配值;2:第二个匹配值,正数n则表示取第n个值。

5)Default Value:匹配失败时的默认值。可以不写。通常用于后续的逻辑判断,一般通常为特定含义的英文大写组合,比如:ERROR等。

6)Use empty default value:勾选此项后,如果未提取到值,则给变量赋予空字符串,而不是null

4.2 View Results Tree 中Regular Exp.的使用

View Results Tree 中Regular Exp. 可以验证正则表达式是否匹配到预期结果。

操作步骤:View Results Tree ->>Response data->>Response body->>输入正则表达式->>勾选 Regular Exp. ->>点击Find->>查看匹配结果

4.3 Dubug Sapmpler检测正常表达式取值正确性

1.添加路径

2.作用

可以用于测试正则表达式是否取值正确。

4.4 Jmeter 常用的正则表达式语法

字符描述备注
()括起来的部分就是需要提取的内容
.匹配除换行符(\n、\r)之外的任何单个字符
*匹配前面的子表达式零次或多次。贪婪
+匹配前面的子表达式一次或多次。懒惰
?匹配前面的子表达式零次或一次。占有
{n}n 是一个非负整数。匹配确定的 n 次。
{n,}n 是一个非负整数。至少匹配n 次。
{n,m}m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。
*?重复任意次,但尽可能少重复非贪婪
+?重复1次或更多次,但尽可能少重复。与"*?" 一样,只是至少要重复1次
??重复0次或1次,但尽可能少重复
{n,m}?重复n到m次,但尽可能少重复
{n,}?重复n次以上,但尽可能少重复
(?=exp)匹配exp前面的位置
(?<=exp)匹配exp后面的位置

①(.*):贪婪匹配

设置:

结果:

②(.*?):非贪婪匹配

设置:

结果:

4.5 Jmeter正则表达式提取数组类型的数据

eg:

1.响应结果中取出数组中所有系列名称

设置:

结果:

参数引用:seriesName 即${seriesName_1},${seriesName_2}

2.响应结果中取出数组中第一个系列名称

设置:

结果:

3.响应结果中取出数组中第2个系列名称

设置:

结果:

4.6 Jmeter正则表达式如何提取多个参数值

eg:

1.响应结果中提取第一个匹配结果中的spotSalesDiscount 与 swapSalesDiscount的值

设置:

结果:

参数引用:spotSalesDiscount 即${Discount_g1},swapSalesDiscount 即${Discount_g2}

2.响应结果中提取数组中所有的spotSalesDiscount 与 swapSalesDiscount的值

设置:

结果:

参数引用:

第一组数据:spotSalesDiscount 即${Discount_1_g1},swapSalesDiscount 即${Discount_1_g2}

第二组数据:spotSalesDiscount 即${Discount_2_g1},swapSalesDiscount 即${Discount_2_g2}

与[转帖]正则表达式及在Jmeter中的应用相似的内容:

[转帖]正则表达式及在Jmeter中的应用

目录 1.正则表达式 1.1 什么是正则表达式 1.2 为什么使用正则表达式 2.语法 2.1 普通字符 2.2 限定符 2.3 非打印字符 2.4 特殊字符 2.5 定位符 2.6 修饰符(标记) 2.7 选择 2.8 运算符优先级 3.常用正则表达式及在线工具 4.Jmeter之正则表达式提取器

[转帖]Jmeter学习笔记(十九)——后置处理器之正则表达式的使用

https://www.cnblogs.com/pachongshangdexuebi/p/11733005.html 一、正则表达式提取器的作用 允许用户从服务器的响应中通过使用perl的正则表达式提取值。作为一个后置处理器,该元素会作用在指定范围的取样器,应用正则表达式,提取所需要的值,生成模板

[转帖]egrep 正则表达式

https://www.cnblogs.com/ordili/p/9395735.html 一.功能 用正则表达式在文件或输入中搜索匹配的字符串,并打印出匹配的行。egrep匹配之前,会删除每行结尾的换行符。 二.语法 grep [OPTION]... PATTERN [FILE]... OPTIO

[转帖]总结:正则表达式

一、重要点整理 ^ 为匹配输入字符串的开始位置。 [0-9]+匹配多个数字, [0-9] 匹配单个数字,+ 匹配一个或者多个。[^…] 排除型字符组。 abc$匹配字母 abc 并以 abc 结尾,$ 为匹配输入字符串的结束位置。 正则表达式由两种字符构成。一种是在正则表达式中具体特殊意义的“元字符

[转帖]正则表达式边玩边学

最近在学习极客时间的《正则表达式入门课》,感觉很适合入门玩,所以简单作一些笔记方便查找参考。 正则,就是正则表达式,英文是 Regular Expression,简称 RE。顾名思义,正则其实就是一种描述文本内容组成规律的表示方式。在编程语言中,正则常常用来简化文本处理的逻辑。在 Linux 命令中

[转帖]正则表达式技巧与注意事项

https://www.cnblogs.com/codelogs/p/16060052.html 原创:打码日记(微信公众号ID:codelogs),欢迎分享,转载请保留出处。 简介# 现如今,正则表达式几乎是程序员的必备技能了,它入手确实很容易,但如果你不仔细琢磨学习,会长期停留在正则最基本的用法

[转帖]Shell编程之正则表达式与文本处理器(grep、sort、uniq、tr、cut)

目录 正则表达式概念正则表达式的作用元字符grep命令在文本中查找指定的字符串sort命令排序uniq命令快捷去重tr命令替换、压缩和删除cut命令快速裁剪命令expr substr 截取方法cut截取方法 split命令文件拆分paste命令文件合并eval变量扫描器位置锚定分组或其他扩展正则表达

[转帖]Linux中的Grep命令(在文件中查找文本)

[日期:2020-05-14] 来源:Linux公社 作者:醉落红尘 [字体:大 中 小] grep命令是(global regular expression print,全局正则表达式输出)的缩写,它是Linux中功能最强大且最常用的命令之一。 grep在一个或多个输入文件中搜索与给定模式匹配的行

[转帖]详解nginx的rewrite应用,Nginx高级之Rewrite规则

https://zhuanlan.zhihu.com/p/359801091 Rewrite主要的功能是实现URL重写,Nginx 的 Rewrite 规则采用 PCRE Perl 兼容正则表达式的语法进行规则匹配,如相使用 Nginx 的 Rewrite 功能,在编译 Nginx 前要编译安装 P

[转帖]Linux-文本处理三剑客grep详解

https://developer.aliyun.com/article/885611?spm=a2c6h.24874632.expert-profile.311.7c46cfe9h5DxWK 简介: grep家族 grep:在文件中全局查找指定的正则表达式,并打印所有包含该表达的行 egrep:扩