正则表达式

· 浏览次数 : 2

小编点评

正则表达式是用于匹配字符串中字符组合的模式。在正则表达式中,有限符(quantifier)表示字符出现的次数。下面是不同类型的有限符及其解释: 1. a*:匹配零个或多个a,即a可以出现0次或多次。 2. a+:匹配一个或多个a,即a必须出现至少1次。 3. a?:匹配零个或一个a,即a可以出现0次或1次。 4. a{6}:匹配恰好6个a。 5. a{2,6}:匹配2到6个a,包括2和6。 6. a{2,}:匹配2个或更多a,可能更多。 其他内容: 7. (a|b):匹配a或b。 8. [abc]:匹配方括号内的任意一个字符,即a、b或c。 9. [a-c]:匹配方括号内的任意一个字符,即a、b或c(包括a、b、c)。 10. [a-fA-F0-9]:匹配任意一个小写或大写字母、数字或特殊字符。 11. [^0-9]:匹配任意一个非数字字符。 12. \d:匹配任意一个数字字符,等同于[0-9]。 13. \D:匹配任意一个非数字字符,等同于[^0-9]。 14. \w:匹配任意一个单词字符,等同于[A-Za-z0-9_]。 15. \W:匹配任意一个非单词字符,等同于[^A-Za-z0-9_]。 16. \s:匹配任意一个空白字符,包括空格、制表符和换行符。 17. \S:匹配任意一个非空白字符。 18. .:匹配任意一个字符,除了换行符。 最后两个符号表示贪婪(greedy)和懒惰(lazy)匹配: 19. <.+>:贪婪匹配,尽可能多地匹配文字,例如匹配到最近的闭合标签。 20. <.+?>:懒惰匹配,尽可能少地匹配文字,例如匹配到最近的闭合标签,但不包括已匹配到的部分。

正文

正则表达式

import re

限定符(quantifier)

a* a出现0次或者多次
a+ a出现1次或者多次
a? a出现0次或者一次
a{6} a出现6次
a{2,6} a出现2-6次
a{2,} a出现两次以上

或运算符(OR Operator)

(a|b) 匹配
(ab)|(cd) 匹配ab或者cd

字符类(Character Classes)

[abc] 匹配a或者b或者c
[a-c] 同上
[a-fA-F0-9] 匹配小写+大写英文字符以及数字
[^0-9] 匹配非数字字符

元字符(Meta-characters)

\d 匹配数字字符
\D 匹配非数字字符
\w 匹配单词字符(英语,数字,下划线)
\W 匹配非单词字符
\s 匹配空白符号
\S 匹配非空白字符
. 匹配任意字符(除换行符)
\bword\b \b标注字符的边界(全字匹配)
^ 匹配行首
$ 匹配行尾

贪婪/懒惰匹配(Greey/Lazy Match)

<.+>默认贪婪匹配“任意字符”
<.+?>懒惰匹配“任意字符”

与正则表达式相似的内容:

正则表达式

正则表达式 import re 限定符(quantifier) a* a出现0次或者多次 a+ a出现1次或者多次 a? a出现0次或者一次 a{6} a出现6次 a{2,6} a出现2-6次 a{2,} a出现两次以上 或运算符(OR Operator) (a|b) 匹配 (ab)|(cd) 匹配

正则表达式中 “$” 并不是表示 “字符串结束

作者:Seth Larson 译者:豌豆花下猫@Python猫 英文:Regex character “$” doesn't mean “end-of-string” 转载请保留作者及译者信息! 这篇文章写一写我最近在用 Python 的正则表达式模块(re)开发 CPython 的 SBOM 工具

正则表达式知识点总结

第一部分:正则表达式 概念 一个函数: re.findall(pattern, string) 一些元字符: . * ? + [] () \ ^ $ 通过 () 来改变 findall 的行为 例1: 判断一个手机号码(长度、开头数字为1、只能是数字) import re a=12345678901

[转帖]正则表达式技巧与注意事项

https://www.cnblogs.com/codelogs/p/16060052.html 原创:打码日记(微信公众号ID:codelogs),欢迎分享,转载请保留出处。 简介# 现如今,正则表达式几乎是程序员的必备技能了,它入手确实很容易,但如果你不仔细琢磨学习,会长期停留在正则最基本的用法

正则表达式学习

第一个: 过滤guid相关的信息 egrep ^[a-zA-Z0-9]{8}-[a-zA-Z0-9]{4}-[a-zA-Z0-9]{4}-[a-zA-Z0-9]{4}-[a-zA-Z0-9]{12}$ 第二个: 反编译代码 time for i in `find . \( -path ./var -

[转帖]正则表达式边玩边学

最近在学习极客时间的《正则表达式入门课》,感觉很适合入门玩,所以简单作一些笔记方便查找参考。 正则,就是正则表达式,英文是 Regular Expression,简称 RE。顾名思义,正则其实就是一种描述文本内容组成规律的表示方式。在编程语言中,正则常常用来简化文本处理的逻辑。在 Linux 命令中

[转帖]正则表达式及在Jmeter中的应用

目录 1.正则表达式 1.1 什么是正则表达式 1.2 为什么使用正则表达式 2.语法 2.1 普通字符 2.2 限定符 2.3 非打印字符 2.4 特殊字符 2.5 定位符 2.6 修饰符(标记) 2.7 选择 2.8 运算符优先级 3.常用正则表达式及在线工具 4.Jmeter之正则表达式提取器

正则表达式总结-1

转载 正则表达式真的很强,可惜你不会写 正则表达式是一种强大的文本处理工具,它允许你根据一定的规则来搜索、匹配、替换和验证文本,适配各种编程语言。 应用场景 正则表达式在计算机领域有广泛的应用,包括: 1、文本搜索和匹配:查找特定模式的字符串,如搜索包含特定关键词的文档。 2、数据验证:验证用户输入

JavaScript之正则表达式

正则表达式(RegExp) 正则表达式不是JS独有的内容,大部分语言都支持正则表达式 JS中正则表达式使用得不是那么多,我们可以尽量避免使用正则表达式 在JS中,正则表达式就是RegExp对象,RegExp 对象用于将文本与一个模式匹配 正则表达式(regular expressions, 规则表达

学习正则表达式

正则表达式是一个强大的文本匹配工具。但是,对于初学者来说,众多的符号和规则可能让人难以理解。其实,你不需要记住所有的正则表达式语法!本文将分享一些简单而实用的技巧,帮助理解正则表达式的核心概念,轻松使用正则表达式! 基础入门 概念 正则表达式(Regular Expression,在代码中常简写为r