正则表达式
			正则表达式(Regular Expression,简称 Regex)是一种用于 匹配、查找和操作文本 的强大工具。它通过特定的符号和规则,定义了一种字符串匹配的模式(Pattern),可以高效地完成复杂的文本处理任务。
正则表达式可以用于python爬虫的re解析。
正则的语法:使用元字符进行排列组合用来匹配字符串
元字符:具有固定含义的特殊字符
常用元字符:
| 代码 | 说明 | 
|---|---|
| . | 匹配除换行符以外的任意字符 | 
| \w | 匹配字母或数字或下划线或汉字 | 
| \s | 匹配任意的空白符 | 
| \d | 匹配数字 | 
| \b | 匹配单词的开始或结束 | 
| \n | 匹配一个换行符 | 
| \t | 匹配一个制表符 | 
| ^ | 匹配字符串的开始(在集合字符里[^a]表示非(不匹配)的意思 | 
| $ | 匹配字符串的结束 | 
| \W | 匹配非字母或数字或下划线或汉字 大写字母表示反义词 | 
| \D | 匹配非数字 | 
| \S | 匹配非空白符 | 
| a|b | 匹配字符a或字符b | 
| () | 匹配括号内的表达式,也表示一个组 | 
| [] | 表示字符组(元组) | 
常用反义字符
| 代码/语法 | 说明 | 
|---|---|
| \W | 匹配任意不是字母,数字,下划线,汉字的字符 | 
| \S | 匹配任意不是空白符的字符 | 
| \D | 匹配任意非数字的字符 | 
| \B | 匹配不是单词开头或结束的位置 | 
| [^x] | 匹配除了x以外的任意字符 | 
| [^aeiou] | 匹配除了aeiou这几个字母以外的任意字符 | 
常用限定符
| 代码/语法 | 说明 | 
|---|---|
| * | 重复零次或更多次 | 
| + | 重复一次或更多次 | 
| ? | 重复零次或一次 | 
| {n} | 重复n次 | 
| {n,} | 重复n次或更多次 | 
| {n,m} | 重复n到m次 | 
- 标题: 正则表达式
 - 作者: Cealivanus Kwan
 - 创建于 : 2025-04-30 09:39:08
 - 更新于 : 2025-04-30 09:42:25
 - 链接: https://redefine.ohevan.com/2025/04/30/正则表达式/
 - 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。