出现在正则表达式字符串中，有两种字符：

一种叫普通字符，
写在正则表达式里面的普通字符都是表示： 直接匹配它们。
有些特殊的字符，术语叫 metacharacters（元字符）
这些特殊的元字符包括下面这些：

. * + ? \ [ ] ^ $ { } | ( )

下面将一一介绍：

. 匹配所有字符

.匹配除了换行符之外的所有单个字符

`*` 重复匹配任意次

* 表示匹配前面的子表达式任意次，包括0次。

*`.`** 在正则表达式中非常常见，表示匹配任意字符任意次数。

例如：,.*中，匹配包括,的所有字符，*若,后面没有字符，`.匹配0次，即则只匹配,`**

`+` 重复匹配多次

+ 表示匹配前面的子表达式一次或多次，不包括0次。

例如：,.+中，匹配包括,的所有字符，若,后面没有字符，.+至少匹配1次，即无匹配

`?` 匹配0-1次

? 表示匹配前面的子表达式0次或1次。

例如：,.?中，匹配包括,的后任意一位,若,后面没有字符，.?匹配0次，即则只匹配,

`{}` 匹配指定次数

{3}表示前面的字符匹配3次。
{3,4}表示前面的字符匹配 至少3次，至多 4 次。

贪婪模式和非贪婪模式

例如我们想匹配abcdfcd中的abc时
如果用a.*c

import re

content = 'abcdfcd'
pattern = re.compile('a.*c')
result = re.search(pattern, content)
print(result.group())

但运行结果时abcdfc ，为什么呢？
原来在正则表达式中，*, +, ? 都是贪婪地，使用他们时，会尽可能多的匹配内容
所以a.*c一直匹配到了dfcd中的f

解决这个问题，就需要使用非贪婪模式，也就是在*后面加上 ? ，变成这样 a.*?c

import re

content = 'abcdfcd'
pattern = re.compile('a.*?c')
result = re.search(pattern, content)
print(result.group())

运行结果：abc 这就对了。

`\` 对元字符的转义

例如我们在匹配中需要匹配. * + ? \ [ ] ^ $ { } | ( )这些，就需要用反斜杠来转义
（其实很多语言都是用\来转义的，比如我现在用的markdown编辑器）

例如\.就是用来匹配.的

接下篇

python正则re学习记录（之二）

python正则re学习记录(之一)

yuaneuro • 2020 年 03 月 13 日

python正则re学习记录(之一)

. 匹配所有字符

`*` 重复匹配任意次

`+` 重复匹配多次

`?` 匹配0-1次

`{}` 匹配指定次数

贪婪模式和非贪婪模式

`\` 对元字符的转义

接下篇

发表评论取消回复

如何用kali搭建钓鱼wifi(图文超详细)

网站设置复制提示,禁f12,禁止调试

typecho出现评论失败及Database Query Error的几种解决方法

在网站设置反反广告插件(屏蔽adblock等)

用python提取sitemap网址并主动提交

内网渗透-使用anydesk进行远控

Apache solr漏洞学习积累

php学习笔记(4)-面向对象

关于域名带www和不带www的选择

markdown常用语法收藏

python正则re学习记录(之一)

. 匹配所有字符

* 重复匹配任意次

+ 重复匹配多次

? 匹配0-1次

{} 匹配指定次数

贪婪模式和非贪婪模式

\ 对元字符的转义

接下篇

发表评论 取消回复

python正则re学习记录(之一)

`*` 重复匹配任意次

`+` 重复匹配多次

`?` 匹配0-1次

`{}` 匹配指定次数

`\` 对元字符的转义

发表评论取消回复