首页 技术 正文
技术 2022年11月17日
0 收藏 647 点赞 3,988 浏览 1762 个字
# 1. 正则表达式
# 元字符
# . 除了换行符外任意字符
# \w 数字 字母 下划线
# \s 空白符
# \b 单词的末尾
# \d 数字
# \W 除了数字 字母 下划线
# \D 除了数字
# \S 除了空白符
# ^ 开头
# $ 结尾
# [] 匹配字符组中的字符
# [^] 除了字符组内的元素外

# 量词 限定符
# * {0,n} 零或者更多
# + {1,n} 一或更多
# ? {0,1} 零或一
# {p} p次
# {p,}   p次或更多次
# {p,q} 从p到q次
# .*   贪婪匹配 尽可能多的匹配到结果
# .+# .*? 惰性匹配 是尽可能的少匹配.
# 分组 正则中使⽤()进⾏分组. 如.匹配⼀个相对复杂的⾝份证号
# ^[1-9]\d{14}(\d{2}[0-9x])?$
# ^([1-9]\d{16}[0-9x]|[1-9]\d{14})$
# 转义
# 正则表达式中,有很多有特殊意义的是元字符,如\n和\s等,若要在正则中匹配正常的"\n"⽽不是"换⾏符"需要对"\"进⾏转义, 变成'\\'.
# 而在python中,都是字符串的形式出现,字符串中\也有特殊的含义,本身还需转义.所以匹配⼀次"\n",字符串中要写成'\\n',那么正则就要写成"\\\\n",
# 这样太麻烦.所以这时用r'\n'这个概念,此时的正则是r'\\n'就可以了.
# 如 r"www\.(baidu|google)\.com","www.google.com"
# \n 换行
# \\n \n
# \.
# \/
# \?
# 2. re模块
# findall() 获取到匹配的所有内容
# finditer() 匹配到所有内容。 返回迭代器
# search() 搜索。查到了就返回
# match() 匹配. 从头开始匹配
 # r"(?P<name>正则)" import re
res = re.search('e','leiyunse') # 搜索 搜到 一个 结果就返回
print(res.group()) # e res = re.match('\w+','wuwu is not good man') # match 从开头匹配 若匹配到了就返回
print(res.group()) # wuwu lst = re.findall('\w+','wusir and exo') # findall 查找所有 返回list
print(lst) # ['wusir', 'and', 'exo'] it = re.finditer("\w+","mai le fo leng") # 返回迭代器
for el in it:
print(el.group())
'''
mai
le
fo
leng
''' # 分组优先级
lst = re.findall(r"www\.(baidu|google)\.com","www.google.com") # ()最优先返回
print(lst) # ['google'] # (?:) 去掉优先级
lst = re.findall(r"www\.(?:baidu|google)\.com","www.google.com")
print(lst) # ['www.google.com'] # split 切割 若加括号()会保留切的
lst = re.split("([ab])","alex is not a sb,no he is a big sb")
print(lst) # sub 替换
res = re.sub(r"\d+","_sb_","alex111wusir222taibai666ritian999")
print(res) # alex_sb_wusir_sb_taibai_sb_ritian_sb_ # subn 替换 返回元组 带替换次数
res = re.subn(r"\d+","_sb_","alex111wusir222taibai666ritian999")
print(res) # re.compile() # 把正则表达式预加载
obj = re.compile(r"alex\d+and")
res = obj.search("alex222andwusir333taibai666ritian999")
print(res.group()) # alex222and
# 若数字单独拿出来
obj = re.compile(r"alex(?P<name>\d+)and")
res = obj.search("alex222andwusir333taibai666ritian999")
print(res.group()) # alex222and
print(res.group("name")) #



    					
相关推荐
python开发_常用的python模块及安装方法
adodb:我们领导推荐的数据库连接组件bsddb3:BerkeleyDB的连接组件Cheetah-1.0:我比较喜欢这个版本的cheeta…
日期:2022-11-24 点赞:878 阅读:9,075
Educational Codeforces Round 11 C. Hard Process 二分
C. Hard Process题目连接:http://www.codeforces.com/contest/660/problem/CDes…
日期:2022-11-24 点赞:807 阅读:5,551
下载Ubuntn 17.04 内核源代码
zengkefu@server1:/usr/src$ uname -aLinux server1 4.10.0-19-generic #21…
日期:2022-11-24 点赞:569 阅读:6,399
可用Active Desktop Calendar V7.86 注册码序列号
可用Active Desktop Calendar V7.86 注册码序列号Name: www.greendown.cn Code: &nb…
日期:2022-11-24 点赞:733 阅读:6,176
Android调用系统相机、自定义相机、处理大图片
Android调用系统相机和自定义相机实例本博文主要是介绍了android上使用相机进行拍照并显示的两种方式,并且由于涉及到要把拍到的照片显…
日期:2022-11-24 点赞:512 阅读:7,811
Struts的使用
一、Struts2的获取  Struts的官方网站为:http://struts.apache.org/  下载完Struts2的jar包,…
日期:2022-11-24 点赞:671 阅读:4,893