正则表达式就是记录文本规则的代码
0\d{2}-\d{8} 这个就是一个正则表达式,表达的意思是匹配的是座机号码
用事先定义好的一些特定字符、及这些特定字符的组合,组成一个规则字符串,这个规则字符串用来表达对字符串的一种过滤逻辑。
字符
\n
外的字符。在DOTALL模式中也能匹配换行符预定义字符集(可以写在字符集[...]中)
数量词(用在字符或(...)之后)
: 表示除了指定字符都匹配
(.*)
尽可能多的匹配(.*?)
一旦匹配到就结束.
符号匹配所有的字符包括换行符
正则匹配时忽略大小写
让字符串内部的转义字符没有任何意义。
match 开头匹配,只匹配一次search 全局匹配,只匹配一次
findall 优点:使用简单,缺点:必须把所有数据搜索返回再返回finditer 优点:找到就返回,可以边找边返回如果数据量小 使用 findall如果数据量大 使用 finditer
通过给定字符串进行对数据进行分组
通过给定的正则表达式和替换字符进行替换
(.*)
或 (.*?)
进行替换findall
或 finditer
进行数据提取