python re模块常见函数

发布时间:2019-06-28 11:53:23编辑:auto阅读(1315)

    re.match()函数

    如果想要从源字符串的起始位置匹配一个模式,我们可以使用re.match()函数。re.match()函数的使用格式是:
    re.match(pattern, string, flag)

    re.search()函数

    我们还可以使用re.search()函数进行匹配,使用该函数进行匹配,会扫描整个字符串并进行对应的匹配。
    该函数与re.match()函数最大的不同是,re.match()函数从源字符串的开头进行匹配,而re.search()函数会在全文中进行检索匹配。
    示例如下:

    import re
    
    pattern1 = "python"
    string = "abcdpythonfphp345pythonxadi_py"
    result1 = re.search(pattern1, string)
    
    print(result1)
    print(result1.group())

    执行结果:

    <_sre.SRE_Match object; span=(4, 10), match='python'>
    python
    

    re.compile()

    在以上两个函数中,即便源字符串中有多个结果符合模式,也只会匹配一个结果,那么我们如何将符合模式的内容全部都匹配出来呢?

    1. 使用re.compile()对正则表达式进行预编译。
    2. 编译后,使用findall()根据正则表达式从源字符串中将匹配的结果全部找出。

    我们可以通过下面的实例更好理解:

    import re
    
    string = "hellomypythonhispythonourpythonend"
    pattern = re.compile(".python.")#预编译
    result = pattern.findall(string)#找出符合模式的所有结果
    
    print(result)

    执行结果:

    ['ypythonh', 'spythono', 'rpythone']

    可以看到,这段代码会将string中满足pattern模式的结果全部输出,符合条件的结果一共有3个。

    re.sub()函数

    如果,想根据正则表达式来实现替换某些字符串的功能,我们可以使用re.sub()函数来实现。
    使用re.sub这个函数,会根据正式表达式pattern,从源字符串string查找出符合模式的结果,并替换为字符串rep,最多可替换max次。
    re.sub()函数的格式如下:
    re.sub(pattern,rep,string,max)
    其中,第一个参数为对应的正则表达式,第二个参数为要替换成的字符串,第三个参数为源字符串,第四个参数为可选项,代表最多替换的次数,如果忽略不写,则会将符合模式的结果全部替换。

    import re
    
    string = "hellomypythonhispythonourpythonend"
    pattern = "python."
    result1 = re.sub(pattern,"php",string)   # 全部替换
    result2 = re.sub(pattern,"php",string,2) # 最多替换2次
    
    print(result1)
    print(result2)
    

    结果如下:

    hellomyphpisphpurphpnd
    hellomyphpisphpurpythonend

    第一行输出,由于没有设置第四个参数,全部替换。

关键字