Python 模糊匹配：glob, re

发布时间：2019-08-14 12:44:09编辑：auto阅读（2692）

'''
fnmatch模块：提供对Unix Shell通配符的支持
Pattern Meaning
* matches everything
? matches any single character
[seq] matches any character in seq
[!seq] matches any character not in seq

'''

import os
import fnmatch
for file in os.listdir('.'):
    if fnmatch.fnmatch(file, '*.py'):
        print file

'''
glob模块：查找所有满足Unix Shell模式规则的路径名
'''

import os
import glob
for f in glob.glob(os.path.join(os.path.abspath('.'), '*')):
    print f

Python的正则表达式类似于Perl语言。

re正则表达式使用'\'进行转义，而Python语言也使用'\'在字符串的转义；因此，为了匹配'\'，必须使用'\\\\'作为模式。
因为正则表达式必须是\\，而在字符串中每一个\需要两个\\表示。

对于正则表达式模式，我们可以使用原始字符串(raw string)。原始字符串中的\只作为普通字符串处理。因此，r'\n'表示两个
字符，'\'和'n'，但是在普通字符串中， '\n'将作为换行符处理。

re中的特殊字符：
'.' 匹配任意字符，除了换行。如果 DOTALL标记打开，将匹配所有字符，包括换行。
'^' 匹配字符串的开始。
'$' 匹配字符串的结束。

'*' 0或多次重复匹配。
'+' 1或多次重复匹配。
'？' 0次或1次匹配。
*？， +？，？？对应于'*', '+', '?'的非贪心匹配。
{m} m次重复匹配
{m, n} m到n次重复匹配，省略m表示m = 0，省略n表示n无穷大。
{m, n}? 与*?, +?, ??类似，非贪心匹配。
[] 匹配字符集。
| A|B，表示匹配A或B。
（）正则表达中组的概念。

\d 匹配十进制数
\D 匹配非非数字字符
\s 匹配空白
\S 匹配非空白
\w 匹配任意数字和字母
\W 匹配任意非数字和字母

url = 'http://www.contoso.com:8080/letters/readme.html'
obj = re.match(r'(.*)//(.*):(\d+)(.*)', url)
print obj.groups()

lstStr = ['local 127.0.0.1', 'Lucy 192.168.130.2', 'Link 192.168.130.224']
for s in lstStr:
    obj = re.match(r'.*?(\d+.\d+.\d+.\d+).*?', s)
    print obj.groups()

关键字：

上一篇： Python基础学习

下一篇： Python实现简单的API



搜索

热门推荐

最新文章

LLaMA Factory-Lora微调实现声控语音多轮问答对话-1
 225°
LLaMA Factory微调后的模型合并导出和部署-4
 461°
LLaMA Factory微调模型的各种参数怎么设置-3
 449°
LLaMA Factory构建高质量数据集-2
 548°
MinerU-linux环境本地部署
 894°
LLaMA Factory安装和基本使用-1
 617°
使用ms-swift基于Qwen3-8B微调小说模型
 1291°
pythonp爬虫-fanqienovel字体反爬实战
 1421°
大模型基础架构
 1222°
AI多模态- Janus-Pro-7B模型推理微调,融合实战2
 1209°

博主信息

姓名：Run
职业：谜
邮箱：383697894@qq.com
定位：上海 · 松江

扫我打开

友情链接

百度 淘宝 腾讯 慕课网 CSDN 博客园 51cto博客