python的os遍历

发布时间:2019-07-13 11:39:20编辑:auto阅读(1336)

    使用python遍历目录用到

    方法一:

    os.path.walk(top, func, arg)

    模块方法,该方法需要输入3个参数:

    top为起始路径, 

    func为回调函数(可以对遍历出的目录文件做处理),

    arg为回调函数func的参数。

    见下例子:

    #!/usr/bin/env python
    import os
    import time
    
    #定义一个回调函数,实现找出路径下所有访问时间大于3天的文件
    def filter_file(arg, dirname, files):#回调函数的3个参数,arg,walk后查找的dirname, filename
        for f in files:
            file_path = os.path.join(dirname, f)
            if os.path.isfile(file_path): #判断是否为文件,是则继续
                if time.time() - os.path.getatime(file_path) > arg:#当前时间和文件的访问时间差大于3天则打印
                    print file_path
    
    #'/root'为起始路径
    #filter_file为回调函数
    #259200为回调函数的参数,是3天的秒数    
    os.path.walk('/root', filter_file, (259200))


    方法二:

    使用os.walk

    os.walk(top) 此方法默认只需要输入起始路径参数,它会返回一个迭代的对象,迭代出来是一个元组对象,里面有3个数据,第一个起始路径下的目录,第二个是这个目录下的所有目录列表,如果没有则是空列表,第三个是这个目录下所有的文件列表,如果没有则为空。

    来看例子:

    #!/usr/bin/env python
    import os
    for item in os.walk('test'):
        print item

    输出:

    ('test', ['case8', 'case2', 'case1', 'case6'], ['downloadimg.py', 'wrapper.py', '1024.py'])
    ('test/case8', ['files1', 'files2'], ['simple_node.py', 'server.py', 'server.pyc', 'client.py'])
    ('test/case8/files1', [], ['test.txt'])
    ('test/case8/files2', [], ['test.txt'])
    ('test/case2', [], ['website.xml', 'handler.py'])
    ('test/case1', [], ['utils.py', 'text', 'rules.py', 'rules.pyc', 'handlers.py', 'utils.pyc', 'markup.py', 'test_output.html', 'handlers.pyc'])
    ('test/case6', [], ['simple_edit.dat', 'simple_edit.cgi'])

    可以看出迭代出许多元组,每一元组第一个元素是test目录下的所有目录,第二个目录列表是第一个目录元素下的所有目录,没有的是空列表,第三个文件列表是第一个目录元素下的所有文件。

    我们使用循环打印出文件:

    #!/usr/bin/env python
    import os
    for dirpath, dirnames, filenames in os.walk('test'):
        if filenames:
            for f in filenames:
                print os.path.join(dirpath, f)

    输出:

    test/downloadimg.py
    test/wrapper.py
    test/1024.py
    test/case8/simple_node.py
    test/case8/server.py
    test/case8/server.pyc
    test/case8/client.py
    test/case8/files1/test.txt
    test/case8/files2/test.txt
    test/case2/website.xml
    test/case2/handler.py
    test/case1/utils.py
    test/case1/text
    test/case1/rules.py
    test/case1/rules.pyc
    test/case1/handlers.py
    test/case1/utils.pyc
    test/case1/markup.py
    test/case1/test_output.html
    test/case1/handlers.pyc
    test/case6/simple_edit.dat
    test/case6/simple_edit.cgi


    这两种方法可以根据需求选择。

关键字