Python遍历文件和内容

发布时间:2019-09-10 09:18:10编辑:auto阅读(1576)

    #!/usr/bin/python
    #-*- coding: utf-8 -*-
    #图片中有大量冗余数据,需要删除,现在有开发跑出有用的图片,并且按照每天生产.txt 文件
    #1.遍历按天生产.txt文件,新建一个新的目录,将有用文件都移动到此目录下。让后新老目录名兑换
    #样列:http://test.xx.com/v0/app-feed/soft/apk/201202/20120224164134.apk
    import os
    import shutil
    rootdir="/root/python/apk"
    apknewdir="/www/v0/app-feed/soft/apknew1"
    #开始遍历文件
    for parent,dirnames,filenames in os.walk(rootdir):
            
        for filename in filenames:
            file_object= open(os.path.join(rootdir,filename),'r')
            try:
                list_of_all_the_lines=file_object.readlines()
                for line in list_of_all_the_lines:
                    #使用截取字符串,拼接文件名
                    #apkfilename="/www/"+line.split("/",3)[3]
                    #通过字符串替换 得到文件名
                    apkfilename=line.replace("http://test.xx.com","/www")
                    #apkfilename="/www/v0/app-feed/soft/apk/201202/20120224164134.apk" 取文件名
                    datedir=apkfilename.split("/",7)[6]
                    #datedir="201202" 取时间
                    #判断日期文件夹是否存在,如果不存在就创建,否则就复制文件到新的目录中
                    if os.path.exists(os.path.join(apknewdir,datedir)):
                        #shutil.copy(apkfilename,os.path.join(apknewdir,datedir))
                        print(apkfilename+"_____"+os.path.join(apknewdir,datedir))
                    else :
                        os.path.mkdir(os.path.join(apknewdir,datedir))
                        #print("create"+os.path.join(apknewdir,datedir))
                                
            finally:
                file_object.close()


关键字