Python 解压缩文件详解

发布时间:2019-09-17 07:44:29编辑:auto阅读(1466)

    zipfile模块及相关方法介绍:

    1 压缩

    1.1 创建zipfile对象

    zipfile.ZipFile(file, mode='r', compression=0, allowZip64=True, compresslevel=None)

    创建Zipfile对象,主要参数:

    1>file压缩包名称;
    2>mode:读'r'或者写'w'模式;
    3>compression:设置压缩格式;
    4>compresslevel:压缩等级;

    压缩格式分类:

    格式 说明 对应compresslevel
    ZIP_STORED 不压缩 无效
    ZIP_DEFLATED 需要zlib支持 0~9
    ZIP_BZIP2 需要bz2支持 0~9
    ZIP_LZMA 需要lzma支持 无效

    1.2 添加压缩文件

    zipobj.write(self, filename, arcname=None, compress_type=None, compresslevel=None)

    参数说明:

    1>fiename:添加文件路径;
    2>arcname:归档文件路径与名称;

    1.3 添加压缩数据

    zipobj.writestr(zinfo_or_arcname, data, compress_type=None, compresslevel=None)

    参数说明:

    1>zinfo_or_arcname:归档文件名称;
    2>data:压缩数据str或者byte,如果数据为str,需要先进行Utf-8编码;

    1.4 关闭

    关闭压缩文件:

    zipobj.close()

    1.5 一个例子:

    压缩目录如下:
    Python 解压缩文件详解

    代码实现:

    import zipfile
    logdir = '/home/linux/logs'
    zipname = '/home/linux/logs.zip'
    #创建zip对象,
    fzip = zipfile.ZipFile(zipname, 'w', zipfile.ZIP_DEFLATED)
    #遍历要压缩目录
    flist = os.listdir(logdir)
    for name in flist:
        fpath = os.path.join(logdir, name)
        #写入要压缩文件
        fzip.write(fpath)
    #关闭
    fzip.close()

    进入目录解压,文件路径如下:
    Python 解压缩文件详解
    可以看到,我们将整个目录添加到压缩文件中,其实我们更想做的是logs/*.log;
    对代码进行修改:

    logdir = '/home/linux/logs'
    zipname = '/home/linux/logs.zip'
    import zipfile
    #创建zip对象,
    fzip = zipfile.ZipFile(zipname, 'w', zipfile.ZIP_DEFLATED)
    #遍历要压缩目录
    flist = os.listdir(logdir)
    #获取压缩目录名称
    basename = os.path.basename(logdir)
    for name in flist:
        fpath = os.path.join(logdir, name)
        arcname = os.path.join(basename, name)
        #写入要压缩文件,并添加归档文件名称
        fzip.write(fpath, arcname=arcname)
    #关闭
    fzip.close()

    压缩之后,解压缩内容:
    Python 解压缩文件详解
    这个才是我们想要的。

    2.获取压缩包信息

    打开压缩包:
    frzip = zipfile.ZipFile(zipname, 'r', zipfile.ZIP_DEFLATED):只读方式打开;

    frzip.printdir(),显示压缩包文件信息

    File Name                                             Modified             Size
    logs/1003.log                                  2019-04-09 10:00:10           17
    logs/1001.log                                  2019-04-09 10:00:06           17
    logs/1004.log                                  2019-04-09 10:00:12           17
    logs/1002.log                                  2019-04-09 10:00:08           17
    logs/1000.log                                  2019-04-09 10:00:04           17

    frzip.filelist:记录压缩包文件信息,与printdir类似,内容如下:

    [<ZipInfo filename='logs/1003.log' compress_type=deflate filemode='-rw-r--r--' file_size=17 compress_size=17>,
     <ZipInfo filename='logs/1001.log' compress_type=deflate filemode='-rw-r--r--' file_size=17 compress_size=17>,
     <ZipInfo filename='logs/1004.log' compress_type=deflate filemode='-rw-r--r--' file_size=17 compress_size=17>,
     <ZipInfo filename='logs/1002.log' compress_type=deflate filemode='-rw-r--r--' file_size=17 compress_size=17>,
     <ZipInfo filename='logs/1000.log' compress_type=deflate filemode='-rw-r--r--' file_size=17 compress_size=17>]

    frzip.getinfo(name):获取指定arcname的信息:

    frzip.getinfo('logs/1003.log')
    #输出结果:
    <ZipInfo filename='logs/1003.log' compress_type=deflate filemode='-rw-r--r--' file_size=17 compress_size=17>

    frzip.namelist():获取压缩文件列表

    ['logs/1003.log',
     'logs/1001.log',
     'logs/1004.log',
     'logs/1002.log',
     'logs/1000.log']

    3 解压压缩包

    frzip.extract(member, path=None, pwd=None):解压缩一个文件到指定目录;
    参数:
    member:压缩包中文件;
    path:解压缩到指定目录,默认解压到当前目录;

    frzip.extractall(path=None, members=None, pwd=None):解压缩多个文件到指定目录;
    参数:
    path:指定的解压目录;
    members:指定解压文件,默认解压全部;

    解压指定文件到指定目录:

    #可以自己定义路径
    zipname = '/home/linux/logs.zip'
    extractpath =  '/home/linux/1'
    #注意压缩格式选择
    frzip = zipfile.ZipFile(zipname, 'r', zipfile.ZIP_DEFLATED)
    extractfile = frzip.namelist()
    if len(extractfile):
        extname = extractfile[0]
        print('extract file:', extname)
        frzip.extract(extractfile[0], extractpath)
    frzip.close()

    输出结果:extract file: logs/1003.log,在extractpath目录下有log文件;

    使用frzip.extractall将所有文件解压到指定目录:

    #可以自己定义路径
    zipname = '/home/linux/logs.zip'
    extractpath =  '/home/linux/1'
    #注意压缩格式选择
    frzip = zipfile.ZipFile(zipname, 'r', zipfile.ZIP_DEFLATED)
    #将所有文件加压缩到指定目录
    frzip.extractall(extractpath)
    frzip.close()

    除了zipfile还有其它模块:
    import gzip;
    import tarfile;
    这些模块使用方式都类似,后面文章中我们在详解讲解。

关键字