Python文件IO操作

发布时间:2019-07-01 12:11:13编辑:auto阅读(1258)

    文件IO常用操作:

    open打开
    read读取
    write写入
    close关闭
    readline行读取
    readlines多行读取
    seek
    文件指针操作
    tell指针位置

    打开操作:


    open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

    打开一个文件,返回一个文件对象(流对象)和文件描述符。打开文件失败,则返回异常。

    标红的字,为最常用到的四个。


    基本使用:

      open的参数:

        file: 认识开可者要创建的文件名。如果不指定路径,默认是当前路径。

        mode模式:

        

    描述字符意义
    r缺省的,表示只读打开
    w只写打开
    x创建并写入一个新文件
    a写入打开,如果文件存在,则追加
    b二进制模式
    t缺省的,文本模式
    +读写打开一个文件。给原来只读、只写方式打开提供缺失的读或写能力

      open默认是只读模式r打开已经存在的文件。

      r

      只读打开文件,如果使用write方法,会抛异常。

      如果文件不存在,抛出FileNotFoundError异常。

      w

      表示只写方式打开,如果读取则抛出异常;

      如果文件不存在,则直接创建文件;

      如果文件存在,则清空文件内容;

      x

      文件不存在,创建文件,并只写方式打开;

      文件存在,抛出FileExistsError异常;

      a

      文件存在,只写打开,追加内容;

      文件不存在,则创建后,只写打开,追加内容;

      r是只读,wxa都是只写

      wxa都可以产生新文件,w不管文件存在与否,都会生成全新内容的文件;a不管文件是否存在,都能在打开的文件

      尾部追加;x必须要求文件事先不存在,自己造一个新文件;

      文本模式t

      字符流,将文件的字节按照某种字符编码理解,按照字符操作。open的默认mode就是rt;

      二进制模式b

      字节流,将文件就按照字节理解,与字符编码无关。二进制模式操作时,字节操作使用bytes类型.

      +

      为r、w、a、x提供缺失的读写功能,但是,获取文件对象依旧按照r、w、a、x自己的特征。

      +不能单独使用,可以认为它是为前面的模式字符做增强功能的。


    文件指针


      文件指针,指向当前字节位置

      mode=r,指针起始在0

      mode=a, 指针起始在EOF

     

      tell()显示指针当前位置

      seek(offset[,whence]),移动文件指针位置,offset偏移多少字节。whence从哪里开始。

        文本模式下:

        whence 0缺省值,表示从头开始,offset只能正整数。

        whence 1表示从当前位置,offset只接受0

        whence 2表示从EOF开始,offset只接受0

        二进制模式下:

        whence 0缺省值,表示从头开始,offset只能正整数

        whence 1表示从当前位置,offset可正可负

        whence 2表示从EOF开始,offset可正可负

        二进制模式支持任意起点的偏移,从头,从尾,从中间位置开始。

        向后seek可以超界,但是向前seek的时候,不能超界,否则抛出异常。


    buffering: 缓冲区


    -1表示使用缺省大小的buffer。如果是二进制模式,使用io.DEFAULT_BUFFER_SIZE值,默认是4096或8192。

    如果是文本模式,如果是终端设备,是行缓存方式,如果不是,则使用二进制模式的策略。

      0 只在二进制模式使用,表示关buffer

      1 只在文本模式使用,表示使用行缓冲。意思是见到换行符就flush

      大于1用于指定buffer的大小

    buffer缓冲区

      缓冲区一个内存空间,一般来说是一个FIFO队列,到缓冲区满了或者达到阈值,数据才会flush到磁盘。

      flush() 将缓冲区数据写入磁盘(其实是磁盘的缓冲区);

      close()关闭前会调用flush()

    import io
    
    print(io.DEFAULT_BUFFER_SIZE)

    encoding: 编码,仅文本模式使用


    None 表示使用缺省编码,依赖操作系统。

    windows下缺省GBK(0xB0A1),Linux下缺省UTF-8(0xE5958A)


    其它参数:


    errors: 什么样的编码错误将被捕获;

    None和strict表示有编码错误将抛出ValueError异常;ignore表示忽略;

    newline: 文本模式中,将行的转换。可以为None, " \r \n \r\n

    读时,None表示\r \n \r\n都被转换为\n;

    "表示不会自动转换通用换行符;

    其它合法字符表示换行符就是指定字符,就会按照指定字符分行;

    写时,none表示\n都会被替换为系统缺省分隔符os.linesep; 

    \n或"表示\n不替换;

    其它合法字符表示\n会被替换为指定的字符;

    closed: 关闭文件描述符,True表示关闭它,False会在文件关闭后保持这个描述符;

    fileobj.fileno()查看.


关键字

上一篇: python:datetime用法

下一篇: python_paramoko