Python12 文件操作

发布时间:2019-08-24 09:25:29编辑:auto阅读(1159)

    文件操作

    image_1c0ag46vu1lqg1ievebs1kmh4gc9.png-5.4kB
    Pycharm使用UTF-8格式,而Windows默认是GBK格式,所以默认pycharm是处理不了BGK格式的,所以要要定义使用UTF-8格式打开Windows文件的内容。

    .read():读取文件所有内容。
    image_1c0ag5e9f13v91nofo3mek0fcam.png-18.3kB

    image_1c0ag8ico1udedpat5t1pj2c5713.png-8.6kB
    同样是读取文件内容,但是print(data2)时没有任何数据显示,这是因为data1读取完成的时候,光标位置处于test.txt文档中的最下面,所以当data2再去读取时,下面已经没有数据了。

    1.读写

    image_1c0agba2m1cnahau1uga11efnds1g.png-9.2kB
    image_1c0agbg9h1682lti114j11to1hc81t.png-12kB
    报错没有写入的权限。

    image_1c0agbrqf1vt01r70158013cp1llr2a.png-9.5kB
    使用’r’赋予只读权限,不写的话默认就是只读。

    image_1c0agcehl1d7819dtnb91ln1il2n.png-11.9kB
    因为是只读所以不能写入

    image_1c0agcrk71rvdg7626moee18qv34.png-9.3kB
    将其赋予写入权限

    image_1c0agdm0lqhf142ghg4lbbjtb3h.png-11.2kB
    可以看到只能写入,却不能读取(代码中有读取的动作)。

    image_1c0age4vt1194t851im61atj1s5j3u.png-9.3kB
    image_1c0agec7o1klj1vp2r81oku1u2e4b.png-4.4kB
    可以看到test文档已经被写入内容了,但是内容却都写在了同一行。

    image_1c0agg7uu18dbhfpkro1g6f1k2l6o.png-10kB
    \n表示换行符
    f.close(),写入内容后需要关闭文档,关闭后自动保存。
    image_1c0aghb6urm4ju41v5g3vv1nom75.png-4.6kB
    注意’w’权限会覆盖之前有的内容。

    image_1c0aghok91qpa23h1hq1phv19ig7i.png-6.9kB
    image_1c0aghv4prj5i8229rbbga5a7v.png-2.7kB
    可以看到文档中直接了内容,并不会覆盖。

    image_1c0agkg6q1bdf1kldikb12gt18b58c.png-9.1kB
    每一行定义一个数字

    image_1c0agkskufhb1un3doi1mm16k18p.png-15.7kB

    image_1c0agl2f46fo9i5lma1lu014md96.png-1.5kB
    读取了多行的内容,但是这样写的代码太多,可以使用循环替代重复代码
    image_1c0agllfk12r1tf76n217621d9e9j.png-8.5kB

    2.readlines

    image_1c0agmpr2ubn1n6rbvilvta2a0.png-6.3kB

    image_1c0agmun11mffn91134g9fdg41ad.png-3kB
    可以看到以列表的形式,将每一行的列表元素在同一行打印出来。

    image_1c0agnb3s8l1adj1pjg1tg516foaq.png-7.7kB

    image_1c0agnh3o1vd21ijga2l1ihnfp8b7.png-1.6kB
    将列表的每一个元素分行打印出来,但是可以看到打印的时候将\n也打印出来了,所以显示的时候会有空行。

    image_1c0agnucbhgs1m4mrhal0g179fbk.png-8.7kB

    image_1c0ago5f01s26154rvlj1khpku7c1.png-2.2kB
    可以看到,通过strip分隔了空行(也就是删除,因为括号中是空格所以删除所有空格,如果是其他字符就删除对应的所有字符),显示就正常了。

    image_1c0agp77r1k0gjgkfelarf55kdr.png-25kB

    image_1c0agone810fh1qaa1ovoipc14t0cu.png-4.2kB

    • readlines的缺点
      Readlines会读取文件的所有内容,并将读取的内容放入到内存中,读取的文件小的话内存是可以接受的,但是如果读取的文件过大,超过了内存的大小就不可以了(比如内存8G,你的文件有20G)。
      image_1c0agqv9dru13v7p3e11gh18qse8.png-9.9kB

    解决方法就是直接使用for循环就可以了

    这种方式就是读取一行后,打印一行,在打印下一行前会把之前打印的内容在内存中删除,这样内存中就始终保存一行的内容,不会占据过大内存。

    内存只保存一行是因为f打开的文件编程了一个叫迭代器的东西,迭代器后面会讲。

    不使用readlines读取,显示的内容就不在会是列表了,也就无法将文档中的下标读取出来了,就没办法在通过匹配下标的方式去针对达到指定行进行操作了。
    可以通过使用计数器来判断读取文档到多少行了。

    image_1c0ags7ed1mfr1a0e133avu81fkhel.png-17.5kB

    image_1c0agspoq1rn8irme6r1aqaauuf2.png-4.2kB

    ### 3.文件修改
    image_1c0agtjoe1k941vtr112hhp91rg4ff.png-22kB
    F_1是旧文件
    F_2是新文件
    要求:通过读取旧文件的指定内容,将其修改并写入新的文件中;如果没有读取到指定内容,也将新内容写入到新文件中。
    代码含义:如果发现小明要去玩内容在文件中,就通过replace替换关键字;如果没有发现指定内容,根据else代码直接写入新文件中。
    但是此代码中可以看到,出现了重复代码f_2.write(line)

    image_1c0agu43ad1a6srj7j1k3fhabfs.png-18.5kB
    只需要将缩进等级调整一下,如果发现指定内容就进行替换,之后会将替换内容写入到新文件。
    即使没有发现指定内容,那么就不需要他换,直接将循环到旧文件的内容写入到新文件。

    image_1c0aguh9a1m4a4rhv11oc71t17g9.png-25kB
    也可以将要查找和替换的信息赋值变量,然后用变量名称来代替。

    4.with语句

    image_1c0ah05i51lsgo4h19gabms1fl3gm.png-8.4kB
    使用with语句可以在该语句模块最后不适用close来关闭文件,因为with语句最后会自动关闭;
    这里的as f,相当于f = open…….
    image_1c0ah0hqtgu1r411u0h18cks24h3.png-0.8kB

    image_1c0ah0p31fgkn1ohsi1hgq15aahg.png-12.5kB
    可以通过with同时打开多个文件;
    从代码中可以看出是分了多行来打开多个文件,其实也可以在同一行来打开,只不过python官网的开发规范说明了一行的开发代码不应该超过80个字符,当同时打开多个文件时,可能就超过了限制的80个字符,所以这里我们没打开一个文件就换一行来写代码。

    总结

    r只读

    w只写(覆盖)

    a追加(最后一行)

    r+读写(读后可以写,如果是写就是追加到最后一行)

    w+写读(覆盖后可以读)

    a+追加写读

    rb使用二进制模式打开(打开的数据都是bytes格式)

    wb通过bytes的格式写入,如果使用过wb必须制定字符集(如:encoding='utf-8'),当夸系统平台时会用到二进制数据。

    ab用二进制追加

    seek:重置读取的下标位置到最顶

    tell:查看当前下标的位置

    truncate():截断剩下的字符串(剩下也就是还没读取的),默认截断后面所有,括号中指定数字就是指定多少个字符。

    flush():一般文件需要关闭后才换刷新缓冲区将内容写入文件,但是用flush后不需要等文件关闭,直接指定缓冲,将内容写入文件

    文件还有很多其他方法:
    image_1c0ah39qc13q24r2hs6p789ebht.png-75.5kB

关键字