Python笔记-IO同步和异步、 读写

发布时间:2019-09-21 10:54:33编辑:auto阅读(1893)

    IO:Input/Output

    由于CPU和内存的速度远远高于外设的速度,所以,在IO编程中,就存在速度严重不匹配的问题。举个例子来说,比如要把100M的数据写入磁盘,CPU输出100M的数据只需要0.01秒,可是磁盘要接收这100M数据可能需要10秒,怎么办呢?有两种办法:

    第一种是CPU等着,也就是程序暂停执行后续代码,等100M的数据在10秒后写入磁盘,再接着往下执行,这种模式称为同步IO

    另一种方法是CPU不等待,只是告诉磁盘,“您老慢慢写,不着急,我接着干别的事去了”,于是,后续代码可以立刻接着执行,这种模式称为异步IO

    同步和异步的区别就在于是否等待IO执行的结果。

    好比你去麦当劳点餐,你说“来个汉堡”,服务员告诉你,对不起,汉堡要现做,需要等5分钟,于是你站在收银台前面等了5分钟,拿到汉堡再去逛商场,这是同步IO。

    你说“来个汉堡”,服务员告诉你,汉堡需要等5分钟,你可以先去逛商场,等做好了,我们再通知你,这样你可以立刻去干别的事情(逛商场),这是异步IO。

    很明显,使用异步IO来编写程序性能会远远高于同步IO,但是异步IO的缺点是编程模型复杂。

    想想看,你得知道什么时候通知你“汉堡做好了”,而通知你的方法也各不相同。如果是服务员跑过来找到你,这是回调模式,如果服务员发短信通知你,你就得不停地检查手机,这是轮询模式。总之,异步IO的复杂度远远高于同步IO。

    读文件

    1、读写一个文件之前需要打开它:

    fileobj = open(filename, mode)

    mode :文件类型和操作的字符串。
    mode 的第一个字母表明对其的操作:

    • r 表示读模式。
    • w 表示写模式。如果文件不存在则新创建,如果存在则重写新内容。
    • x 表示在文件不存在的情况下新创建并写文件。
    • a 表示如果文件存在,在文件末尾追加写内容。

    mode 的第二个字母是文件类型:

    • t(或者省略)代表文本类型;
    • b 代表二进制文件

    f = open('/Users/michael/test.txt', 'r')
    
    #要读取二进制文件,比如图片、视频等等,用'rb'模式打开文件即可:
    f = open('/Users/michael/test.jpg', 'rb')
    
    #读取非UTF-8编码的文本文件,要给open()函数传入encoding参数,例如,读取GBK编码的文件:
    f = open('/Users/michael/gbk.txt', 'r', encoding='gbk')

    2、如果文件打开成功,调用read()方法可以一次读取文件的全部内容,Python把内容读到内存,用一个str对象表示:

    >>> f.read()
    'Hello, world!'

    3、调用close()方法关闭文件。文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,并且操作系统同一时间能打开的文件数量也是有限的:

    >>> f.close()

    4、由于文件读写时都有可能产生IOError,一旦出错,后面的f.close()就不会调用。所以,为了保证无论是否出错都能正确地关闭文件,我们可以使用try … finally来实现

    try:
        #读取文本文件,并且是UTF-8编码的文本文件
        f = open('/path/to/file', 'r') 
        print(f.read())
    finally:
        if f:
            f.close()

    但是每次都这么写实在太繁琐,所以,Python引入了with语句来自动帮我们调用close()方法:

    with open('/path/to/file', 'r') as f:
        print(f.read())

    两者等同,这种更保险,更简洁。

    写文件

    调用open()函数时,传入标识符’w’或者’wb’表示写文本文件或写二进制文件:

    f = open('/Users/michael/test.txt', 'w')
    f.write('Hello, world!')
    f.close()

    可以反复调用write()来写入文件,但是务必要调用f.close()来关闭文件。当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了。所以,还是用with语句来得保险

    with open('/Users/michael/test.txt', 'w') as f:
        f.write('Hello, world!')

    要写入特定编码的文本文件,请给open()函数传入encoding参数,将字符串自动转换成指定编码。

    注:使用with语句操作文件IO是个好习惯。

    StringIO和BytesIO

    是在内存中操作str和bytes的方法,使得和读写文件具有一致的接口。

    StringIO:在内存中读写str,操作的只能是str。
    如果要操作二进制数据,就需要使用BytesIO。

    1、要把str写入StringIO或者二进制数据写入BytesIO,我们需要先创建一个StringIO或者BytesIO,然后像文件一样写入即可:

    from io import StringIO
    f=StringIO()
    f.write('hello')
    f.write(' ')
    f.write('world!')
    #getvalue()方法用于获得写入后的str。
    print(f.getvalue())   

    结果:hello world!

    from io import BytesIO
    f=BytesIO()
    f.write('中文'.encode('utf-8'))
    #请注意,写入的不是str,而是经过UTF-8编码的bytes。
    print(f.getvalue())

    结果:b’\xe4\xb8\xad\xe6\x96\x87’

    2、读取StringIO或者BytesIO,可以用一个str初始化StringIO或者用一个bytes初始化BytesIO,然后像读文件一样读取:

    from io import StringIO
    f=StringIO('Hello!\nHi!\nGoodbye!')
    while True:
        s=f.readline()
        if s== '':
            break
        print(s.strip()) # 把末尾的'\n'删掉

    结果:
    Hello!
    Hi!
    Goodbye!

    from io import BytesIO
    f=BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')
    f.read()
    print(f.getvalue())

    结果:b’\xe4\xb8\xad\xe6\x96\x87’

关键字