总结----文本文件的编码格式

发布时间:2019-10-12 20:08:46编辑:auto阅读(1941)

    常见的编码格式ascii,utf-8

    一,ascii

    计算机中只有256个ascii字符
    一个ascii字符在内存空间中占用一个字节

    python2.x默认使用此编码格式

    若在2.x中使用中文,需要在python文件的首行加上如下格式,则python解释器便会以utf-8来处理此python文件,

    -- coding:utf-8 --

    若需要对中文进行遍历或者切片操作,还需要在中文字符前加上u
    a1 = u'哈哈,你好'

    二,utf-8

    计算机中使用1-6个字节来表示一个utf-8字符,涵盖了地球上所有的文件
    大多数中文会使用3个字节来表示
    utf-8是unicode编码的一种

    python3.x默认使用此编码格式,所以使用中文时,不需要再指定utf-8编码格式。

关键字