常见的编码格式ascii,utf-8
一,ascii
计算机中只有256个ascii字符
一个ascii字符在内存空间中占用一个字节
python2.x默认使用此编码格式
若在2.x中使用中文,需要在python文件的首行加上如下格式,则python解释器便会以utf-8来处理此python文件,
-- coding:utf-8 --
若需要对中文进行遍历或者切片操作,还需要在中文字符前加上u
a1 = u'哈哈,你好'
二,utf-8
计算机中使用1-6个字节来表示一个utf-8字符,涵盖了地球上所有的文件
大多数中文会使用3个字节来表示
utf-8是unicode编码的一种
python3.x默认使用此编码格式,所以使用中文时,不需要再指定utf-8编码格式。