菜鸟学Python(13):讨厌的BO

发布时间:2019-09-24 08:25:14编辑:auto阅读(2270)

    某些软件,如notepad,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。
    因此我们在读取时需要自己去掉这些字符,python中的codecs module定义了这个常量:
    # coding=gbk
    import codecs
    data = open("Test.txt").read()
    if data[:3] == codecs.BOM_UTF8:
     data = data[3:]
    print data.decode("utf-8")

关键字

上一篇: python 看包所在的位置

下一篇: python 3 socket