python 读取文件乱码问题

发布时间:2019-09-18 07:27:52编辑:auto阅读(1679)

    原文地址:http://www.zisexinghen.cn/likeshare/322.html

    一、问题:

    python读取文件时会遇到乱码的问题

    二、解决方法:

    1、已utf-8格式打开文档

    f = open(r'E:\Python\liaotian.txt','r',encoding='utf-8')
    f.seek(0,0)
    for each_line in f:
        print(each_line)
    f.close()

    2、以二进制打开文件,然后对读取的内容进行utf-8编码

    f = open(r'E:\百度云同步盘\云同步盘\Python\liaotian.txt','rb')
    f.seek(0,0)
    for each_line in f:
        print(each_line.decode('utf-8'))
    f.close()

    三、查看文档的编码格式

    1、安装chardet模块

        (1)官方地址: http://pypi.python.org/pypi/chardet

        (2)下载文件

            

        (3)将它解压得到其中的文件夹【chardet】将这个文件夹复制到【python安装根目录\Lib\site-packages】下,确保这个位置可以被python引用到。如果不能被引用到请加入环境变量。在安装完chardet模块,我就可以使用它了。

        (4)查看文档的格式

    import chardet
    path = r'E:\Python\liaotian.txt'
    f = open(path,'rb')
    data = f.read()
    print(chardet.detect(data))

     

关键字

上一篇: Python文本去重

下一篇: python resample() 函数