python 抓取的网页默认是bytes

发布时间:2019-08-27 08:03:41编辑:auto阅读(1641)

    python 抓取的网页默认是bytes的,要转码.

    查看网页源码可以看到,我本次抓取的网页的编码方式是utf-8的.

    req = urllib.request.Request(url=myurl,headers = myheaders)
    data = urllib.request.urlopen(req).read()
    print(data.decode("UTF-8"))

    这样就正常显示中文了

关键字