如何解决python写入html文件中乱码的现象（图文详解）-Tutorial Python-php.cn

如何解决python写入html文件中乱码的现象（图文详解）

烟雨青岚

Lepaskan： 2020-07-02 12:44:52

ke hadapan

4043 orang telah melayarinya

如何解决python写入html文件中乱码的现象（图文详解）

python写入html文件中文乱码问题

使用open函数将爬虫爬取的html写入文件，有时候在控制台不会乱码，但是写入文件的html中的中文是乱码的

案例分析

看下面一段代码：

# 爬虫未使用cookiefrom urllib import requestif __name__ == &#39;__main__&#39;:
    url = "http://www.renren.com/967487029/profile"

    rsp = request.urlopen(url)

    html = rsp.read().decode()    with open("rsp.html","w")as f:        # 将爬取的页面
        print(html)
        f.write(html)

Salin selepas log masuk

看似没有问题，并且在控制台输出的html也不会出现中文乱码，但是创建的html文件中

解决方案

使用open方法的一个参数，名为encoding=” “，加入encoding=”utf-8”即可

# 爬虫未使用cookiefrom urllib import requestif __name__ == &#39;__main__&#39;:
    url = "http://www.renren.com/967487029/profile"

    rsp = request.urlopen(url)

    html = rsp.read().decode()    with open("rsp.html","w",encoding="utf-8")as f:        # 将爬取的页面
        print(html)
        f.write(html)

Salin selepas log masuk

运行结果