python寫入html文件中文亂碼問題
#使用open函數將爬蟲爬取的html寫入文件,有時在控制台不會亂碼,但是寫入檔案的html中的中文是亂碼的
案例分析
看下面一段程式碼:
# 爬虫未使用cookiefrom urllib import requestif __name__ == '__main__': url = "http://www.renren.com/967487029/profile" rsp = request.urlopen(url) html = rsp.read().decode() with open("rsp.html","w")as f: # 将爬取的页面 print(html) f.write(html)
看起來沒有問題,在控制台輸出的html也不會出現中文亂碼,但是創建的html檔中
# 爬虫未使用cookiefrom urllib import requestif __name__ == '__main__': url = "http://www.renren.com/967487029/profile" rsp = request.urlopen(url) html = rsp.read().decode() with open("rsp.html","w",encoding="utf-8")as f: # 将爬取的页面 print(html) f.write(html)
以上是如何解決python寫入html檔中亂碼的現象(圖文詳解)的詳細內容。更多資訊請關注PHP中文網其他相關文章!