Gemeinschaft

Lernen

Tools-Bibliothek

KI-Tools

Freizeit

Deutsch

Heim > Backend-Entwicklung > Python-Tutorial > 为什么这个网页的源代码用python爬下来后用beautifulsoup解析后会出现字符丢失？

为什么这个网页的源代码用python爬下来后用beautifulsoup解析后会出现字符丢失？

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Freigeben： 2016-06-06 16:22:10

Original

1892 Leute haben es durchsucht

回复内容：

又是你这个只点感谢不点赞的坏人……
话说你为什么要这么心急地学呢，基础不扎实啊，太冒进了，很显然没有清晰的思路…

首先编程要有默认的编码，也就是在文件的一开始加上

 # -*- coding: utf-8 -*-
Nach dem Login kopieren

你是python2  代码前 加上# coding:utf-8

看python培训黄哥的三篇文章 
python开发爬虫汉字编码不再是问题： 
将python2中汉字会出现乱码的事一次性说清楚 
article/python_bianma.md at master · pythonpeixun/article · GitHub
python爬虫访问多个网站、中文编码的处理。 
python爬虫访问多个网站、中文编码的处理。
python3访问sina首页中文的处理 
python3访问sina首页中文的处理


可能在你这个转来转处的地方丢失。
ur = list(ur)
 ur = ur[:-1]
＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊
 ur = res.contents[0]
    ur = list(ur)
    ur = ur[:-1]
    temp = unicode(ur[0])
    for index in range(0, len(ur), 4):
        temp = unicode(ur[index])
        print temp.strip()
        print ur[index+1].string
        print ur[index+1]['href']
        print '\n'
Nach dem Login kopieren

似乎response 后面用了俩decode 后面一个改encode应该就好了吧。。。

Decode是把括号里转成Unicode

Encode是Unicode转成括号里，就是UTF-8

Unicode就是个中转站


再不行就同一楼ignore。。。

还是用Requests库来处理http请求吧

Vorheriger Artikel：Python 有什么奇技淫巧？ Nächster Artikel：怎样用 Windows 入门Python？

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Neueste Artikel des Autors

So verwenden Sie Photoshop auf Ihrem Telefon

2025-02-24 12:36:12
Hören Sie auf, so viel Geld für Streaming -Dienste auszugeben

2025-02-24 12:11:09
Hören Sie auf, mit Ihrem Telefon zu sprechen: So verwenden Sie den Typ zu Siri

2025-02-24 12:06:10
So verwenden Sie Amazon -Schließfächer, um Zeit zu sparen und Veranda -Piraten zu schlagen

2025-02-24 12:04:13
So lesen Sie Text aus Bildern unter Windows

2025-02-24 12:03:10
9 Nützliche Apps, die sich an Spotify anschließen

2025-02-24 12:02:09
So verwenden Sie Aufgaben und Erinnerungen innerhalb von Chatgpt

2025-02-24 12:01:10
So verwenden Sie Apple Intelligence, um Ihre E -Mails zu sortieren

2025-02-24 12:00:16
So richten Sie die neuen Diebstahlerkennungsfunktionen auf Android ein

2025-02-24 11:59:10
Wie man Gemini dazu bringt, sich an alles zu erinnern (oder zu vergessen), was Sie gesagt haben

2025-02-24 11:58:14

Aktuelle Ausgaben

function_exists() kann die benutzerdefinierte Funktion nicht ermitteln Funktionstest () {Verwendung der Verwendung durch -Durch -Durch -Durch -Durch -Durch -Durc...

Aus 2024-04-29 11:01:01

0

3

2825

So zeigen Sie die mobile Version von Google Chrome an Hallo Lehrer, wie kann ich Google Chrome in eine mobile Version umwandeln?

Aus 2024-04-23 00:22:19

0

11

2945

Das untergeordnete Fenster bedient das übergeordnete Fenster, aber die Ausgabe antwortet nicht. Die ersten beiden Sätze sind ausführbar, der letzte Satz jedoch nicht.

Aus 2024-04-19 15:37:47

0

1

2470

Im übergeordneten Fenster erfolgt keine Ausgabe document.onclick = function(){ window.opener.document.write('Ich bin die Ausgabe des unter...

Aus 2024-04-18 23:52:34

0

1

2394

Wo gibt es die Kursunterlagen zum CSS-Mindmapping? Kursunterlagen

Aus 2024-04-16 10:10:18

0

0

2444

verwandte Themen

Mehr>

Beliebte Empfehlungen

Beliebte Tutorials

Mehr>

Verwandte Tutorials

Beliebte Empfehlungen

Aktuelle Kurse

Neueste Downloads

Mehr>

Web-Effekte

Quellcode der Website

Website-Materialien

Frontend-Vorlage