communauté

Apprendre

Bibliothèque d'outils

Outils d'IA

Loisirs

Français

Maison > développement back-end > Tutoriel Python > 为什么这个网页的源代码用python爬下来后用beautifulsoup解析后会出现字符丢失？

为什么这个网页的源代码用python爬下来后用beautifulsoup解析后会出现字符丢失？

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Libérer： 2016-06-06 16:22:10

original

1890 Les gens l'ont consulté

回复内容：

又是你这个只点感谢不点赞的坏人……
话说你为什么要这么心急地学呢，基础不扎实啊，太冒进了，很显然没有清晰的思路…

首先编程要有默认的编码，也就是在文件的一开始加上

 # -*- coding: utf-8 -*-
Copier après la connexion

你是python2  代码前 加上# coding:utf-8

看python培训黄哥的三篇文章 
python开发爬虫汉字编码不再是问题： 
将python2中汉字会出现乱码的事一次性说清楚 
article/python_bianma.md at master · pythonpeixun/article · GitHub
python爬虫访问多个网站、中文编码的处理。 
python爬虫访问多个网站、中文编码的处理。
python3访问sina首页中文的处理 
python3访问sina首页中文的处理


可能在你这个转来转处的地方丢失。
ur = list(ur)
 ur = ur[:-1]
＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊
 ur = res.contents[0]
    ur = list(ur)
    ur = ur[:-1]
    temp = unicode(ur[0])
    for index in range(0, len(ur), 4):
        temp = unicode(ur[index])
        print temp.strip()
        print ur[index+1].string
        print ur[index+1]['href']
        print '\n'
Copier après la connexion

似乎response 后面用了俩decode 后面一个改encode应该就好了吧。。。

Decode是把括号里转成Unicode

Encode是Unicode转成括号里，就是UTF-8

Unicode就是个中转站


再不行就同一楼ignore。。。

还是用Requests库来处理http请求吧

Article précédent：Python 有什么奇技淫巧？ Article suivant：怎样用 Windows 入门Python？

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Comment utiliser Photoshop sur votre téléphone

2025-02-24 12:36:12
Arrêtez de dépenser tellement d'argent pour les services de streaming

2025-02-24 12:11:09
Arrêtez de parler à votre téléphone: comment utiliser le type pour Siri

2025-02-24 12:06:10
Comment utiliser les casiers Amazon pour gagner du temps et battre les pirates de porche

2025-02-24 12:04:13
Comment lire le texte à partir d'images sur Windows

2025-02-24 12:03:10
9 applications utiles qui se connectent à Spotify

2025-02-24 12:02:09
Comment utiliser les tâches et les rappels à l'intérieur du chatppt

2025-02-24 12:01:10
Comment utiliser Apple Intelligence pour trier vos e-mails

2025-02-24 12:00:16
Comment configurer les nouvelles fonctionnalités de détection de vol sur Android

2025-02-24 11:59:10
Comment faire en sorte que les Gémeaux se souviennent (ou oublient) de tout ce que vous avez dit

2025-02-24 11:58:14

Derniers numéros

function_exists() ne peut pas déterminer la fonction personnalisée Function test () {return true;} if (function_exists ('test')) {echo "le test est une ...

Depuis 2024-04-29 11:01:01

0

3

2822

Comment afficher la version mobile de Google Chrome Bonjour professeur, comment puis-je changer Google Chrome en version mobile ?

Depuis 2024-04-23 00:22:19

0

11

2945

La fenêtre enfant exploite la fenêtre parent, mais la sortie ne répond pas. Les deux premières phrases sont exécutables, mais la dernière ne peut pas être implémentée...

Depuis 2024-04-19 15:37:47

0

1

2470

Il n'y a aucune sortie dans la fenêtre parent document.onclick = function(){ window.opener.document.write('Je suis la sortie de la fenêt...

Depuis 2024-04-18 23:52:34

0

1

2392

Où sont les didacticiels sur la cartographie mentale CSS ? Didacticiel

Depuis 2024-04-16 10:10:18

0

0

2444

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal