L'exemple de cet article décrit comment Python implémente le codage d'URL de conversion chinoise. Partagez-le avec tout le monde pour votre référence, les détails sont les suivants :
Aujourd'hui, je dois m'occuper de choses sur Baidu Tieba. Si vous souhaitez créer une liste de mots-clés, ajoutez-les simplement directement à la liste chaque fois que vous en avez besoin. Cependant, si l'URL ajoutée à la liste est en chinois (par exemple « Lijiang »), le code d'adresse de l'URL est « Lijiang », une conversion est donc requise. Ici nous utilisons le module urllib.
>>> import urllib >>> data = '丽江' >>> print data 丽江 >>> data '\xe4\xb8\xbd\xe6\xb1\x9f' >>> urllib.quote(data) '%E4%B8%BD%E6%B1%9F'
Et si nous voulons revenir en arrière ?
>>> urllib.unquote('%E4%B8%BD%E6%B1%9F') '\xe4\xb8\xbd\xe6\xb1\x9f' >>> print urllib.unquote('%E4%B8%BD%E6%B1%9F') 丽江
Les étudiants attentifs constateront que ���� apparaît dans l'URL Tieba au lieu de « Lijiang », ce qui est en fait un problème d'encodage. Celui de Baidu est gbk et d'autres sites Web généraux tels que Google sont utf8. Cela peut donc être réalisé en utilisant les déclarations suivantes.
>>> import sys,urllib >>> s = '丽江' >>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk')) '%C0%F6%BD%AD' >>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8')) '%E4%B8%BD%E6%B1%9F' >>>
Pour plus d'articles liés à Python implémentant le codage d'URL de conversion chinois, veuillez faire attention au site Web PHP chinois !