Deklarieren von UTF-8-Zeichenfolgen im Python-Quellcode
Betrachten Sie den folgenden Code in Python 2:
<code class="python">u = unicode('d…') s = u.encode('utf-8') print s</code>
Beim Ausführen dieses Codes wird aufgrund eines Nicht-ASCII-Zeichens im Quellcode ein SyntaxError ausgelöst. Um dieses Problem zu beheben, muss die UTF-8-Kodierung im Quellcode-Header deklariert werden:
<code class="python"># -*- coding: utf-8 -*- ....</code>
Diese Deklaration weist Python an, UTF-8-Kodierung für die Quelldatei zu verwenden. Nach der Deklaration können UTF-8-Zeichen überall im Code verwendet werden. Zum Beispiel:
<code class="python"># -*- coding: utf-8 -*- u = 'idzie wąż wąską dróżką' uu = u.decode('utf8') s = uu.encode('cp1250') print(s)</code>
In Python 3 ist UTF-8 die Standard-Quellkodierung, sodass Unicode-Zeichen ohne spezielle Deklaration verwendet werden können.
Das obige ist der detaillierte Inhalt vonWie deklariert man UTF-8-Strings im Python-Quellcode?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!