In diesem Kapitel wird der Inhalt im Zusammenhang mit „Python-Syntaxspezifikationen und Datentypen“ aktualisiert, hauptsächlich damit jeder versteht, welche Arten von Programmiermodellen Python hat, und die grundlegende Syntax von Python beherrscht. Machen Sie sich mit der Ausgabe und der grundlegenden Anwendung von Befehlszeilenparametern vertraut. Nachdem Sie die Datentypen von Python verstanden haben, können Sie weitere verwandte Vorgänge ausführen.
①Interaktive Python-Befehlsprogrammierung.
②Python-Skriptprogrammierung.
③Chinesische Kodierungsverarbeitung.
Der interaktive Befehlsprogrammiermodus ist ein typischer zeilenweiser Leseausführungsmodus.
Wenn das Programm nur eine Zeile oder weniger hat, ist dieser Programmiermodus eine typische Anwendungsmethode.
In der folgenden Abbildung wird der PythonIDLE-Editor zum Programmieren verwendet. Der Programmiermodus dieses Editors ist ein typisches interaktives Befehlscodierungssymbol.
>>>> ist die Eingabeaufforderung für die Eingabe interaktiver Befehle. Jedes Mal, wenn Sie nach der Eingabe die Eingabetaste drücken, wird der Befehl vom Python-Parser ausgeführt.
Wenn wir komplexere oder größere Codeabschnitte schreiben müssen, scheint es zwingend erforderlich nicht bequem genug.
Daher bietet Python einen Skriptprogrammiermodus. Sie können eine Skriptdatei mit dem Suffix *.py erstellen und eine große Menge Code in die Datei schreiben, was die Wartung und Aktualisierung des Codes erleichtert. Sie können ihn dann mithilfe interaktiver Befehle oder IDE-Tools ausführen.
String ist ein Datentyp. Bei Zeichenfolgen besteht jedoch ein besonderes Kodierungsproblem.
Da Computer nur Zahlen verarbeiten können, müssen Sie den Text vor der Verarbeitung zunächst in Zahlen umwandeln, wenn Sie Text verarbeiten möchten.
Die frühesten Computer wurden mit 8 Bits als Byte entwickelt, sodass ein Byte darstellen kann. Die größte ganze Zahl ist 255 (binär 11111111 = dezimal). 255). Wenn Sie eine größere Ganzzahl darstellen möchten, müssen Sie mehr Bytes verwenden. Beispielsweise ist die maximale Ganzzahl, die durch zwei Bytes dargestellt werden kann, 65535, und die maximale Ganzzahl, die durch 4 Bytes dargestellt werden kann, ist 4294967295.
Da der Computer von Amerikanern erfunden wurde, wurden zunächst nur 127 Zeichen in den Computer codiert, bei denen es sich um englische Groß- und Kleinbuchstaben, Zahlen und einige Symbole handelt. Diese Codierungstabelle wird beispielsweise als ASCII-Codierung bezeichnet. Der Code für den Großbuchstaben A ist 65 und der Code für den Kleinbuchstaben z ist 122.
Der Grund, warum Python3 das chinesische verstümmelte Problem gut lösen kann, ist, dass es alle Strings kombiniert sind alle mit Unicode zeichencodiert.
● Unicode vereint alle Sprachen in einem Satz von Codes, sodass keine verstümmelten Zeichen entstehen.
● Unicode entwickelt sich ebenfalls ständig weiter, aber die am häufigsten verwendete Methode ist die Verwendung von zwei Bytes zur Darstellung eines Zeichens (wenn Sie auf ein sehr seltenes Zeichen stoßen, benötigen Sie 4 Bytes). Die meisten Betriebssysteme und die meisten Programmiersprachen, die wir sehen, unterstützen jetzt Unicode.
Die ASCII-Kodierung beträgt 1 Byte, während die Unicode-Kodierung normalerweise 2 Byte beträgt.
Ein neues Problem tritt erneut auf: Bei Vereinheitlichung in die Unicode-Kodierung verschwindet das Problem mit dem verstümmelten Code. Wenn der Text, den Sie schreiben, jedoch grundsätzlich ausschließlich auf Englisch verfasst ist, benötigt die Unicode-Kodierung doppelt so viel Speicherplatz wie die ASCII-Kodierung, was hinsichtlich der Speicherung und Übertragung sehr unwirtschaftlich ist.
Die Geburtsstunde der Lösung: Es gibt eine weitere UTF-8-Kodierung, die die Unicode-Kodierung in „Variable-Längen-Kodierung“ umwandelt.
● Die UTF-8-Kodierung kodiert ein Unicode-Zeichen entsprechend unterschiedlicher Zahlengrößen in 1-6 Bytes, und chinesische Zeichen sind normalerweise 3 Bytes groß Zeichen werden in 4-6 Bytes kodiert.
● Wenn der Text, den Sie übertragen möchten, eine große Anzahl englischer Zeichen enthält, kann die Verwendung der UTF-8-Kodierung Platz sparen.
● Die UTF-8-Kodierung hat einen zusätzlichen Vorteil: Die ASCII-Kodierung kann tatsächlich als Teil der UTF-8-Kodierung betrachtet werden. Daher ist dies bei einer großen Anzahl historischer Legacy-Software möglich, die nur die ASCII-Kodierung unterstützt in UTF kodiert werden. Arbeiten Sie weiter unter -8-Kodierung.
Besonderer Hinweis: Die Unicode-Kodierung wird einheitlich im Computerspeicher verwendet.
In der Python3-Version werden Zeichenfolgen in Unicode codiert, was bedeutet, dass Python-Zeichenfolgen mehrere Sprachen unterstützen.
Für die Kodierung eines einzelnen Zeichens stellt Python die Funktion ord() bereit, um die dezimale Ganzzahldarstellung eines einzelnen Zeichens zu erhalten, und die Funktion chr(), um die Kodierung in das entsprechende Zeichen umzuwandeln.
>>> ord(‘A’) 65 >>> ord(‘中’) 20013 >>> chr(66) ‘B’ >>> chr(25991) ‘文’
Python-Quellcode ist ebenfalls eine Textdatei. Wenn Ihr Quellcode also Chinesisch enthält, müssen Sie beim Speichern des Quellcodes angeben, dass er als UTF-8-Kodierung gespeichert werden soll . Wenn der Python-Interpreter Quellcode liest, schreiben wir diese Zeile normalerweise an den Anfang der Datei, damit er in UTF-8-Kodierung gelesen werden kann.
#-*- coding:utf-8 *-
Der Kommentar soll den Python-Interpreter anweisen, den Quellcode gemäß der UTF-8-Codierung zu lesen. Andernfalls ist die chinesische Ausgabe, die Sie in den Quellcode schreiben, möglicherweise verstümmelt.
Das obige ist der detaillierte Inhalt vonAutomatisiertes Testen: mehrere gängige Programmiermuster in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!