Compiler-Optimierung und undefiniertes Verhalten: Erlaubt C bestimmte Annahmen über Bools?
Einführung
In diesem Artikel wird untersucht, ob der C-Standard es Compilern erlaubt, bestimmte numerische Darstellungen für Bools anzunehmen, und ob dies der Fall ist Annahmen können zu Konsequenzen wie Programmabstürzen führen.
Das Problem
Ein Programmierer ist auf einen Programmabsturz gestoßen, als er einen nicht initialisierten Bool-Wert in einer Funktion verwendete, in die ein Bool serialisiert wurde eine Zeichenfolge. Überraschenderweise trat der Absturz nur auf einer bestimmten Plattform mit einem bestimmten Compiler mit aktivierter Optimierung auf.
Der problematische Code:
void Serialize(bool boolValue) { const char* whichString = boolValue ? "true" : "false"; const size_t len = strlen(whichString); memcpy(destBuffer, whichString, len); }
Wenn der Code mit Clang 5.0.0 und Optimierung ausgeführt wird ( -O2) kann es zum Absturz kommen. Dieses Verhalten entsteht aufgrund der Schlussfolgerung des Optimierers, dass sich die Zeichenfolgen „true“ und „false“ nur um 1 in der Länge unterscheiden. Anstatt die tatsächliche Länge zu berechnen, wird der Wert von boolValue verwendet, vorausgesetzt, dieser ist entweder 0 oder 1.
const size_t len = strlen(whichString); // original code const size_t len = 5 - boolValue; // clang optimization
Frage: Standardüberlegungen
Der Artikel stellt die Frage: Ist das der Fall? Erlaubt der C-Standard einem Compiler, anzunehmen, dass ein Bool nur eine interne numerische Darstellung von „0“ oder „1“ haben kann, und diese auf diese Weise zu verwenden? Oder handelt es sich um ein durch die Implementierung definiertes Verhalten, bei dem die Implementierung davon ausgegangen ist, dass alle ihre Bool-Werte immer nur 0 oder 1 enthalten und jeder andere Wert undefiniertes Verhaltensgebiet darstellt?
Antwort: Standardkonformität
Laut dem Autor ISO C ermöglicht (aber erfordert nicht) Implementierungen, diese Wahl zu treffen. Bei ISO C bleibt die interne Darstellung eines Bool-Werts unbestimmt, sodass Implementierungen ihre eigenen Annahmen treffen können.
Compiler-Optimierungsverhalten
System V ABI: Für Plattformen, die das System V ABI verwenden, das häufig auf x86-64-Systemen verwendet wird, wird ein an eine Funktion übergebenes Bool-Argument durch dargestellt die Bitmuster: 0 = falsch und 1 = wahr in den unteren 8 Bits des Registers. Im Speicher ist bool ein 1-Byte-Typ, der einen ganzzahligen Wert von 0 oder 1 haben muss.
Diese ABI-Entscheidung ermöglicht es dem Compiler, Optimierungen zu nutzen, z. B. 0 oder 1 für bool anzunehmen und bitweise auszuführen Operationen anstelle teurer Typkonvertierungen. Im bereitgestellten Beispiel hat der Optimierer dieses Verhalten ausgenutzt, um strlen(whichString) auf 5U – boolValue zu optimieren.
Andere Implementierungen und Annahmen:
Während die System-V-ABI weit verbreitet ist, könnten bei anderen Implementierungen andere Annahmen zugrunde gelegt werden. Sie könnten beispielsweise davon ausgehen, dass 0 = falsch und jeder Wert ungleich Null = wahr ist. In einem solchen Szenario generiert der Compiler möglicherweise keinen Code, der bei nicht initialisierten Bool-Werten abstürzt, es könnte aber dennoch als undefiniertes Verhalten betrachtet werden.
Die Gefahren von Programmabstürzen
Während der C-Standard solche Optimierungen zulässt, ist es wichtig zu beachten, dass Programme, die auf undefiniertes Verhalten stoßen, während ihrer gesamten Existenz als völlig undefiniert gelten. Dies bedeutet, dass ein Absturz auch dann auftreten kann, wenn das undefinierte Verhalten in einer Funktion auftritt, die eigentlich nie aufgerufen wird.
Best Practices und Vermeidung von undefiniertem Verhalten
Compiler werden immer beliebter Immer aggressiver bei der Optimierung des Codes, indem sie Verhaltensweisen annehmen, die auf ihrem internen Verständnis der Implementierung basieren. Für Programmierer ist es wichtig, sich nicht auf Implementierungsannahmen zu verlassen und sicherzustellen, dass ihr Code gültiges C ist, ohne davon auszugehen, dass er sich wie eine portable Assemblersprache verhält.
Um Probleme zu vermeiden, sollten Programmierer die folgenden Best Practices befolgen:
Das obige ist der detaillierte Inhalt vonKönnen C-Compiler davon ausgehen, dass die numerische Darstellung eines Booleschen Werts nur 0 oder 1 ist, und führt dies zu undefiniertem Verhalten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!