Können C-Compiler davon ausgehen, dass die numerische Darstellung eines Booleschen Werts nur 0 oder 1 ist, und führt dies zu undefiniertem Verhalten?-C++-php.cn

Können C-Compiler davon ausgehen, dass die numerische Darstellung eines Booleschen Werts nur 0 oder 1 ist, und führt dies zu undefiniertem Verhalten?

DDD

Freigeben： 2024-12-09 11:55:13

Original

309 Leute haben es durchsucht

Can C Compilers Assume a Boolean's Numerical Representation is Only 0 or 1, and Does This Lead to Undefined Behavior?

Compiler-Optimierung und undefiniertes Verhalten: Erlaubt C bestimmte Annahmen über Bools?

Einführung

In diesem Artikel wird untersucht, ob der C-Standard es Compilern erlaubt, bestimmte numerische Darstellungen für Bools anzunehmen, und ob dies der Fall ist Annahmen können zu Konsequenzen wie Programmabstürzen führen.

Das Problem

Ein Programmierer ist auf einen Programmabsturz gestoßen, als er einen nicht initialisierten Bool-Wert in einer Funktion verwendete, in die ein Bool serialisiert wurde eine Zeichenfolge. Überraschenderweise trat der Absturz nur auf einer bestimmten Plattform mit einem bestimmten Compiler mit aktivierter Optimierung auf.

Der problematische Code:

void Serialize(bool boolValue) {
    const char* whichString = boolValue ? "true" : "false";
    const size_t len = strlen(whichString);
    memcpy(destBuffer, whichString, len);
}

Nach dem Login kopieren

Wenn der Code mit Clang 5.0.0 und Optimierung ausgeführt wird ( -O2) kann es zum Absturz kommen. Dieses Verhalten entsteht aufgrund der Schlussfolgerung des Optimierers, dass sich die Zeichenfolgen „true“ und „false“ nur um 1 in der Länge unterscheiden. Anstatt die tatsächliche Länge zu berechnen, wird der Wert von boolValue verwendet, vorausgesetzt, dieser ist entweder 0 oder 1.

const size_t len = strlen(whichString); // original code
const size_t len = 5 - boolValue;       // clang optimization

Nach dem Login kopieren

Frage: Standardüberlegungen

Der Artikel stellt die Frage: Ist das der Fall? Erlaubt der C-Standard einem Compiler, anzunehmen, dass ein Bool nur eine interne numerische Darstellung von „0“ oder „1“ haben kann, und diese auf diese Weise zu verwenden? Oder handelt es sich um ein durch die Implementierung definiertes Verhalten, bei dem die Implementierung davon ausgegangen ist, dass alle ihre Bool-Werte immer nur 0 oder 1 enthalten und jeder andere Wert undefiniertes Verhaltensgebiet darstellt?

Antwort: Standardkonformität

Laut dem Autor ISO C ermöglicht (aber erfordert nicht) Implementierungen, diese Wahl zu treffen. Bei ISO C bleibt die interne Darstellung eines Bool-Werts unbestimmt, sodass Implementierungen ihre eigenen Annahmen treffen können.

Compiler-Optimierungsverhalten

System V ABI: Für Plattformen, die das System V ABI verwenden, das häufig auf x86-64-Systemen verwendet wird, wird ein an eine Funktion übergebenes Bool-Argument durch dargestellt die Bitmuster: 0 = falsch und 1 = wahr in den unteren 8 Bits des Registers. Im Speicher ist bool ein 1-Byte-Typ, der einen ganzzahligen Wert von 0 oder 1 haben muss.

Diese ABI-Entscheidung ermöglicht es dem Compiler, Optimierungen zu nutzen, z. B. 0 oder 1 für bool anzunehmen und bitweise auszuführen Operationen anstelle teurer Typkonvertierungen. Im bereitgestellten Beispiel hat der Optimierer dieses Verhalten ausgenutzt, um strlen(whichString) auf 5U – boolValue zu optimieren.

Andere Implementierungen und Annahmen:

Während die System-V-ABI weit verbreitet ist, könnten bei anderen Implementierungen andere Annahmen zugrunde gelegt werden. Sie könnten beispielsweise davon ausgehen, dass 0 = falsch und jeder Wert ungleich Null = wahr ist. In einem solchen Szenario generiert der Compiler möglicherweise keinen Code, der bei nicht initialisierten Bool-Werten abstürzt, es könnte aber dennoch als undefiniertes Verhalten betrachtet werden.

Die Gefahren von Programmabstürzen

Während der C-Standard solche Optimierungen zulässt, ist es wichtig zu beachten, dass Programme, die auf undefiniertes Verhalten stoßen, während ihrer gesamten Existenz als völlig undefiniert gelten. Dies bedeutet, dass ein Absturz auch dann auftreten kann, wenn das undefinierte Verhalten in einer Funktion auftritt, die eigentlich nie aufgerufen wird.

Best Practices und Vermeidung von undefiniertem Verhalten

Compiler werden immer beliebter Immer aggressiver bei der Optimierung des Codes, indem sie Verhaltensweisen annehmen, die auf ihrem internen Verständnis der Implementierung basieren. Für Programmierer ist es wichtig, sich nicht auf Implementierungsannahmen zu verlassen und sicherzustellen, dass ihr Code gültiges C ist, ohne davon auszugehen, dass er sich wie eine portable Assemblersprache verhält.

Um Probleme zu vermeiden, sollten Programmierer die folgenden Best Practices befolgen:

Verwenden Sie das Compiler-Flag -Wall, um Warnungen zu aktivieren.
Beheben Sie alle von Ihnen generierten Warnungen Compiler.
Beachten Sie, dass Annahmen über nicht initialisierte Variablen zu Programmabstürzen führen können.
Erwägen Sie die Verwendung von Tools wie Address Sanitizer und Memory Sanitizer, um die Verwendung nicht initialisierter Werte und potenziell undefiniertes Verhalten zu erkennen.

Das obige ist der detaillierte Inhalt vonKönnen C-Compiler davon ausgehen, dass die numerische Darstellung eines Booleschen Werts nur 0 oder 1 ist, und führt dies zu undefiniertem Verhalten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!