Vor kurzem habe ich an einem Projekt gearbeitet und bin auf ein Problem gestoßen. Wenn ThreadX, das auf ARM ausgeführt wird, mit dem DSP kommuniziert, verwendet es eine Nachrichtenwarteschlange, um Nachrichten zu übermitteln (die endgültige Implementierung verwendet Interrupts und Shared-Memory-Methoden). Während des tatsächlichen Betriebs wurde jedoch festgestellt, dass ThreadX häufig abstürzte. Nach einer Untersuchung wurde festgestellt, dass das Problem darin liegt, dass die Struktur, die die Nachricht weiterleitet, die Byteausrichtung nicht berücksichtigt.
Ich möchte die Probleme mit der Byteausrichtung in der C-Sprache klären und sie mit Ihnen teilen.
Die Byteausrichtung hängt mit der Position der Daten im Speicher zusammen. Wenn die Speicheradresse einer Variablen genau ein ganzzahliges Vielfaches ihrer Länge ist, spricht man von natürlicher Ausrichtung. Wenn beispielsweise unter einer 32-Bit-CPU angenommen wird, dass die Adresse einer Ganzzahlvariablen 0x00000004 ist, ist sie natürlich ausgerichtet.
Verstehen Sie zunächst, was Bits, Bytes und Wörter sind
Name | Englischer Name | Bedeutung |
---|---|---|
Bits | bit | 1 Binärziffer heißt 1 Bit |
Byte | Byte | 8 Binärbits werden als 1 Byte bezeichnet |
Wörter | Wort | Eine feste Länge, die von Computern verwendet wird, um Transaktionen gleichzeitig zu verarbeiten |
Die Anzahl der Bits in einem Wort, die Wortlänge moderner Computer beträgt normalerweise 16, 32 oder 64 Bit. (Im Allgemeinen beträgt die Wortlänge von N-Bit-Systemen N/8 Bytes.)
Verschiedene CPUs können eine unterschiedliche Anzahl von Datenbits gleichzeitig verarbeiten. Eine 32-Bit-CPU kann jeweils 32-Bit-Daten verarbeiten, und eine 64-Bit-CPU kann jeweils 64-Bit-Daten verarbeiten die Wortlänge.
Die sogenannte Wortlänge wird manchmal als Wort bezeichnet. In einer 16-Bit-CPU besteht ein Wort aus genau zwei Bytes, während in einer 32-Bit-CPU ein Wort aus vier Bytes besteht. Wenn wir Wörter als Einheit nehmen, gibt es Doppelwörter (zwei Wörter) und vier Wörter (vier Wörter) aufwärts.
Bei Standard-Datentypen muss seine Adresse nur ein ganzzahliges Vielfaches seiner Länge sein. Nicht-Standard-Datentypen werden nach den folgenden Prinzipien ausgerichtet: Array: Ausrichtung nach Basisdatentypen. Wenn der erste Datentyp ausgerichtet ist, gilt Folgendes diejenigen werden natürlich ausgerichtet. Union: Ausgerichtet nach dem darin enthaltenen Datentyp mit der größten Länge. Struktur: Jeder Datentyp in der Struktur muss ausgerichtet sein.
Standardmäßig weist der C-Compiler Platz für jede Variable oder Dateneinheit entsprechend ihren natürlichen Randbedingungen zu. Im Allgemeinen können die Standardrandbedingungen mit den folgenden Methoden geändert werden:
· Mit der Direktive #pragma pack (n) richtet sich der C-Compiler um n Bytes aus. · Verwenden Sie die Direktive #pragma pack(), um die benutzerdefinierte Byteausrichtung abzubrechen.
#pragma pack(n) wird verwendet, um Variablen auf n-Byte-Ausrichtung einzustellen. N-Byte-Ausrichtung bedeutet, dass es zwei Situationen für den Offset der Startadresse gibt, an der die Variable gespeichert wird:
Die Gesamtgröße der Struktur unterliegt ebenfalls einer Einschränkung. Wenn n größer oder gleich der Anzahl der von allen Mitgliedsvariablentypen belegten Bytes ist, muss die Gesamtgröße der Struktur ein Vielfaches des von ihr belegten Speicherplatzes sein Variable mit dem größten Leerzeichen; andernfalls müssen es n Vielfache sein.
Darüber hinaus gibt es die folgende Methode: · __attribute((aligned (n))), die es ermöglicht, die Strukturelemente an der natürlichen Grenze von n Bytes auszurichten. Wenn die Länge eines Elements in der Struktur größer als n ist, wird es entsprechend der Länge des größten Elements ausgerichtet. · Attribut ((gepackt)), bricht die optimierte Ausrichtung der Struktur während des Kompilierungsprozesses ab und richtet sie entsprechend der tatsächlich belegten Anzahl von Bytes aus.
Assembly-Code verwendet normalerweise .align, um die Anzahl der Byte-Ausrichtungsbits anzugeben.
.align: Wird zur Angabe der Datenausrichtung verwendet. Das Format lautet wie folgt:
.align [absexpr1, absexpr2]
Palle ungenutzte Speicherbereiche mit Werten in einer bestimmten Ausrichtung. Der erste Wert stellt die Ausrichtung dar, 4, 8, 16 oder 32. Der zweite Ausdruckswert stellt den gefüllten Wert dar.
操作系统并非一个字节一个字节访问内存,而是按2,4,8这样的字长来访问。因此,当CPU从存储器读数据到寄存器,IO的数据长度通常是字长。如32位系统访问粒度是4字节(bytes), 64位系统的是8字节。当被访问的数据长度为n字节且该数据地址为n字节对齐时,那么操作系统就可以高效地一次定位到数据, 无需多次读取,处理对齐运算等额外操作。数据结构应该尽可能地在自然边界上对齐。如果访问未对齐的内存,CPU需要做两次内存访问。
字节对齐可能带来的隐患:
代码中关于对齐的隐患,很多是隐式的。比如在强制类型转换的时候。例如:
unsigned int i = 0x12345678; unsigned char *p=NULL; unsigned short *p1=NULL; p=&i; *p=0x00; p1=(unsigned short *)(p+1); *p1=0x0000;
最后两句代码,从奇数边界去访问unsignedshort型变量,显然不符合对齐的规定。在x86上,类似的操作只会影响效率,但是在MIPS或者sparc上,可能就是一个error,因为它们要求必须字节对齐.
首先查看操作系统的位数
在64位操作系统下查看基本数据类型占用的字节数:
#include int main() { printf("sizeof(char) = %ld\n", sizeof(char)); printf("sizeof(int) = %ld\n", sizeof(int)); printf("sizeof(float) = %ld\n", sizeof(float)); printf("sizeof(long) = %ld\n", sizeof(long)); printf("sizeof(long long) = %ld\n", sizeof(long long)); printf("sizeof(double) = %ld\n", sizeof(double)); return 0; }
考虑下面的结构体占用的位数
struct yikou_s { double d; char c; int i; } yikou_t;
执行结果
sizeof(yikou_t) = 16
在内容中各变量位置关系如下:
其中成员C的位置还受字节序的影响,有的可能在位置8
编译器给我们进行了内存对齐,各成员变量存放的起始地址相对于结构的起始地址的偏移量必须为该变量类型所占用的字节数的倍数, 且结构的大小为该结构中占用最大空间的类型所占用的字节数的倍数。
对于偏移量:变量type n起始地址相对于结构体起始地址的偏移量必须为sizeof(type(n))的倍数结构体大小:必须为成员最大类型字节的倍数
char: 偏移量必须为sizeof(char) 即1的倍数 int: 偏移量必须为sizeof(int) 即4的倍数 float: 偏移量必须为sizeof(float) 即4的倍数 double: 偏移量必须为sizeof(double) 即8的倍数
我们将结构体中变量的位置做以下调整:
struct yikou_s { char c; double d; int i; } yikou_t;
执行结果
sizeof(yikou_t) = 24
各变量在内存中布局如下:
当结构体中有嵌套符合成员时,复合成员相对于结构体首地址偏移量是复合成员最宽基本类型大小的整数倍。
#pragma pack(4) struct yikou_s { char c; double d; int i; } yikou_t; sizeof(yikou_t) = 16
#pragma pack(8) struct yikou_s { char c; double d; int i; } yikou_t; sizeof(yikou_t) = 24
举例:以下是截取的uboot代码中异常向量irq、fiq的入口位置代码:
有手懒的同学,直接贴一个完整的例子给你们:
#include main() { struct A { int a; char b; short c; }; struct B { char b; int a; short c; }; struct AA { // int a; char b; short c; }; struct BB { char b; // int a; short c; }; #pragma pack (2) /*指定按2字节对齐*/ struct C { char b; int a; short c; }; #pragma pack () /*取消指定对齐,恢复缺省对齐*/ #pragma pack (1) /*指定按1字节对齐*/ struct D { char b; int a; short c; }; #pragma pack ()/*取消指定对齐,恢复缺省对齐*/ int s1=sizeof(struct A); int s2=sizeof(struct AA); int s3=sizeof(struct B); int s4=sizeof(struct BB); int s5=sizeof(struct C); int s6=sizeof(struct D); printf("%d\n",s1); printf("%d\n",s2); printf("%d\n",s3); printf("%d\n",s4); printf("%d\n",s5); printf("%d\n",s6); }
Das obige ist der detaillierte Inhalt vonDinge über die Linux-Byte-Ausrichtung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!