cudaMemcpy-Segmentierungsfehler
Beim Aufruf von cudaMemcpy zum Übertragen von Daten vom Gerät zum Host können Benutzer auf einen Segmentierungsfehler stoßen. Dies ist häufig auf eine unsachgemäße Handhabung von Gerätezeigern zurückzuführen.
Das Problem
Der folgende Code veranschaulicht das Problem:
cudaMemcpy(CurrentGrid->cdata[i], Grid_dev->cdata[i], size*sizeof(float),\ cudaMemcpyDeviceToHost);
Hier ist Grid_dev ein Gerätezeiger auf ein Grid-Klassenobjekt. Der Versuch, diesen Zeiger im cudaMemcpy-Aufruf direkt zu dereferenzieren, kann zu einem Segmentierungsfehler führen.
Lösung
Um dieses Problem zu beheben, muss ein Zwischenzeiger auf dem Host erstellt werden um auf den Gerätezeiger zu verweisen. Der folgende Code beschreibt die überarbeitete Lösung:
float * A; cudaMalloc((void**)&A, sizeof(float)); ... ... cudaMemcpy(&A, &(Grid_dev->cdata[i]), sizeof(float *), cudaMemcpyDeviceToHost); CurrentGrid->cdata[i] = new float[size]; cudaMemcpy(CurrentGrid->cdata[i], A, size*sizeof(float), cudaMemcpyDeviceToHost);
In diesem modifizierten Code ist A ein Host-Zeiger, der zunächst auf einen Gerätezeiger zeigt. Indem wir den Wert von Grid_dev->cdata[i] mit cudaMemcpy nach A kopieren, übertragen wir den Gerätezeiger effektiv auf den Host. Anschließend kann CurrentGrid->cdata[i] einem neuen Float-Array auf dem Host zugewiesen werden und die Daten können vom Gerätezeiger A auf dieses Array kopiert werden.
Das obige ist der detaillierte Inhalt vonWarum verursacht „cudaMemcpy' beim Kopieren vom Gerät zum Host einen Segmentierungsfehler und wie kann ich ihn beheben?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!