Erreur de segmentation cudaMemcpy
Lors de l'appel de cudaMemcpy pour transférer des données d'un appareil à un hôte, les utilisateurs peuvent rencontrer une erreur de segmentation. Cela provient souvent d'une mauvaise manipulation des pointeurs de périphérique.
Le problème
Le code suivant illustre le problème :
cudaMemcpy(CurrentGrid->cdata[i], Grid_dev->cdata[i], size*sizeof(float),\ cudaMemcpyDeviceToHost);
Ici, Grid_dev est un pointeur de périphérique vers un objet de classe grille. Tenter de déréférencer directement ce pointeur dans l'appel cudaMemcpy peut entraîner une erreur de segmentation.
Solution
Pour résoudre ce problème, un pointeur intermédiaire doit être créé sur l'hôte pour référencer le pointeur de périphérique. Le code suivant présente la solution révisée :
float * A; cudaMalloc((void**)&A, sizeof(float)); ... ... cudaMemcpy(&A, &(Grid_dev->cdata[i]), sizeof(float *), cudaMemcpyDeviceToHost); CurrentGrid->cdata[i] = new float[size]; cudaMemcpy(CurrentGrid->cdata[i], A, size*sizeof(float), cudaMemcpyDeviceToHost);
Dans ce code modifié, A est un pointeur d'hôte qui pointe initialement vers un pointeur de périphérique. En copiant la valeur de Grid_dev->cdata[i] vers A à l'aide de cudaMemcpy, nous transférons effectivement le pointeur de périphérique vers l'hôte. Par la suite, CurrentGrid->cdata[i] peut être attribué à un nouveau tableau flottant sur l'hôte et les données peuvent être copiées du pointeur de périphérique A vers ce tableau.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!