如何在 OpenMP 中高效地执行数组缩减？-C++-PHP中文网

如何在 OpenMP 中高效地执行数组缩减？

Susan Sarandon

发布： 2024-12-03 09:07:12

原创

1142 人浏览过

How to Efficiently Perform Array Reductions in OpenMP?

在 OpenMP 中求解数组归约

在 OpenMP 中，不支持直接对数组进行归约。但是，存在替代方法可以实现类似的结果。

第一种方法：

一种方法涉及为每个线程创建数组的私有副本并在本地减少它们。在并行部分之后，使用关键部分将私有数组合并到原始数组中，以防止数据竞争。

int S[10] = {0};

#pragma omp parallel
{
    int S_private[10] = {0};

    #pragma omp for
    for (int n = 0; n < 10; ++n)
    {
        for (int m = 0; m <= n; ++m)
        {
            S_private[n] += A[m];
        }
    }

    #pragma omp critical
    {
        for (int n = 0; n < 10; ++n)
        {
            S[n] += S_private[n];
        }
    }
}

登录后复制

第二种方法：

另一种方法是分配一个更大的数组，其维度等于数组大小乘以线程数。然后每个线程填充数组的其部分。并行部分之后，将值合并到原始数组中，而不使用临界区。

int S[10] = {0};
int *S_private;

#pragma omp parallel
{
    const int nthreads = omp_get_num_threads();
    const int ithread = omp_get_thread_num();

    #pragma omp single
    {
        S_private = new int[10 * nthreads];
        for (int i = 0; i < (10 * nthreads); i++)
        {
            S_private[i] = 0;
        }
    }

    #pragma omp for
    for (int n = 0; n < 10; ++n)
    {
        for (int m = 0; m <= n; ++m)
        {
            S_private[ithread * 10 + n] += A[m];
        }
    }

    #pragma omp for
    for (int i = 0; i < 10; i++)
    {
        for (int t = 0; t < nthreads; t++)
        {
            S[i] += S_private[10 * t + i];
        }
    }
}

登录后复制

第二种方法更高效，特别是在涉及多个套接字的场景中，但它也需要仔细的内存处理以避免缓存问题。

以上是如何在 OpenMP 中高效地执行数组缩减？的详细内容。更多信息请关注PHP中文网其他相关文章！