ホームページ > バックエンド開発 > C++ > 8192 要素を処理するとループが遅くなるのはなぜですか?

8192 要素を処理するとループが遅くなるのはなぜですか?

DDD
リリース: 2024-12-10 09:51:10
オリジナル
680 人が閲覧しました

Why is My Loop Slow When Processing 8192 Elements?

8192 要素をループするとパフォーマンスが低下する理由

8192 要素をループすると、プログラムの速度が大幅に低下します。これは、非効率なループ構造によって悪化するメモリ アライメントの問題が原因であると考えられます。

メモリ アライメント

最新のプロセッサは、キャッシュ階層を利用してデータ アクセス速度を向上させています。データがキャッシュ ライン サイズの倍数のアドレスに格納されるアラインメント メモリ アクセスにより、より高速なデータ取得が可能になります。ただし、この場合、SIZE パラメータは 8192 として定義されており、これはキャッシュ ライン サイズ (通常は 64 バイト) の倍数ではありません。この不整合により、メモリ アクセス操作が遅くなる可能性があります。

ループの順序

メモリ アライメントの問題をさらに悪化させるのは、ループの順序です。元のコードは行列を列方向に反復するため、非順次メモリ アクセスが発生します。これにより、プロセッサはメモリからのデータのランダムな取得をより低速で実行するようになります。

解決策

考えられる解決策は 2 つあります。

  1. Alignメモリ: SIZE をキャッシュ ライン サイズの倍数に再定義します (例: 8192) 64).
  2. ループの順序を交換する: 列方向の反復の代わりに、行列を行方向に反復します。これにより、メモリ アクセスがキャッシュ ライン構成に合わせて調整され、より高速かつ効率的なデータ取得が可能になります。

コード内のループの順序を入れ替えることにより、パフォーマンスのボトルネックが解消されます。

次のコードは、修正:

for(j=1;j<SIZE-1;j++) {
    for(i=1;i<SIZE-1;i++) {
        res[j][i]=0;
        res[j][i] += img[j-1][i-1];
        ...
    }
}
ログイン後にコピー

パフォーマンスの比較

修正を適用すると、パフォーマンスが大幅に向上しました:

元のコード:

SIZE = 8191: 1.499 seconds
SIZE = 8192: 2.122 seconds
SIZE = 8193: 1.582 seconds
ログイン後にコピー

修正コード:

SIZE = 8191: 0.376 seconds
SIZE = 8192: 0.357 seconds
SIZE = 8193: 0.351 seconds
ログイン後にコピー

以上が8192 要素を処理するとループが遅くなるのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート