8192 要素をループするとパフォーマンスが低下する理由
8192 要素をループすると、プログラムの速度が大幅に低下します。これは、非効率なループ構造によって悪化するメモリ アライメントの問題が原因であると考えられます。
メモリ アライメント
最新のプロセッサは、キャッシュ階層を利用してデータ アクセス速度を向上させています。データがキャッシュ ライン サイズの倍数のアドレスに格納されるアラインメント メモリ アクセスにより、より高速なデータ取得が可能になります。ただし、この場合、SIZE パラメータは 8192 として定義されており、これはキャッシュ ライン サイズ (通常は 64 バイト) の倍数ではありません。この不整合により、メモリ アクセス操作が遅くなる可能性があります。
ループの順序
メモリ アライメントの問題をさらに悪化させるのは、ループの順序です。元のコードは行列を列方向に反復するため、非順次メモリ アクセスが発生します。これにより、プロセッサはメモリからのデータのランダムな取得をより低速で実行するようになります。
解決策
考えられる解決策は 2 つあります。
コード内のループの順序を入れ替えることにより、パフォーマンスのボトルネックが解消されます。
例
次のコードは、修正:
for(j=1;j<SIZE-1;j++) { for(i=1;i<SIZE-1;i++) { res[j][i]=0; res[j][i] += img[j-1][i-1]; ... } }
パフォーマンスの比較
修正を適用すると、パフォーマンスが大幅に向上しました:
元のコード:
SIZE = 8191: 1.499 seconds SIZE = 8192: 2.122 seconds SIZE = 8193: 1.582 seconds
修正コード:
SIZE = 8191: 0.376 seconds SIZE = 8192: 0.357 seconds SIZE = 8193: 0.351 seconds
以上が8192 要素を処理するとループが遅くなるのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。