8192개 요소를 반복할 때 성능이 저하되는 이유
8192개 요소를 반복할 때 프로그램 속도가 크게 느려집니다. 이는 메모리 정렬 문제로 인해 발생하며 비효율적인 루프 구조로 인해 더욱 악화됩니다.
메모리 정렬
최신 프로세서는 캐시 계층 구조를 활용하여 데이터 액세스 속도를 향상시킵니다. 데이터가 캐시 라인 크기의 배수인 주소에 저장되는 정렬된 메모리 액세스를 통해 더 빠른 데이터 검색이 가능합니다. 그러나 이 경우 SIZE 매개변수는 8192로 정의되며 이는 캐시 라인 크기(일반적으로 64바이트)의 배수가 아닙니다. 이러한 잘못된 정렬로 인해 메모리 액세스 작업 속도가 느려질 수 있습니다.
루프 순서
메모리 정렬 문제를 더욱 복잡하게 만드는 것은 루프 순서입니다. 원래 코드는 행렬을 열 단위로 반복하므로 비순차적 메모리 액세스가 발생합니다. 이로 인해 프로세서는 메모리에서 데이터를 더 느리게 무작위로 검색하게 됩니다.
해결책
두 가지 가능한 해결 방법이 있습니다.
코드에서 루프 순서를 교환함으로써 성능 병목 현상이 제거됩니다.
예제
다음 코드는 수정:
for(j=1;j<SIZE-1;j++) { for(i=1;i<SIZE-1;i++) { res[j][i]=0; res[j][i] += img[j-1][i-1]; ... } }
성능 비교
수정 적용 후 성능이 크게 향상됩니다.
원본 코드:
SIZE = 8191: 1.499 seconds SIZE = 8192: 2.122 seconds SIZE = 8193: 1.582 seconds
고정 코드:
SIZE = 8191: 0.376 seconds SIZE = 8192: 0.357 seconds SIZE = 8193: 0.351 seconds
위 내용은 8192 요소를 처리할 때 루프가 느린 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!