PHP는 차이점 세트와 대규모 배열 메모리 오버플로를 발견했습니다.

王林
풀어 주다: 2023-05-22 19:27:06
원래의
450명이 탐색했습니다.

PHP 개발에서는 대규모 배열을 처리할 때 메모리 문제가 발생하기 쉽습니다. 이 기사에서는 array_diff 알고리즘을 사용하여 거대한 배열의 차이점을 해결하는 방법에 대해 설명합니다. 또한, 대규모 배열로 작업할 때 성능을 최적화하기 위해 다양한 메모리 관리 기술을 사용하는 방법을 배우게 됩니다.

1. 문제 설명

시나리오를 생각해 보세요. 두 개의 배열이 있고 둘 다 매우 크고 각 배열에는 100,000개의 요소가 있습니다. 이제 우리는 이 두 배열의 차이점을 찾고 싶습니다. 쉽게 말하면 배열에만 존재하는 요소를 찾는 것입니다. 다음은 코드 구현입니다.

<?php
$array1 = array();
$array2 = array();

// 初始化数组1,2,每个数组都有 10 万个元素
for($i=0;$i<1000000;$i++){
    $array1[$i] = $i;
    $array2[$i] = $i+1;
}

// 计算差集
$result = array_diff($array1, $array2);

print_r($result);
?>
로그인 후 복사

위 코드를 실행하면 페이지가 빠르게 응답하지 않게 되고 PHP 스크립트에 할당 가능한 메모리가 부족하다는 오류가 보고됩니다. 이는 PHP의 기본 메모리 제한이 128MB로 대규모 배열을 처리할 만큼 크지 않기 때문입니다. 따라서 이 문제를 해결하려면 최적화 알고리즘이나 기타 메모리 관리 기술을 고려해야 합니다.

2. 최적화 알고리즘

배열의 요소가 이미 순서대로 정렬되어 있는 경우 커서를 사용하면 검색 속도를 높일 수 있어 실행 시간과 메모리 사용량을 줄일 수 있습니다. 코드 구현은 다음과 같습니다.

<?php
$array1 = array();
$array2 = array();

// 初始化数组1,2,每个数组都有 10 万个元素
for($i=0;$i<1000000;$i++){
    $array1[$i] = $i;
    $array2[$i] = $i+1;
}

// 排序数组1、2
sort($array1);
sort($array2);

// 初始化游标
$cursor1 = $cursor2 = 0;

// 计算差集
$result = array();
while($cursor1 < count($array1) && $cursor2 < count($array2)){
    if($array1[$cursor1] < $array2[$cursor2]){
        $result[] = $array1[$cursor1];
        $cursor1++;
    }
    elseif($array1[$cursor1] > $array2[$cursor2]){
        $cursor2++;
    }
    else{
        $cursor1++;
        $cursor2++;
    }
}

// 将数组1中剩余的元素添加入结果数组
while($cursor1 < count($array1)){
    $result[] = $array1[$cursor1];
    $cursor1++;
}

print_r($result);
?>
로그인 후 복사

위 코드는 실행 시간을 최적화하고 메모리 사용을 더욱 효율적으로 만듭니다. 그러나 배열이 순서대로 되어 있지 않으면 이 알고리즘은 작동하지 않습니다.

3. 분할 처리 기술 사용

PHP에서 array_diff는 대규모 배열을 처리할 때 매우 큰 메모리 오버헤드를 사용합니다. 그러나 PHP의 메모리 관리자는 각 메모리 할당에 대한 메모리 할당 테이블을 유지 관리합니다. 이 테이블은 각 메모리 할당의 크기와 위치를 감지합니다. 따라서 분할 처리 기술을 사용하면 큰 배열을 여러 개의 작은 하위 배열로 나누고 각 하위 배열을 별도로 처리하여 너무 많은 메모리 공간을 차지하지 않도록 할 수 있습니다. 코드 구현은 다음과 같습니다.

<?php
$array1 = array();
$array2 = array();

// 初始化数组1,2,每个数组都有 10 万个元素
for($i=0;$i<1000000;$i++){
    $array1[$i] = $i;
    $array2[$i] = $i+1;
}

// 分段,每段 10000 个元素
$chunkSize = 10000;
$chunks1 = array_chunk($array1, $chunkSize);
$chunks2 = array_chunk($array2, $chunkSize);

// 计算差集
$result = array();
foreach($chunks1 as $chunk1){
    $temp = array_diff($chunk1, array_merge(...$chunks2));
    $result = array_merge($result,$temp);
}

print_r($result);
?>
로그인 후 복사

위 코드에서는 배열을 10000 크기의 여러 하위 배열로 나누어서 Chunks1 및 Chunks2 배열에 저장합니다. 그런 다음 Chunk1을 반복하고 array_diff를 사용하여 각 하위 배열과 Chunk2 사이의 차이를 계산한 다음 결과를 $result 결과 배열에 추가합니다. 마지막으로 $result를 최종 결과에 병합합니다.

4. 생성기를 사용하여 순회 알고리즘 시뮬레이션

대형 배열의 메모리 문제를 해결하는 또 다른 방법은 PHP의 생성기를 사용하여 두 배열 간의 차이를 찾는 순회를 시뮬레이션하는 것입니다. PHP의 생성기를 사용하면 전체 시퀀스를 메모리에 구축하는 대신 시퀀스에서 하나씩 값을 생성할 수 있습니다. 다음은 코드 구현입니다.

<?php
$array1 = array();
$array2 = array();

// 初始化数组1,2,每个数组都有 10 万个元素
for($i=0;$i<1000000;$i++){
    $array1[$i] = $i;
    $array2[$i] = $i+1;
}

// 计算差集
$result = array();
function diff($arr1, $arr2) {
    sort($arr1);
    sort($arr2);
    $i = $j = 0;
    while($i < count($arr1) && $j < count($arr2)) {
        if($arr1[$i] < $arr2[$j]) {
            yield $arr1[$i];
            $i++;
        }
        elseif($arr1[$i] > $arr2[$j]){
            $j++;
        }
        else{
            $i++;
            $j++;
        }
    }
    while($i < count($arr1)) {
        yield $arr1[$i];
        $i++;
    }
}

// 遍历 generator
foreach (diff($array1, $array2) as $value) {
    $result[] = $value;
}

print_r($result);
?>
로그인 후 복사

위 코드에서는 생성기를 사용하여 배열 차이 집합을 계산하는 순회를 시뮬레이션하는 diff 함수를 정의합니다. 이 알고리즘은 하위 배열을 순차적으로 정렬한 다음 커서 비교를 사용하여 두 배열 간의 차이점을 찾아 메모리와 CPU 시간을 덜 사용합니다.

5. 요약

PHP 개발에서는 큰 배열을 다룰 때 특히 주의해야 합니다. 너무 많은 메모리를 차지하고 메모리 오버플로가 발생할 수 있기 때문입니다. 이 기사에서는 대규모 배열을 처리하는 데 사용할 수 있는 알고리즘 최적화, 조각별 처리 기술, 생성기 시뮬레이션 순회 알고리즘과 같은 기술을 소개했습니다. 선택하는 방법은 요구 사항과 환경에 따라 다릅니다. 필요에 따라 다양한 기술을 사용하여 코드를 최적화하여 대규모 배열을 처리할 때 코드 성능과 유지 관리성을 향상시킬 수 있습니다.

위 내용은 PHP는 차이점 세트와 대규모 배열 메모리 오버플로를 발견했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!