Entity Framework의 Contains(): 대규모 데이터 세트의 성능 병목 현상
광범위한 데이터 세트와 함께 Entity Framework의 Contains()
방법을 사용하면 성능에 심각한 영향을 미칠 수 있습니다. 이는 생성된 SQL 내에서 일련의 OR 문으로 변환되기 때문에 발생하며, 이는 수많은 비교를 처리할 때 비효율적입니다.
다음 예를 고려해보세요.
<code class="language-csharp">var ids = Main.Select(a => a.Id).ToArray(); var rows = Main.Where(a => ids.Contains(a.Id)).ToArray();</code>
10,000개의 레코드 테이블과 100개의 요소 배열을 포함하는 비교는 모든 행을 검색하는 간단한 LINQ 쿼리보다 최대 288배 느릴 수 있습니다. 근본 원인은 IN 식에 대한 기본 ADO.NET 지원이 부족하기 때문입니다. EF의 해결 방법(복잡한 OR 표현식 트리)은 대규모 입력 세트의 경우 계산 비용이 많이 듭니다.
솔루션 및 전략
최적의 접근 방식은 ADO.NET 공급자가 기본적으로 지원하는 In()
연산자를 활용하여 SQL을 더욱 효율적으로 만드는 것입니다.
In()
이 가능하지 않은 경우 다음 대안을 고려하세요.
CompiledQuery
에는 기본 데이터 유형이 필요합니다. 배열이나 IEnumerable
과 함께 사용하려면 입력을 기본 유형(예: 쉼표로 구분된 문자열)으로 변환하는 사용자 정의 함수를 만드세요. 이 변환된 문자열은 CompiledQuery
연산자를 사용하여 In()
내에서 사용할 수 있습니다.미래를 전망
Entity Framework 팀은 이러한 성능 제한을 인식하고 공급자 모델에서 IN 식에 대한 기본 지원을 모색하고 있습니다. 이러한 개선으로 Contains()
대규모 데이터세트의 성능이 크게 향상됩니다.
위 내용은 대규모 데이터 세트에서 Entity Framework의 Contains() 연산자가 너무 느린 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!