큰 텍스트 파일에서 특정 줄로 효율적으로 점프
줄 길이를 알 수 없는 대용량 텍스트 파일을 처리할 때, 줄 길이를 알 수 없는 대용량 텍스트 파일을 처리할 때 전체 파일을 반복하면 효율성이 크게 향상될 수 있습니다. 질문에서 강조된 일반적인 접근 방식은 반복적이지만 가장 최적의 솔루션은 아닙니다.
더 우아하고 효율적인 대안은 전처리 단계에서 각 줄의 시작 바이트 오프셋을 식별하는 것입니다. 이는 다음과 같이 오프셋 목록을 작성하여 수행할 수 있습니다.
<code class="python">line_offset = [] offset = 0 for line in file: line_offset.append(offset) offset += len(line)</code>
이 사전 처리된 목록이 구성되면 특정 줄로 점프하는 것이 쉬워집니다.
<code class="python">file.seek(line_offset[n])</code>
여기서 n은 원하는 라인의 인덱스(첫 번째 라인이 라인 0임). 이 기술을 사용하면 전체 파일을 스캔하지 않고도 원하는 라인으로 직접 탐색할 수 있으므로 대규모 데이터 세트의 처리 시간이 크게 단축됩니다.
위 내용은 큰 텍스트 파일의 특정 줄로 효율적으로 이동하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!