HTTP GET 요청에서 데이터 수신 제한
HTML 페이지를 스크래핑할 때 GET 요청이 과도한 데이터를 소비하고 서비스가 중단되는 것을 방지하는 것이 중요합니다. 프로세스.
특정 리소스에서 수신된 데이터의 양을 제어하려면 io.LimitedReader. 이 리더는 소스에서 읽는 데이터를 지정된 제한으로 효과적으로 제한합니다.
// io.LimitedReader limits the number of bytes returned limitedReader := &io.LimitedReader{R: response.Body, N: limit} body, err := io.ReadAll(limitedReader)
대체 접근 방식은 io.LimitReader를 직접 사용하는 것입니다.
body, err := io.ReadAll(io.LimitReader(response.Body, limit))
io.LimitReader를 통합하여. LimitedReader 또는 io.LimitReader 메소드를 요청 처리 코드에 추가하면 최대 데이터 수집 임계값을 설정하여 과도한 응답이 요청 처리를 방해하지 않도록 할 수 있습니다. 스크래핑 효율성.
위 내용은 웹 스크래핑을 위한 HTTP GET 요청에서 데이터 소비를 어떻게 제한할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!