Go Crawler 프레임 워크에서 큐의 스레드 수 설정과 요청 지연이 요청의 동시 처리에 어떤 영향을 미칩니 까?
큐 스레드 수와 요청 지연 지연 언어 크롤러 프레임 워크 콜리
Go Crawler 프레임 워크를 Colly를 사용할 때 효율적인 동시 요청 처리가 중요합니다. 이 기사는 스레드 카운트 설정 설정을 파고 Colly의 queue
의 지연이 동시 처리에 영향을 미치고 일반적인 질문에 대답합니다.
문제 : 스레드 수와 요청 지연 사이의 상호 작용
queue
의 스레드 수를 2로 설정했다고 가정합니다.
q, _ : = queue.new (2, 스토리지)
3 개의 요청을 추가했습니다. 한편 colly.Limit()
각 요청의 지연을 5 초로 설정하는 데 사용됩니다. 두 개의 요청이 거의 동시에 발행되고 5 초 후에 응답 할 것으로 예상되며, 세 번째 요청은 5 초로 지연됩니다. 그러나 실제 결과는 다음과 같습니다.
- 두 가지 요청이 생성됩니다.
- 5 초 후에 첫 번째 요청이 응답하고 세 번째 요청이 생성됩니다.
- 5 초 후 두 번째 요청이 응답합니다.
- 5 초 후에 세 번째 요청이 응답합니다.
이것은 병렬로 처리되지 않습니다. queue
의 스레드 수가 실패하는 이유는 무엇입니까? colly.Limit()
가 queue
의 동시성에 영향을 미칩니 까? onrequest
콜백 함수는 실제로 요청을하지 않고 요청을 작성합니까?
분석 : 스레드 수와 요청 지연 사이의 독립성
Colly의 queue
동시 요청 수를 관리하고 colly.Limit()
는 각 요청에 대한 지연을 설정합니다. 둘은 독립적 인 메커니즘입니다.
queue
의 스레드 수는 동시에 처리 된 요청 수를 제한합니다. colly.Limit()
각 요청이 발행되기 전에 지연을 적용합니다.
위의 경우 :
-
queue
두 개의 요청을 생성하지만colly.Limit()
둘 다 5 초 동안 기다립니다. - 첫 번째 요청은 지연이 끝난 후 발행됩니다. 응답 후
queue
스레드를 출시하고 세 번째 요청을 만듭니다. - 두 번째 요청은 5 초 동안 기다린 후에도 보내지고 응답합니다.
- 세 번째 요청은 5 초 동안 기다린 후에도 보내지고 응답합니다.
따라서 요청 지연은 queue
의 동시성을 마스킹합니다.
onrequest
콜백 및 요청 발급 시간
요청이 실제로 발행 될 때가 아니라 요청이 queue
에 추가되면 onrequest
콜백 함수가 해고됩니다. 요청이 발행되기 전에 일부 전처리 작업을 수행하는 데 사용됩니다.
결론 : 스레드 수를 조정하고 지연을 요청하십시오
colly.Limit()
의 지연은 queue
스레드 수의 동시성 효과에 영향을 미칩니다. 진정한 동시성을 달성하려면 스레드 수를 신중하게 조정하고 요청 지연 설정이 필요합니다. 높은 동시성이 필요한 경우 colly.Limit()
에 의해 설정된 지연을 최소화하거나 제거하거나 더 미세한 동시성 제어 메커니즘을 고려해야합니다. 크롤링 속도를 제어 해야하는 경우 colly.Limit()
에 의존하는 대신 더 미세한 세분화 제어 방법을 사용하는 것이 좋습니다.
위 내용은 Go Crawler 프레임 워크에서 큐의 스레드 수 설정과 요청 지연이 요청의 동시 처리에 어떤 영향을 미칩니 까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

상위 카테고리 아카이브 페이지에 자식 카테고리를 표시하는 방법을 알고 싶습니까? 분류 아카이브 페이지를 사용자 정의 할 때 방문자에게 더 유용하기 위해이를 수행해야 할 수도 있습니다. 이 기사에서는 부모 카테고리 아카이브 페이지에 자식 카테고리를 쉽게 표시하는 방법을 보여줍니다. 하위 범주가 부모 카테고리 아카이브 페이지에 나타나는 이유는 무엇입니까? 부모 카테고리 아카이브 페이지에 모든 자식 카테고리를 표시하면 방문자에게 덜 일반적이고 유용 할 수 있습니다. 예를 들어, 책에 대한 WordPress 블로그를 실행하고 "테마"라는 분류법을 가지고 있다면 독자가 할 수 있도록 "소설", "논픽션"과 같은 하위 세포 체질을 추가 할 수 있습니다.

Intellij에서 ...

가상 통화 가격 상승의 요인은 다음과 같습니다. 1. 시장 수요 증가, 2. 공급 감소, 3. 긍정적 인 뉴스, 4. 낙관적 시장 감정, 5. 거시 경제 환경; 감소 요인에는 다음이 포함됩니다. 1. 시장 수요 감소, 2. 공급 증가, 3. 부정적인 뉴스의 파업, 4. 비관적 시장 감정, 5. 거시 경제 환경.

스프링 프로젝트 스타트 업에서 원형 종속성의 무작위성을 이해하십시오. Spring Project를 개발할 때는 프로젝트 시작시 원형 종속성으로 인한 무작위성에 직면 할 수 있습니다 ...

JDBC ...

배치 쿼리에 redistemplate을 사용할 때 반환 값이 비어있는 이유는 무엇입니까? 배치 쿼리 작업에 redistemplate를 사용하는 경우 반환 된 결과가 발생할 수 있습니다 ...

JavaScript가 일일 프로그래밍에서 사용자 컴퓨터 하드웨어 정보를 얻을 수없는 이유에 대한 토론 많은 개발자가 JavaScript를 직접 얻을 수없는 이유에 대해 궁금합니다 ...

원사를 통해 pyflink 작업을 제출하려고 할 때 원사에 pyflink 작업을 제출할 때 Python 스크립트를 찾을 수없는 이유를 분석하면 만날 수 있습니다.
