beautifulsoup - python requests 高频率刷新时卡顿

Question

我用requests.get()读取固定网页上的信息（网页非常简单，不超过十个字符），然后用beautifulsoup解析，我设定的是1秒读取一次，但是发现运行时非常不稳定，有时会隔十几秒才能读到内容。这是网站服务器端的问题...

PHP中文网 · Answer

차단되어 있으므로 비동기적으로 처리해야 합니다.

天蓬老师 · Answer

요청은 시간 초과를 제한하여 네트워크 문제인지 확인합니다.
이런 가벼운 추출도 있는데 평소에 사용해도 충분합니다.

PHPz · Answer

응답을 기다리는 동안 차단되나요?

阿神 · Answer

요청에는 문제가 없으며 비동기식 방법을 사용할 수 있습니다. 게다가 개인적으로 bs는 실제로 조금 느리다고 생각합니다. lxml에서 etree를 사용하여 직접 구문 분석할 수 있습니다.