python指定生成器迭代的位置开始

Question

一个爬虫程序需要断点恢复的功能, 之前把循环位置作为[a, b, c]保存在json当中 每次进程启动后先从json读取历史位置然后继续遍历 但因为想改成多线程版本, 就试着换成生成器 但这样一来, 每次进程退出重启, 迭代...

阿神 · Answer

무엇을 표현하고 싶은지 잘 모르겠습니다. 하지만 반복자는 다음과 같은 방식으로 시작 위치를 지정할 수 있습니다.

으아악

PHPz · Answer

아직도 무슨 말씀인지 잘 이해가 안 되지만, 대략적으로 추측해 보겠습니다. 틀렸다면 알려주세요.

다음 형식의 URL을 크롤링하려는 것 같습니다.

으아악

다음과 같은 세 가지 목록이 있습니다.

으아악

그런 다음 각각 index 및 limit를 사용하여 현재 위치와 각 목록의 최대 인덱스를 기록합니다.

으아악

그런 다음 모든 URL을 결합합니다.

으아악

위 내용은 제 개인적인 추측입니다. 이 작업을 완료하려면 다음을 수행하는 것이 좋습니다.

으아악

내가 답변한 질문: Python-QA