mysql - Python深度爬取一个网站

Question

毕业设计项目需要从coursera,edx等大型MOOC网站爬取大量公开课课程信息，尝试着爬取了coursera的课程信息，但是每次都要重新在python代码中写入新的url，如：coursera.org/computer/database和coursera.org/compu...

天蓬老师 · Answer

クロールする場合、これらの URL を URL 配列に追加し、URL 配列内の URL を順番にクロールします。これは幅優先検索として理解できます。

伊谢尔伦 · Answer

最初にリストページをクロールし、次にサブページをクロールします。サブページが処理されたので、さらにリストページをクロールするだけです。
深さ幅アルゴリズムは必要ありません

。

天蓬老师 · Answer

scrapy を直接使用する

php 8、私も来ます