Heroku限制Puppeteer仅运行三次

Question

我正在开发一个使用puppeteer从另一个网站抓取数据的网站。当我在本地计算机上运行npm服务器时，它可以很好地抓取数据，但是当我将其部署到Heroku时，它只运行我要查找的前三个文件，然后停止。我本质上是想从我的学校网站上抓取有关课程的数据，因此我在for循环中运行此行，letdata=等待crawler.scrapeData(classesTaken[i].code)这会在下面运行这个函数。

P粉129168206 · Answer

进一步记录后，我发现问题是我打开浏览器然后从不关闭它而导致内存泄漏。通过在 scrapeData() 函数的 return 语句之前添加行 await browser.close() ，内存泄漏停止并且服务器能够正确解析所有类代码。