Puppeteer 是一個 Node.js 函式庫,它提供進階 API 來透過 DevTools 協定控制 Chrome 或 Chromium 瀏覽器。它是一個強大的工具,可用於網頁抓取、自動化測試、擷取螢幕截圖等。雖然在本地使用 Puppeteer 很簡單,但在伺服器上運行它需要額外的考慮。本指南將引導您完成在伺服器上啟動並執行 Puppeteer 的步驟。
這一步驟對於Puppeteer的成功執行至關重要。執行以下命令。
sudo apt update -y sudo apt upgrade -y
安裝以下相依性以確保 Puppeteer 順利運作。
sudo apt-get install libpangocairo-1.0-0 libx11-xcb1 libxcomposite1 libxcursor1 libxdamage1 libxi6 libxtst6 libnss3 libcups2 libxss1 libxrandr2 libatk1.0-0 libgtk-3-0 libasound2t64
執行以下命令來安裝最新版本的 Puppeteer,為了獲得最佳效能,始終建議安裝最新版本。
npm i puppeteer
您可以使用以下程式碼片段透過在您想要的路線呼叫此函數來驗證 Puppeteer 是否正常運作。
const puppeteer = require("puppeteer"); /** * Launches a Puppeteer browser, navigates to a webpage, and then closes the browser. * * Launch Options: * - headless: Run the browser in headless mode (no GUI). * - args: * - "--no-sandbox": Required if running as the root user. * - "--disable-setuid-sandbox": Optional, try if you encounter sandbox errors. */ const runPuppeteer = async () => { try { // Launch a Puppeteer browser instance with custom arguments const browser = await puppeteer.launch({ headless: true, args: [ "--no-sandbox", "--disable-setuid-sandbox", ], }); // Open a new page in the browser const page = await browser.newPage(); // Navigate to the specified URL await page.goto("https://www.google.com"); console.log("Navigation to Google completed."); // Close the browser await browser.close(); console.log("Browser closed successfully."); } catch (error) { console.error("An error occurred:", error); } }; // Execute the function runPuppeteer();
在伺服器上執行 Puppeteer 需要仔細設定來處理依賴項、權限和資源。透過遵循本指南,您可以有效地部署 Puppeteer 來執行伺服器環境中的網頁抓取或自動化測試等任務。對於更進階的用例,請考慮使用 PM2 等工具進行流程管理,使用 Docker 進行容器化。
請隨時與其他人分享本指南,如果您按照說明操作後遇到任何問題,請在評論中告訴我們。
以上是在伺服器上運行 Puppeteer:完整教程的詳細內容。更多資訊請關注PHP中文網其他相關文章!