使用JavaScript 從網站將資料抓取到Google 表格
嘗試從使用JavaScript 的網站(例如提供的錦標賽軟體URL)匯入資料時,Google 表格的內建-由於內容的動態特性,像IMPORTXML 和IMPORTHTML 這樣的函數經常會失敗。
辨識內容是否是動態的新增了
-
在 Chrome 中停用 JavaScript: 按 Ctrl Shift P,輸入 javascript,然後選擇停用 JavaScript。重新載入頁面以檢查所需內容是否仍可見。如果是,則可以透過 Google Sheets 功能存取。
探索替代方法
由於網站內容是由JavaScript 動態呈現的,您可以考慮使用網頁抓取技術:
-
檢查robots.txt: 決定Google 的伺服器是否被封鎖。如果是,您將遇到 #N/A 無法取得 URL 錯誤。
-
檢查使用者代理程式:驗證網站在使用特定使用者代理程式時不會傳回自訂訊息。
-
使用網頁抓取工具:利用網頁抓取軟體或考慮使用具有 URL 取得服務的 Google Apps 腳本來繞過 JavaScript限制。
-
避免匯入大型內容:請注意,Google 表格對匯入內容有大小限制。
-
考慮使用具有 URL 提取服務的 Google Apps 腳本: 即使 JavaScript 是動態渲染的,此服務也使您能夠發出編程請求並從網站檢索資料內容。
相關資源
- [使用Google Apps 腳本抓取動態網頁](https://gsuitedevelopers.googleblog.com/2013/01/using- google-apps -script-to-scrape.html)
- [網頁抓取工具/軟體可用於免費? ](https://webapps.stackexchange.com/questions/74794/web-scraping-tool-software-available-for-free)
以上是如何使用 JavaScript 將動態網站資料抓取到 Google Sheets 中?的詳細內容。更多資訊請關注PHP中文網其他相關文章!