前端如何做到盡量可以防採集?有什麼好的實現方案?
前端如何做到盡量可以防採集?有什麼好的實現方案?
你去學習一下爬取網站或者說是反反爬蟲的內容,然後一一想出應對措施,哈哈
通常會檢驗一下referer
, 不過並沒有什麼卵用...
沒有人研究過嗎?
防止爬蟲抓取嗎?好像沒有完美的方案吧
沒有完美方法,有些輔助方法,根據IP請求次數,例如短時間內訪問100次,那麼阻止該IP。 。但是有代理的存在,所以也沒什麼用,只能防新手。
有或限制並發,一個端只能10並發之類的。
其實也一樣,IP代理+多線程,還是突破並發限制,所以也只是防新手。
ajax取得資料並展示出來;一般採集不支援js執行
加入亂碼符號,但又透過div等標籤讓亂碼顯示不出來(如不可見、字號最小、顏色跟底色一樣)。這個方法在《讀者》官網以前有使用過。
誰能在前端上面達到防採集的效果,呵呵,可以獲諾貝爾物理獎了 -- By phantomjs
增加隱藏的控件,包含url,訪問這個url的就是機器