首頁 Java java教程 零基礎寫Java知乎爬蟲之準備工作

零基礎寫Java知乎爬蟲之準備工作

Dec 24, 2016 am 11:07 AM

開篇我們還是和原來一樣,講一講做爬蟲的思路以及需要準備的知識吧,高手們請直接忽略。

首先我們來縷一縷思緒,想想到底要做什麼,列個簡單的需求。

需求如下:

1.模擬訪問知乎官網(http://www.zhihu.com/)

2.下載指定的頁面內容,包括:今日最熱,本月最熱,編輯推薦

3.下載指定分類中的所有問答,例如:投資,編程,掛科

4.下載指定回答者的所有回答

5.最好有個一鍵點讚的變態功能(這樣我就可以一下子給雷倫的所有回答都點讚了我真是太機智了! )

那麼需要解決的技術問題簡單羅列如下:

1.模擬瀏覽器訪問網頁

2.抓取關鍵數據並保存到本地

3.解決網頁瀏覽中的動態加載問題

4.使用樹狀結構海量抓取知乎的所有內容

好的,目前就想了這些。

接下來就是準備工作了。

1.確定爬蟲語言:由於以前寫過一系列爬蟲教程(點擊這裡),百度貼吧,糗事百科,山東大學的績點查詢等都是用python寫的,所以這次決定使用Java來寫(餵完全沒有半毛錢聯繫好嗎)。

2.科普爬蟲知識:網路爬蟲,即Web Spider,是一個很形象的名字。把網路比喻成蜘蛛網,那麼Spider就是在網路上爬來爬去的蜘蛛。網路蜘蛛透過網頁的連結位址來尋找網頁。具體的入門介紹請(點這裡)。

3.準備爬蟲環境:Jdk和Eclipse的安裝和配置就不多說啦。這裡囉嗦一句,一個好用的瀏覽器對於爬蟲來說非常重要,因為首先你需要自己瀏覽網頁知道你需要的東西在哪裡,你才能告訴你的爬蟲們去哪裡怎麼爬。個人推薦火狐瀏覽器,或Google瀏覽器,它們的右鍵審查元素和查看原始碼的功能都非常強大。

下面我們開始正式的爬蟲之旅! ~具體講些什麼呢,恩,這是個問題,讓我好好想想,別急^_^



 以上就是零基礎寫Java知乎爬蟲之準備工作 的內容,更多相關內容請關注PHP中文網(www.php.cn)!


本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
2 週前 By 尊渡假赌尊渡假赌尊渡假赌
倉庫:如何復興隊友
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Java 中的平方根 Java 中的平方根 Aug 30, 2024 pm 04:26 PM

Java 中的平方根

Java 中的完美數 Java 中的完美數 Aug 30, 2024 pm 04:28 PM

Java 中的完美數

Java 中的隨機數產生器 Java 中的隨機數產生器 Aug 30, 2024 pm 04:27 PM

Java 中的隨機數產生器

Java中的Weka Java中的Weka Aug 30, 2024 pm 04:28 PM

Java中的Weka

Java 中的阿姆斯壯數 Java 中的阿姆斯壯數 Aug 30, 2024 pm 04:26 PM

Java 中的阿姆斯壯數

Java 中的史密斯數 Java 中的史密斯數 Aug 30, 2024 pm 04:28 PM

Java 中的史密斯數

Java Spring 面試題 Java Spring 面試題 Aug 30, 2024 pm 04:29 PM

Java Spring 面試題

突破或從Java 8流返回? 突破或從Java 8流返回? Feb 07, 2025 pm 12:09 PM

突破或從Java 8流返回?

See all articles