python - 一般公司做爬虫采集的话常用什么语言
阿神
阿神 2017-04-17 17:48:02
0
30
1819

一般公司做爬虫采集的话常用什么语言 在京东搜点书全是有关java的

阿神
阿神

闭关修行中......

全部回覆(30)
刘奇

scrapy +1

用起來很方便,功能還算很多的,文件很清晰:

scrapy官網

小葫芦

題主都自己給加了 python 標籤,為啥還要問啥語言……

PHPzhong

我所在的公司用的是Java。

黄舟

用瀏覽器或類別瀏覽器解析頁面遠沒有正規分析來的快 想用選擇器就要建樹 這可不是個省力氣的活
不過正規解析最大的問題是別人一改版你這可能就是改到爽的節奏

迷茫

nodejs +1

PHPzhong

python比較多吧,偶爾會去用java

Ty80

寫過ruby的用nokogiri, 不過高效率的話還是python比較順手

PHPzhong

節點+1

大家讲道理

語言不是問題,具體業務看模組,要有一個好用的http庫一個好用的並發庫一個好用的作業調度庫一個好用的標記語言解析庫,這些都具備了再說語言有不錯的性能有比較優美的語法最後還要看公司大部分人是不是能夠接受這門語言,從寬泛的角度來看,python java ruby​​ nodejs c#,都具備這些條件,至於如何取捨就看後面的幾個條件了

洪涛

我們就是用ruby寫的

熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板