Selenium – Fragen Sie nach dem Python-Crawler-Tool
阿神
阿神 2017-06-28 09:22:20
0
1
922

1) Was ich einfangen möchte, sind die Fans einer bestimmten Berühmtheit auf Instagram
2) Die Instagram-PC-Site verwendet viel JS-Rendering
3) Ich habe noch nie einen Crawler geschrieben und der Chef wird die Daten morgen brauchen

Ich verwende derzeit BeautifulSoup, seleniumphantomjs

Die Code-Demo ist wahrscheinlich

driver = webdriver.PhantomJS(self.browser)
driver.get(self.url)
driver.implicitly_wait(3)
element = driver.find_element_by_class_name("_s53mj")
element.click()
html =  driver.page_source
soup =  BeautifulSoup(html)

Das Problem ist:
1) Ich weiß nicht, ob der Klick erfolgreich ausgeführt wird, ob das Element des Klicks korrekt ist, der Treiber scheint keinen Rückgabewert für meine Referenz zu haben
2) Selbst wenn der Klick erfolgreich ist, schon Es passt nur die Click-Methode (in js) an. Was soll ich tun, wenn das Ziel nicht ausgelöst wird? 3) Ich weiß nicht, ob es zuerst gerendert wird. Wenn der Klick erfolgreich ausgeführt wird, wird er nicht an die Quelle zurückgegeben ?
Ah, vielen Dank an alle Reptilienmeisterpage_source, 还是 应该先 click

阿神
阿神

闭关修行中......

Antworte allen(1)
我想大声告诉你

说的是什么意思?百思不得其解啊。。。

selenium自动化,click能模仿用户点击,就跟你自己在页面上点击一样,一切都在虚拟浏览器驱动中进行。

看你的业务逻辑啊。。。比如有些数据要点击后才有,那就先click再获取源代码。

Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!