In diesem Artikel wird hauptsächlich die Verwendung von Curl durch PHP zur Implementierung simulierter Anmelde- und Datenerfassungsfunktionen vorgestellt. Er analysiert die Verwendung von Curl durch PHP für Anmeldung, Überprüfung, Cookie-Betrieb und Datenerfassung sowie andere verwandte Implementierungstechniken kann darauf verweisen.
Das Beispiel in diesem Artikel beschreibt, wie PHP Curl verwendet, um Anmelde- und Erfassungsdatenfunktionen zu simulieren. Teilen Sie es als Referenz mit allen. Die Details lauten wie folgt:
Mit der Curl-Erweiterungsbibliothek von PHP können Sie die Anmeldung simulieren und einige Daten erfassen, die nur nach der Anmeldung mit einem Benutzerkonto angezeigt werden können. Der spezifische Implementierungsprozess ist wie folgt (persönliche Zusammenfassung):
1. Zuerst müssen Sie den HTML-Quellcode der entsprechenden Anmeldeseite analysieren, um einige notwendige Informationen zu erhalten:
(1) Die Adresse der Anmeldeseite;
(2) Adresse des Bestätigungscodes
(3) Der Name und die Übermittlungsmethode jedes Felds, das im Anmeldeformular übermittelt werden muss; > (4) Übermittlung des Anmeldeformulars Die Adresse
(5) Darüber hinaus müssen Sie die Adresse der zu erfassenden Daten kennen.
2. Holen Sie sich das Cookie und speichern Sie es (für Websites, die Cookie-Dateien verwenden):
$login_url = 'http://www.xxxxx'; //登录页面地址 $cookie_file = dirname(__FILE__)."/pic.cookie"; //cookie文件存放位置(自定义) $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $login_url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file); curl_exec($ch); curl_close($ch);
3. Holen Sie sich den Bestätigungscode und speichern Sie es it (für Websites, die Cookie-Dateien verwenden) Bestätigungscode-Website):
$verify_url = "http://www.xxxx"; //验证码地址 $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $verify_url); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); $verify_img = curl_exec($ch); curl_close($ch); $fp = fopen("./verify/verifyCode.png",'w'); //把抓取到的图片文件写入本地图片文件保存 fwrite($fp, $verify_img); fclose($fp);
Seit der Überprüfung Code kann nicht erkannt werden, ich hier Die Methode besteht darin, das Bild des Bestätigungscodes zu erfassen und in einer lokalen Datei zu speichern, es dann auf der HTML-Seite in Ihrem Projekt anzuzeigen, den Benutzer ausfüllen zu lassen und darauf zu warten, dass der Benutzer das ausfüllt Geben Sie Ihre Kontonummer, Ihr Passwort und Ihren Bestätigungscode ein und klicken Sie auf die Schaltfläche „Senden“. Fahren Sie mit dem nächsten Schritt fort.
4. Übermittlung des Anmeldeformulars simulieren:
$ post_url = 'http://www.xxxx'; //登录表单提交地址 $post = "username=$account&password=$password&seccodeverify=$verifyCode";//表单提交的数据(根据表单字段名和用户输入决定) $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $ post_url); curl_setopt($ch, CURLOPT_HEADER, false); curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); curl_setopt($ch, CURLOPT_POSTFIELDS, $post); //提交方式为post curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); curl_exec($ch); curl_close($ch);
5. Daten erfassen:
$data_url = "http://www.xxxx"; //数据所在地址 $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $data_url); curl_setopt($ch, CURLOPT_HEADER, false); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER,0); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); $data = curl_exec($ch); curl_close($ch);
Bisher wurde die Seite, auf der sich die Daten befinden, erfasst und in der String-Variablen $data gespeichert.
Es ist zu beachten, dass der HTML-Quellcode einer Webseite erfasst wird. Dies bedeutet, dass diese Zeichenfolge nicht nur die gewünschten Daten enthält, sondern auch viele HTML-Tags und andere Dinge, die Sie nicht benötigen wollen. Wenn Sie also die benötigten Daten extrahieren möchten, müssen Sie den HTML-Code der Seite analysieren, auf der die Daten gespeichert sind, und dann String-Manipulationsfunktionen, regulären Abgleich und andere Methoden kombinieren, um die gewünschten Daten zu extrahieren.
Die obige Methode ist für allgemeine Websites effektiv, die das http-Protokoll verwenden. Wenn Sie jedoch die Anmeldung bei einer Website simulieren möchten, die das https-Protokoll verwendet, müssen Sie die folgende Verarbeitung hinzufügen:
1 https-Überprüfung überspringen:
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);
2. Verwenden Sie den Benutzeragenten:
$UserAgent = 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.0.04506; .NET CLR 3.5.21022; .NET CLR 1.0.3705; .NET CLR 1.1.4322)'; curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent);
Wenn Sie diese Prozesse nicht hinzufügen, wird die simulierte Anmeldung durchgeführt nicht erfolgreich sein. Die Verwendung des oben genannten Programms zur Simulation der Anmeldung bei einer Website ist im Allgemeinen erfolgreich, muss jedoch tatsächlich noch auf der Grundlage der spezifischen Umstände der simulierten Website in Betracht gezogen werden. Beispiel: Einige Websites haben unterschiedliche Codierungen, sodass die von Ihnen erfassten Seiten verstümmelt sind. Zu diesem Zeitpunkt müssen Sie eine Codierungskonvertierung durchführen, z. B.:
, GBK-Codierung in UTF8-Codierung konvertieren. Es gibt auch einige Websites mit relativ hohen Sicherheitsanforderungen, wie z. B. Online-Banking, die den Verifizierungscode in einen Inline-Frame einfügen. In diesem Fall müssen Sie zuerst die Seite des Inline-Frames crawlen und dann die Adresse der Verifizierung extrahieren Holen Sie sich den Bestätigungscode noch einmal. Es gibt auch einige Websites (z. B. Online-Banking), die Formulare im JS-Code senden. Vor dem Absenden des Formulars werden auch einige Verarbeitungsschritte wie Verschlüsselung usw. durchgeführt. Wenn Sie es also direkt senden, ist dies nicht möglich Sie müssen sich erfolgreich anmelden. Nach einer ähnlichen Verarbeitung können Sie jedoch die gleiche Verarbeitung durchführen, wenn Sie die im js-Code ausgeführten spezifischen Vorgänge kennen, z. B. die Verschlüsselung , und dann die Daten übermitteln, damit es auch erfolgreich sein kann. Hier kommt jedoch der entscheidende Punkt: Wenn Sie nicht wissen, welche Vorgänge es überhaupt ausführt, z. B. wenn es verschlüsselt ist, Sie aber den spezifischen Verschlüsselungsalgorithmus nicht kennen, können Sie denselben Vorgang nicht ausführen , und Sie können es nicht erfolgreich simulieren. Ein typischer Fall in dieser Hinsicht ist das Online-Banking, bei dem das vom Benutzer übermittelte Passwort und der Bestätigungscode im js-Code verarbeitet werden. Wir haben jedoch keine Ahnung, welche Vorgänge es ausführt. wir können es also nicht simulieren. Wenn Sie also denken, Sie könnten die Anmeldung beim Online-Banking simulieren, nachdem Sie diesen Artikel gelesen haben, sind Sie zu naiv. Können Sie die Anmeldung auf der Website der Bank so einfach simulieren? Wenn es Ihnen gelingt, die Online-Banking-Kontrollen zu knacken, ist das natürlich eine andere Sache. Warum bin ich jedoch so tief berührt, weil ich auf dieses Problem gestoßen bin? Wenn ich nicht darüber rede, werde ich Tränen vergießen, wenn ich zu viel rede. . .$data = iconv("gb2312", "utf-8",$data);
Verwandte Empfehlungen:
Das obige ist der detaillierte Inhalt vonPHP verwendet Curl, um simulierte Anmelde- und Datenerfassungsfunktionsbeispiele zu implementieren. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!