Heim Backend-Entwicklung PHP-Tutorial 采集 初级的用php写的采集程序

采集 初级的用php写的采集程序

Jul 29, 2016 am 08:36 AM
采集

可以先用这个采集然后在用帝国处理
####################################################################################
#作者:9elong
#网站:个人小站不值一提
#时间:2007-01-01
#声明:仅用于学习php之用。
#功能:采集单页面图片。
#说明:3个示范表单已经写好正则用来示范。没有任何功能说明,一切都在源代码里。附加论坛图片采集正则示范
####################################################################################
//把图片从信息页抓取下来的函数
function  getimg($url,$n,$key,$imgqian,$imgbiao,$titlekey)
{
                //$key图片地址正则
                //$titlekey图片标题正则
                //$imgqian图片地址前缀
                //$imgbiao图片地址特殊标识
                global  $n;
                global  $msg;
                global  $result;
                global  $imgadd;
                global  $title;
                $msg=file_get_contents($url);
                $key=str_replace("{图片地址}","(.+)",$key);
                $key="|".$key."|isU";
                preg_match_all($key,$msg,$result);
                $c=count($result[0]);
                for($i=0;$i                {
                                $img=$result[0][$i]."
";
                                if(ereg("^.*".$imgbiao.".*$",$img))
                                {
                                                $img=str_replace($imgbiao,$imgqian.$imgbiao,$img);
                                                preg_match("|http://(.+)jpg|isU",$img,$img);
                                                $imgadd[$n]=$img[0];
                                                //echo  "采集 初级的用php写的采集程序
";
                                                $n++;
                                }
                                elseif(ereg("^.*jpg.*$",$img))
                                {
                                                preg_match("|http://(.+)jpg|isU",$img,$img);
                                                $imgadd[$n]=$img[0];
                                                if($img[0]!="")
                                                $n++;
                                }
                                unset($img);
                }                                
                                $titlekey=str_replace("{图片标题}","(.+)",$titlekey);
                                $titlekey="|".$titlekey."|isU";
                                preg_match($titlekey,$msg,$title);
                                //echo  $title[0];
                                return  $title;
                return  $msg;
                return  $result;
                return  $n;
                return  $imgadd;
}
####################################################################################
#不支持file_get_contents()函数可以使用下面的替换
#$i=0;
#$handle=@fopen($url,"rb");
#while  (!@feof($handle))
#{
#                $buffer[$i]=  @fgets($handle,  4096);
#                $i++;
#}
#fclose($handle);
#$msg=join("",$buffer);
####################################################################################
if($_GET['act']=="getimgadd"&&$_POST['url']!="")
{
                $url=$_POST['url'];
        getimg($url,"0",$_POST['key'],$_POST['imgqian'],$_POST['imgbiao'],$_POST['titlekey']);
####################################################################################
        //获取分页
                if($_POST['getpage']=="是")
        {
                                $_POST['page']=str_replace("{分页地址}","(.+)",$_POST['page']);
                $page="|".$_POST['page']."|isU";
                //echo  $page;
        preg_match_all($page,$msg,$presult);
                if($_POST['pc']==""||$_POST['pc']=="全部")
                        $pc=count($presult[0]);
                else
                                $pc=$_POST['pc'];
                if($_POST['pc']>count($presult[0]))
                                $pc=count($presult[0]);
                for($i=1;$i                {
                                $pageurl=$presult[0][$i];
                                //echo  $pageurl."
";
                                if(ereg("^.*[1-9].*$",$pageurl))
                                {
                                                $pageurl=str_replace("                                                $pagekey=str_replace("{关键地址}","(.+)",$_POST['pagekey']);
                                                $pagekey="|".$pagekey."|isU";
                                                preg_match($pagekey,$pageurl,$N3[$i]);
                                                //echo  ($N3[$i][0])."
";
                                                getimg($N3[$i][0],$n,$_POST['key'],$_POST['imgqian'],$_POST['imgbiao'],$_POST['titlekey']);
                                }
                }
        }
####################################################################################
        echo  "图片集〖".$title[1]."〗".$n."张图片被抓取
返回首页
";
                while(list($num,$var)=each($imgadd))
                {
                                if($_POST['showtype']=="图片")
                                {
                                                echo  "采集 初级的用php写的采集程序
";
                                }
                                else
                                echo  $var."
";
                }
####################################################################################
                //exit();
}
?>
实例1(信息页有分页,使用了简单的分页正则):


输入图片地址

图片地址正则'>

图片地址前缀

图片地址标识

图片标题正则{图片标题}'>

分页地址正则.[0-9]'>

分页地址模式










实例2(信息页没有分页,所以分页正则为空):

输入图片地址

图片地址正则

图片地址前缀

图片地址标识

图片标题正则{图片标题}'>

分页地址正则

分页地址模式










实例3(信息页没有分页,所以分页正则为空,图片为绝对地址,所以图片地址前缀为空):

输入图片地址

图片地址正则采集 初级的用php写的采集程序'>

图片地址前缀

图片地址标识

图片标题正则{图片标题}'>

分页地址正则

分页地址模式










华声论坛图片为附件http://bbs.hnol.net/dispbbs2.asp?boardID=50&ID=336436
图片地址正则:upload=jpg{图片地址}upload
图片地址标识:bbs
图片标题正则:帖子主题:{图片标题}
华声论坛图片为外链http://bbs.hnol.net/dispbbs2.asp?boardID=50&ID=336253
图片地址正则:img]{图片地址}/img
图片地址标识:jpg
图片标题正则:帖子主题:{图片标题}

以上就介绍了采集 初级的用php写的采集程序,包括了采集方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

<🎜>: Bubble Gum Simulator Infinity - So erhalten und verwenden Sie Royal Keys
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Nordhold: Fusionssystem, erklärt
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
Mandragora: Flüstern des Hexenbaum
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Java-Tutorial
1677
14
PHP-Tutorial
1279
29
C#-Tutorial
1257
24
Benachrichtigung über vollen iCloud-Speicher: So beheben Sie das Problem Benachrichtigung über vollen iCloud-Speicher: So beheben Sie das Problem Apr 24, 2024 pm 04:43 PM

Zeigt Ihr iPhone „iCloud-Speicher voll“ an, wenn Sie Dateien herunterladen oder etwas aus der Luft abwerfen? Der kostenlose iCloud-Speicherplan ist auf nur 5 GB begrenzt. Daher sollten Sie als Erstes die aktuelle iCloud-Speichersituation auf Ihrem Telefon überprüfen. Wenn noch genügend Speicherplatz vorhanden ist und Sie eine Benachrichtigung erhalten, helfen Ihnen diese Lösungen bei der Fehlerbehebung. Fix 1 – iCloud-Backup löschen Entfernen Sie die vorhandene Version des iCloud-Backups aus Ihren Telefoneinstellungen. Schritt 1 – Öffnen Sie die Einstellungen. Schritt 2 – Sie finden Ihre Apple-ID oben im Einstellungsfenster. Klicken Sie darauf, um es zu öffnen. Schritt 3 – Schalten Sie „iCloud“ ein, um die iCloud-Einstellungen zu öffnen. Schritt 4 – Runter

Wie verwende ich die Go-Sprache für die Datenerfassung in Echtzeit? Wie verwende ich die Go-Sprache für die Datenerfassung in Echtzeit? Jun 10, 2023 pm 05:46 PM

Mit der kontinuierlichen Weiterentwicklung der Internet-of-Things-Technologie ist die Echtzeit-Datenerfassung zu einem unverzichtbaren Bestandteil des digitalen Zeitalters geworden. Unter den verschiedenen Programmiersprachen hat sich die Go-Sprache aufgrund ihrer effizienten Parallelitätsleistung und prägnanten Syntax zur idealen Wahl für die Echtzeit-Datenerfassung entwickelt. In diesem Artikel wird erläutert, wie Sie die Go-Sprache für die Datenerfassung in Echtzeit verwenden. 1. Auswahl des Datenerfassungs-Frameworks Bevor wir die Go-Sprache für die Echtzeit-Datenerfassung verwenden, müssen wir ein Datenerfassungs-Framework auswählen, das zu uns passt. Zu den beliebtesten Datenerfassungs-Frameworks, die derzeit auf dem Markt sind, gehören:

Der iPhone-Bildschirm kehrt immer wieder zum Startbildschirm zurück Der iPhone-Bildschirm kehrt immer wieder zum Startbildschirm zurück Apr 17, 2024 am 08:28 AM

Kehrt Ihr iPhone-Bildschirm jedes Mal zum Startbildschirm zurück, wenn Sie eine bestimmte App öffnen? Dies ist ein ungewöhnliches Verhalten und der Grund dafür, dass Sie zum Startbildschirm zurückkehren, ist, dass die App aus irgendeinem Grund abgestürzt ist. Die Fehlerbehebung wird einfacher, wenn Sie diese Anweisungen befolgen. Fix 1 – Tippverhalten ändern Mit einer der Zurück-Gesten auf dem iPhone können Sie die aktuelle App minimieren. Das Deaktivieren des Klickverhaltens sollte dieses Problem beheben. Schritt 1 – Öffnen Sie die Einstellungen. Schritt 2 – Besuchen Sie später die Barrierefreiheitseinstellungen, um sie zu aktivieren. Schritt 3 – Gehen Sie zur Funktion „Physik & Motoren“ und öffnen Sie die „Touch“-Einstellungen. Schritt 4 – Wischen Sie ganz nach unten zu den „BackTap“-Einstellungen. Öffne es. Schritt 5 – Wählen Sie auf der Seite „Zurück klicken“ aus

iPhone bleibt im „Bitte nicht stören'-Modus hängen: So beheben Sie das Problem iPhone bleibt im „Bitte nicht stören'-Modus hängen: So beheben Sie das Problem May 03, 2024 pm 09:07 PM

Steckt Ihr iPhone im „Bitte nicht stören“-Modus fest? Es kann problematisch sein, wenn Sie den Modus „Bitte nicht stören“ nicht umschalten können. Sie erhalten überhaupt keine Benachrichtigungen. Es wird nicht viel Aufwand erfordern, dieses DND-Problem auf dem iPhone zu beheben. Sie müssen also keine Zeit mehr verschwenden und befolgen einfach diese einfachen Lösungen, um Ihr Problem zu lösen. Lösung 1 – Entfernen Sie den „Bitte nicht stören“-Zeitplan. Wenn Sie einen „Bitte nicht stören“-Zeitplan auf Ihrem Telefon haben, kann dies dazu führen, dass das Gerät automatisch in den „Nicht stören“-Modus wechselt. Schritt 1 – Gehen Sie zu den Einstellungen Ihres iPhones. Schritt 2 – Als nächstes schalten Sie den Fokusmodus ein. Schritt 3 – Oben in der Tabelle finden Sie „Bitte nicht stören“. Schritt 4 – Öffnen Sie es. Schritt 5 – Wenn Sie auf der nächsten Seite zur Registerkarte „Zeitplan“ wechseln, können Sie Folgendes tun

Fehler bei der Suche nach Updates im iPhone: Behebung Fehler bei der Suche nach Updates im iPhone: Behebung Apr 17, 2024 pm 10:40 PM

Erhalten Sie die Fehlermeldung „Es konnte nicht nach Updates gesucht werden“, während Sie auf Ihrem iPhone nach Updates suchen? Normalerweise wird diese Meldung angezeigt, wenn Sie manuell nach Updates suchen, während Ihr Telefon offline ist. Daher empfehlen wir Ihnen, WLAN/Mobilfunkdaten zu aktivieren und den gleichen Vorgang erneut durchzuführen. Wenn das Problem weiterhin besteht, befolgen Sie die verbleibenden Tipps zur Fehlerbehebung. Fix 1 – WLAN/Mobilfunkdaten aktivieren Aktivieren Sie WLAN oder Mobilfunkdaten und versuchen Sie erneut, nach Updates zu suchen. Schritt 1 – Wischen Sie einfach nach unten, um auf das Kontrollzentrum zuzugreifen. Schritt 2 – Aktivieren Sie WLAN oder Mobilfunk auf Ihrem Telefon. Versuchen Sie nun den Aktualisierungsvorgang erneut, nachdem Sie die Netzwerkverbindung aktiviert haben. Fix 2 – Neustart des iPhone erzwingen, wenn Wi-Fi/Bee trotzdem aktiviert ist

Analyse der Funktionen zur automatischen Seitenanmeldung und Sitzungsverwaltung der Python-Implementierung einer Headless-Browser-Sammlungsanwendung Analyse der Funktionen zur automatischen Seitenanmeldung und Sitzungsverwaltung der Python-Implementierung einer Headless-Browser-Sammlungsanwendung Aug 09, 2023 pm 07:06 PM

Analyse der automatischen Seitenanmeldungs- und Sitzungsverwaltungsfunktionen von Python zur Implementierung kopfloser Browser-Sammlungsanwendungen Einführung: Mit der rasanten Entwicklung des Internets ist unser Leben zunehmend untrennbar mit Netzwerkanwendungen verbunden. Bei vielen Webanwendungen müssen wir uns manuell anmelden, um weitere Informationen zu erhalten oder bestimmte Funktionen auszuführen. Um die Effizienz zu verbessern, können wir automatische Seitenanmeldungs- und Sitzungsverwaltungsfunktionen durch automatisierte Skripte implementieren. Headless-Browser: Bevor wir automatische Seitenanmeldungs- und Sitzungsverwaltungsfunktionen implementieren, müssen wir zunächst verstehen, was ein Headless-Browser ist.

Einführung in die Grundfunktionen und Verwendung von Python zur Implementierung kopfloser Browser-Sammlungsanwendungen Einführung in die Grundfunktionen und Verwendung von Python zur Implementierung kopfloser Browser-Sammlungsanwendungen Aug 08, 2023 am 09:13 AM

Einführung in die Grundfunktionen und Verwendung von Headless-Browser-Sammelanwendungen in Python. Mit der Entwicklung des Internets spielt die Crawler-Technologie eine wichtige Rolle bei der Datenerfassung und Informationsgewinnung. Ein Headless-Browser ist ein Browser ohne Schnittstelle, der Benutzervorgänge im Hintergrund simulieren, auf Webseiten zugreifen und die erforderlichen Daten abrufen kann. Python bietet eine Vielzahl von Bibliotheken und Tools zum Implementieren der Funktionen eines Headless-Browsers. In diesem Artikel wird die Verwendung von Python zum Implementieren der Grundfunktionen eines Headless-Browsers vorgestellt und entsprechende Codebeispiele bereitgestellt. 1. Headless-Browser

UniApp implementiert die Erfassung und Verarbeitung von Benutzerfeedback und Fehlerprotokollen UniApp implementiert die Erfassung und Verarbeitung von Benutzerfeedback und Fehlerprotokollen Jul 04, 2023 am 11:57 AM

UniApp ist ein plattformübergreifendes Anwendungsentwicklungs-Framework, das auf dem Vue.js-Framework basiert und zum Entwickeln von Anwendungen für mehrere Plattformen wie iOS, Android und H5 verwendet werden kann. Es bietet einen einheitlichen Satz an Entwicklungssyntax und Komponentenbibliotheken, um Entwicklern die schnelle Erstellung plattformübergreifender Anwendungen zu erleichtern. In der tatsächlichen Anwendungsentwicklung ist die Erfassung und Verarbeitung von Benutzerfeedback und Fehlerprotokollen sehr wichtig. In diesem Artikel wird erläutert, wie die Erfassung und Verarbeitung von Benutzerfeedback und Fehlerprotokollen in UniApp implementiert wird. Zunächst müssen wir entsprechende Plug-Ins in das UniApp-Projekt einführen

See all articles