Inhaltsverzeichnis
Richten Sie die Umgebung ein
Website-Inhalte abrufen
保存并比较网站内容
自动化网站监控
结论
Heim Backend-Entwicklung Python-Tutorial Python-Skript zur Überwachung von Website-Änderungen

Python-Skript zur Überwachung von Website-Änderungen

Aug 29, 2023 pm 12:25 PM
监控 网站变化 python脚本

Python-Skript zur Überwachung von Website-Änderungen

Im heutigen digitalen Zeitalter ist es aus verschiedenen Gründen von entscheidender Bedeutung, die neuesten Änderungen auf Ihrer Website zu kennen, z. B. um Aktualisierungen auf der Website Ihres Konkurrenten zu verfolgen, die Produktverfügbarkeit zu überwachen oder über wichtige Informationen auf dem Laufenden zu bleiben. Die manuelle Überprüfung Ihrer Website auf Änderungen kann zeitaufwändig und ineffizient sein. Hier kommt die Automatisierung ins Spiel.

In diesem Blogbeitrag erfahren Sie, wie Sie ein Python-Skript erstellen, um Website-Änderungen zu überwachen. Indem wir die Leistungsfähigkeit von Python und einigen praktischen Bibliotheken nutzen, können wir den Prozess des Abrufens von Website-Inhalten, des Vergleichs mit früheren Versionen und der Benachrichtigung über etwaige Änderungen automatisieren. Dadurch können wir proaktiv bleiben und zeitnah auf Aktualisierungen oder Änderungen der von uns überwachten Websites reagieren.

Richten Sie die Umgebung ein

Bevor wir mit dem Schreiben von Skripten zur Überwachung von Website-Änderungen beginnen, müssen wir eine Python-Umgebung einrichten und die erforderlichen Bibliotheken installieren. Befolgen Sie diese Schritte, um loszulegen -

  • Python installieren Laden Sie Python herunter und installieren Sie es auf Ihrem System, falls Sie es noch nicht getan haben. Sie können die offizielle Python-Website (https://www.python.org/) besuchen und die neueste Version herunterladen, die mit Ihrem Betriebssystem kompatibel ist. Stellen Sie sicher, dass Sie während der Installation die Option zum Hinzufügen von Python zu Ihrem Systempfad auswählen.

  • Erstellen Sie eine neue virtuelle Python-Umgebung (optional) Es wird empfohlen, für dieses Projekt eine virtuelle Umgebung zu erstellen, um Abhängigkeiten isoliert zu halten. Öffnen Sie ein Terminal oder eine Eingabeaufforderung, navigieren Sie zum gewünschten Projektverzeichnis und führen Sie den folgenden Befehl aus:

python -m venv website-monitor-env
Nach dem Login kopieren

Dadurch wird eine neue virtuelle Umgebung namens „website-monitor-env“ in Ihrem Projektverzeichnis erstellt.

  • Virtuelle Umgebung aktivieren Aktivieren Sie die virtuelle Umgebung, indem Sie den entsprechenden Befehl basierend auf Ihrem Betriebssystem ausführen:

Für Windows

website-monitor-env\Scripts\activate.bat
Nach dem Login kopieren

Für macOS/Linux

source website-monitor-env/bin/activate
Nach dem Login kopieren

Sie sollten den Namen der virtuellen Umgebung in der Eingabeaufforderung oder im Terminal sehen, was darauf hinweist, dass Sie in einer virtuellen Umgebung arbeiten.

  • Installieren Sie die erforderlichen Bibliotheken Nachdem Sie die virtuelle Umgebung aktiviert haben, installieren wir die erforderlichen Bibliotheken. Führen Sie in einem Terminal oder einer Eingabeaufforderung den folgenden Befehl aus:

pip install requests beautifulsoup4
Nach dem Login kopieren
  • Die Bibliothek „requests“ hilft uns beim Abrufen von Website-Inhalten, während „beautifulsoup4“ beim Parsen von HTML hilft.

Nachdem wir die Python-Umgebung eingerichtet und die erforderlichen Bibliotheken installiert haben, können wir mit der Erstellung des Skripts zur Überwachung von Website-Änderungen beginnen. Im nächsten Abschnitt gehen wir durch den Prozess des Abrufens von Website-Inhalten mithilfe der „Requests“-Bibliothek.

Website-Inhalte abrufen

Um Website-Änderungen zu überwachen, müssen wir den aktuellen Inhalt der Website abrufen und ihn mit zuvor gespeicherten Versionen vergleichen. In diesem Abschnitt verwenden wir die „Requests“-Bibliothek, um Website-Inhalte abzurufen. Bitte befolgen Sie diese Schritte:

  • Notwendige Module importierenÖffnen Sie Ihr Python-Skript und importieren Sie zuerst die erforderlichen Module

import requests
from bs4 import BeautifulSoup
Nach dem Login kopieren

Das Modul „requests“ verarbeitet HTTP-Anfragen, während die Klasse „BeautifulSoup“ im Modul „bs4“ uns beim Parsen des HTML-Inhalts hilft.

  • Website-URL angeben Bestimmen Sie die URL der Website, die Sie überwachen möchten. Zur Demonstration verwenden wir beispielsweise die URL „https://example.com“. Ersetzen Sie es durch die tatsächliche URL der Website, die Sie überwachen möchten.

url = "https://example.com"
Nach dem Login kopieren
  • 发送 GET 请求并检索内容 使用“requests.get()”方法向网站 URL 发送 GET 请求并检索内容。将响应分配给变量以进行进一步处理。

response = requests.get(url)
Nach dem Login kopieren
  • 检查响应状态最好检查响应的状态以确保请求成功。我们将使用“response.status_code”属性,该属性应在请求成功时返回状态代码 200。

if response.status_code == 200:
    # Proceed with further processing
else:
    print("Failed to retrieve website content. Status code:", response.status_code)
    # Handle error or exit the script
Nach dem Login kopieren

检索网站内容后,您可以将其与之前保存的版本进行比较,以确定是否有任何更改。

保存并比较网站内容

一旦我们检索了网站内容,我们需要将其保存以供将来比较。在本节中,我们将讨论如何保存内容并将其与以前保存的版本进行比较。请按照以下步骤操作

  • 保存初始网站内容 − 检索网站内容后,将其保存到文件中以供将来比较。创建一个新文件并使用“write()”方法将内容写入其中。例如

with open("website_content.txt", "w") as file:
    file.write(response.text)
Nach dem Login kopieren
Nach dem Login kopieren

这会将网站内容保存在当前目录中名为“website_content.txt”的文件中。

  • 与之前的内容进行比较 为了检测更改,我们需要将当前网站内容与之前保存的版本进行比较。从保存的文件中读取内容并将其与新内容进行比较。例如

with open("website_content.txt", "r") as file:
    previous_content = file.read()

if response.text == previous_content:
    print("No changes detected.")
else:
    print("Website content has changed.")
    # Perform further actions for handling the changes
Nach dem Login kopieren

在这里,我们将响应中的新内容与从文件中读取的内容进行比较。如果它们匹配,则不会检测到任何更改。否则,我们会打印一条消息,表明网站内容已更改。

  • 更新保存的内容  如果检测到更改,我们应该使用新版本更新保存的内容。这将确保下一次比较是针对最新内容进行的。使用与之前相同的文件写入逻辑来更新内容:

with open("website_content.txt", "w") as file:
    file.write(response.text)
Nach dem Login kopieren
Nach dem Login kopieren

通过覆盖文件,我们将新内容保存为最新版本。

通过执行以下步骤,您可以保存初始网站内容,将其与未来版本进行比较,并识别任何更改。在下一节中,我们将探讨如何使用 Python 脚本自动执行此过程。

自动化网站监控

每次我们想要监视网站的更改时手动运行脚本可能是乏味且不切实际的。在本节中,我们将讨论如何使用 Python 脚本和调度工具自动化网站监控过程。请按照以下步骤操作:

  • 创建 Python 脚本 打开您喜欢的 Python 编辑器或 IDE 并创建一个新的 Python 脚本文件。您可以将其命名为“website_monitor.py”。

  • 导入必要的模块 在脚本的开头,导入所需的模块,包括用于发出 HTTP 请求的“请求”和用于在请求之间添加延迟的“时间”。此外,导入您可能需要的任何其他模块,用于根据网站更改发送通知或执行其他操作。

import requests
import time
# Import other modules as needed
Nach dem Login kopieren
  • 定义网站网址和监控间隔  通过将要监控的网站的 URL 分配给变量来设置它。另外,指定您要检查更改的时间间隔。此间隔可以以秒、分钟或任何其他合适的单位为单位。

website_url = "https://example.com"
monitoring_interval = 300  # Check every 5 minutes
Nach dem Login kopieren
  • 创建监控函数 定义一个封装监控逻辑的函数。该函数将负责发出 HTTP 请求、比较网站内容并根据更改执行任何所需的操作。

def monitor_website():
    while True:
        # Make the HTTP request to the website
        response = requests.get(website_url)

        # Compare the current content with the saved content
        with open("website_content.txt", "r") as file:
            previous_content = file.read()

        if response.text != previous_content:
            print("Website content has changed.")
            # Perform desired actions for handling the changes

        # Update the saved content
        with open("website_content.txt", "w") as file:
            file.write(response.text)

        # Wait for the specified interval before the next check
        time.sleep(monitoring_interval)
Nach dem Login kopieren
  • 调用监控函数 在脚本末尾添加对 monitor_website() 函数的调用以启动监控过程。

monitor_website()
Nach dem Login kopieren
  • 保存脚本  将 Python 脚本文件保存在系统上的适当位置。

  • 安排脚本  要自动化监控过程,您可以使用 cron(在基于 Unix 的系统上)或任务计划程序(在 Windows 上)等调度工具。设置计划以所需的时间间隔执行脚本,确保其在后台连续运行。

此脚本将定期检查网站内容的更改并相应地执行任何指定的操作。

结论

监控网站更改对于及时了解最新内容或检测可能影响您的业务或个人利益的任何修改至关重要。在本文中,我们探讨了如何创建 Python 脚本来监控网站更改。通过利用 Python 及其库的强大功能,我们可以自动化该过程并及时收到有关任何修改的通知。

我们首先了解网站监控的重要性及其带来的好处。然后,我们深入研究了构建监控脚本所需的步骤。我们学习了如何发出 HTTP 请求、比较网站内容以及根据更改执行操作。此外,我们还讨论了使用调度工具自动执行脚本的选项,确保无需人工干预即可持续监控。

Das obige ist der detaillierte Inhalt vonPython-Skript zur Überwachung von Website-Änderungen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Kennen Sie einige Gründe, warum geplante Crontab-Aufgaben nicht ausgeführt werden? Kennen Sie einige Gründe, warum geplante Crontab-Aufgaben nicht ausgeführt werden? Mar 09, 2024 am 09:49 AM

Zusammenfassung einiger Gründe, warum geplante Crontab-Aufgaben nicht ausgeführt werden: 9. Januar 2019, 09:34:57 Uhr Autor: Hope on the Field In diesem Artikel werden hauptsächlich einige Gründe zusammengefasst, warum geplante Crontab-Aufgaben nicht ausgeführt werden Für jeden der möglichen Auslöser werden Lösungen angegeben, die für Kollegen, die auf dieses Problem stoßen, einen gewissen Referenz- und Lernwert haben. Vorwort: Ich bin kürzlich auf einige Probleme bei der Arbeit gestoßen Die Aufgabe wurde nicht ausgeführt. Als ich später im Internet suchte, stellte ich fest, dass im Internet hauptsächlich diese fünf Anreize erwähnt wurden: 1. Der Crond-Dienst ist keine Funktion des Linux-Kernels, sondern basiert auf einem Cron.

PyCharm Advanced Tutorial: Verwenden Sie PyInstaller, um Code in das EXE-Format zu packen PyCharm Advanced Tutorial: Verwenden Sie PyInstaller, um Code in das EXE-Format zu packen Feb 20, 2024 am 09:34 AM

PyCharm ist eine leistungsstarke integrierte Python-Entwicklungsumgebung, die eine Fülle von Funktionen und Tools bietet, um Entwicklern bei der Verbesserung der Effizienz zu helfen. Unter diesen ist PyInstaller ein häufig verwendetes Tool, das Python-Code in eine ausführbare Datei (EXE-Format) packen kann, um die Ausführung auf Computern ohne Python-Umgebung zu erleichtern. In diesem Artikel stellen wir vor, wie Sie PyInstaller in PyCharm verwenden, um Python-Code in das EXE-Format zu packen und spezifische bereitzustellen

Entdecken Sie Orange3: Eröffnen Sie eine neue Welt des Data Mining und maschinellen Lernens! Entdecken Sie Orange3: Eröffnen Sie eine neue Welt des Data Mining und maschinellen Lernens! Mar 04, 2024 pm 08:16 PM

Orange3 ist ein leistungsstarkes Open-Source-Tool für Datenvisualisierung und maschinelles Lernen. Es verfügt über umfangreiche Datenverarbeitungs-, Analyse- und Modellierungsfunktionen und bietet Benutzern einfache und schnelle Lösungen für Data Mining und maschinelles Lernen. In diesem Artikel werden die Grundfunktionen und die Verwendung von Orange3 kurz vorgestellt und mit tatsächlichen Anwendungsszenarien und Python-Codefällen kombiniert, um den Lesern zu helfen, die Verwendungsfähigkeiten von Orange3 besser zu beherrschen. Zu den Grundfunktionen von Orange3 gehören das Laden von Daten, die Datenvorverarbeitung, die Funktionsauswahl, die Modellerstellung und -bewertung usw. Benutzer können die intuitive Benutzeroberfläche verwenden, um Komponenten per Drag-and-Drop zu verschieben und Datenprozesse einfach zu erstellen. Gleichzeitig können auch komplexere Datenverarbeitungs- und Modellierungsaufgaben über Python-Skripte erledigt werden. Im Folgenden werden wir ein praktisches Beispiel durchgehen

So wiederholen Sie eine Zeichenfolge in Python_Tutorial zum Wiederholen von Zeichenfolgen in Python So wiederholen Sie eine Zeichenfolge in Python_Tutorial zum Wiederholen von Zeichenfolgen in Python Apr 02, 2024 pm 03:58 PM

1. Öffnen Sie zuerst Pycharm und rufen Sie die Pycharm-Homepage auf. 2. Erstellen Sie dann ein neues Python-Skript, klicken Sie mit der rechten Maustaste – klicken Sie auf „Neu“ – klicken Sie auf „Pythondatei“. 3. Geben Sie eine Zeichenfolge ein, Code: s="-". 4. Dann müssen Sie die Symbole in der Zeichenfolge 20 Mal wiederholen, Code: s1=s*20 5. Geben Sie den Druckausgabecode ein, Code: print(s1). 6. Führen Sie abschließend das Skript aus und Sie sehen unten unseren Rückgabewert: - 20 Mal wiederholt.

So lesen Sie Excel-Daten in Pycharm So lesen Sie Excel-Daten in Pycharm Apr 03, 2024 pm 08:42 PM

Wie lese ich Excel-Daten mit PyCharm? Die Schritte sind wie folgt: Installieren Sie die OpenpyXL-Bibliothek. Laden Sie die Excel-Arbeitsmappe.

Flask-Installations- und Konfigurations-Tutorial: ein Tool zum einfachen Erstellen von Python-Webanwendungen Flask-Installations- und Konfigurations-Tutorial: ein Tool zum einfachen Erstellen von Python-Webanwendungen Feb 20, 2024 pm 11:12 PM

Tutorial zur Installation und Konfiguration von Flask: Ein Tool zum einfachen Erstellen von Python-Webanwendungen. Es sind spezifische Codebeispiele erforderlich. Einführung: Mit der zunehmenden Beliebtheit von Python ist die Webentwicklung zu einer der notwendigen Fähigkeiten für Python-Programmierer geworden. Um eine Webentwicklung in Python durchzuführen, müssen wir ein geeignetes Webframework auswählen. Unter den vielen Python-Web-Frameworks ist Flask ein einfaches, benutzerfreundliches und flexibles Framework, das von Entwicklern bevorzugt wird. In diesem Artikel wird die Installation des Flask-Frameworks vorgestellt.

Welche Tools zur Abfrage von Website-Subdomains gibt es? Welche Tools zur Abfrage von Website-Subdomains gibt es? Mar 07, 2024 am 09:49 AM

Zu den Tools zur Abfrage von Website-Subdomains gehören: 1. Whois Lookup: kann die Registrierungsinformationen eines Domainnamens, einschließlich Subdomainnamen, abfragen. 2. Sublist3r: kann den Subdomainnamen eines Domainnamens mithilfe von Suchmaschinen und anderen Tools automatisch scannen . DNSdumpster: Kann Informationen wie den Subdomainnamen, die IP-Adresse und den DNS-Eintrag des Domainnamens abfragen. 4. Fierce: Sie können die Subdomainnameninformationen des Domainnamens über den DNS-Server abfragen: 5. Nmap; ng; 7. Google Hacking.

Laravel-Überwachungsfehler: Verbessern Sie die Anwendungsstabilität Laravel-Überwachungsfehler: Verbessern Sie die Anwendungsstabilität Mar 06, 2024 pm 04:48 PM

Die Überwachung von Fehlern in Laravel ist ein wichtiger Bestandteil zur Verbesserung der Anwendungsstabilität. Während des Entwicklungsprozesses treten zwangsläufig verschiedene Fehler auf. Die rechtzeitige Erkennung und Behebung dieser Fehler ist einer der Schlüssel zur Gewährleistung des normalen Betriebs der Anwendung. Laravel bietet eine Fülle von Tools und Funktionen, die Entwicklern bei der Überwachung und Behandlung von Fehlern helfen. In diesem Artikel werden einige wichtige Methoden vorgestellt und spezifische Codebeispiele angehängt. 1. Protokollierung nutzen Die Protokollierung ist eines der wichtigsten Mittel zur Fehlerüberwachung. Laravel verfügt über ein leistungsstarkes integriertes Protokollierungssystem, Entwickler

See all articles