Extrahieren der Domain aus einer URL
Das Extrahieren der Domain aus einer URL ist eine häufige Aufgabe in der Webentwicklung. Beispielsweise müssen Sie möglicherweise den Host einer Anfrage zu Protokollierungs- oder Sicherheitszwecken identifizieren. Hier ist eine einfache Funktion, die diese Aufgabe bewältigen kann:
def get_domain(url): parsed = urlparse(url) return parsed.netloc
Diese Funktion verwendet die in Python integrierte URLparse-Funktion, um die URL in ihre Komponenten, einschließlich des Domänennamens, zu analysieren. Das netloc-Attribut des zurückgegebenen Objekts enthält den Host und den Port der URL.
So funktioniert es:
url = 'http://google.com/dhasjkdas/sadsdds/sdda/sdads.html' domain = get_domain(url) print(domain) # Prints: google.com
Die Funktion get_domain() funktioniert auch mit anderen URL-Schemas, wie z HTTPS und FTP.
url = 'https://www.google.com/dhasjkdas/sadsdds/sdda/sdads.html' domain = get_domain(url) print(domain) # Prints: www.google.com
Da die URLparse-Funktion eine in Python verfügbare Standardbibliotheksfunktion ist, können Sie diese Technik auf verschiedene Weise verwenden Projekte und Plattformen, ohne dass Bibliotheken von Drittanbietern erforderlich sind.
Das obige ist der detaillierte Inhalt vonWie kann ich den Domänennamen einfach aus einer URL in Python extrahieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!