从 URL 中提取域
从 URL 中提取域是 Web 开发中的常见任务。例如,出于日志记录或安全目的,您可能需要识别请求的主机。下面是一个可以处理此任务的简单函数:
def get_domain(url): parsed = urlparse(url) return parsed.netloc
此函数使用 Python 的内置 urlparse 函数将 URL 解析为其组件,包括域名。返回对象的 netloc 属性包含 URL 的主机和端口。
其工作原理如下:
url = 'http://google.com/dhasjkdas/sadsdds/sdda/sdads.html' domain = get_domain(url) print(domain) # Prints: google.com
get_domain() 函数也适用于其他 URL 方案,例如HTTPS 和 FTP。
url = 'https://www.google.com/dhasjkdas/sadsdds/sdda/sdads.html' domain = get_domain(url) print(domain) # Prints: www.google.com
由于 urlparse 函数是 Python 中提供的标准库函数,因此您可以使用它无需第三方库即可在不同项目和平台上使用该技术。
以上是如何在 Python 中轻松从 URL 中提取域名?的详细内容。更多信息请关注PHP中文网其他相关文章!