URL からのドメインの抽出
URL からのドメインの抽出は、Web 開発における一般的なタスクです。たとえば、ログ記録やセキュリティの目的で、リクエストのホストを特定する必要がある場合があります。このタスクを処理できる簡単な関数を次に示します。
def get_domain(url): parsed = urlparse(url) return parsed.netloc
この関数は、Python の組み込み urlparse 関数を使用して、URL をドメイン名を含むコンポーネントに解析します。返されたオブジェクトの netloc 属性には、URL のホストとポートが含まれます。
その仕組みは次のとおりです:
url = 'http://google.com/dhasjkdas/sadsdds/sdda/sdads.html' domain = get_domain(url) print(domain) # Prints: google.com
get_domain() 関数は、次のような他の URL スキームでも動作します。 HTTPS と FTP。
url = 'https://www.google.com/dhasjkdas/sadsdds/sdda/sdads.html' domain = get_domain(url) print(domain) # Prints: www.google.com
urlparse 関数は Python で利用できる標準ライブラリ関数であるため、次のように使用できます。この手法は、サードパーティのライブラリを必要とせずに、さまざまなプロジェクトやプラットフォームで使用できます。
以上がPython で URL からドメイン名を簡単に抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。