【Python】urlをパースしていろんな値を取得してみる

urlparse を使うと、url で欲しい部分だけを抽出できました。

URLからドメイン名を抽出する - Python学習講座

from urllib.parse import urlparse

# 解析対象URL
access_url = 'http://www.python.ambitious-engineer.com/archives/?s=hoge&x=0&y=0'

# URLをパースする
parsed_url = urlparse(access_url)

# URLスキーマ
print(parsed_url.scheme) # http

# ネットワーク上の位置(≒ドメイン)を取得する
print(parsed_url.netloc) # www.python.ambitious-engineer.com

# 階層パス
print(parsed_url.path) # /archives/

# クエリ要素
print(parsed_url.query) # s=hoge&x=0&y=0

# フォーマットする
url = '{uri.scheme}://{uri.netloc}/'.format(uri=urlparse(access_url))
print(url) # http://www.python.ambitious-engineer.com/

返信を残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA