【Python】urlをパースしていろんな値を取得してみる

urlparse を使うと、url で欲しい部分だけを抽出できました。

from urllib.parse import urlparse

# URLをパースする
parsed_url = urlparse(access_url)

# URLスキーマ
print(parsed_url.scheme) # http

# ネットワーク上の位置(≒ドメイン)を取得する
print(parsed_url.netloc) # www.python.ambitious-engineer.com

# 階層パス
print(parsed_url.path) # /archives/

# クエリ要素
print(parsed_url.query) # s=hoge&x=0&y=0

# フォーマットする
url = '{uri.scheme}://{uri.netloc}/'.format(uri=urlparse(access_url))
print(url) # http://www.python.ambitious-engineer.com/