【Python】urlをパースしていろんな値を取得してみる

urlparse を使うと、url で欲しい部分だけを抽出できました。

URLからドメイン名を抽出する - Python学習講座

from urllib.parse import urlparse

# 解析対象URL access_url = 'http://www.python.ambitious-engineer.com/archives/?s=hoge&x=0&y=0'

# URLをパースする parsed_url = urlparse(access_url)

# URLスキーマ print(parsed_url.scheme) # http

# ネットワーク上の位置(≒ドメイン)を取得する print(parsed_url.netloc) # www.python.ambitious-engineer.com

# 階層パス print(parsed_url.path) # /archives/

# クエリ要素 print(parsed_url.query) # s=hoge&x=0&y=0

# フォーマットする url = '{uri.scheme}://{uri.netloc}/'.format(uri=urlparse(access_url)) print(url) # http://www.python.ambitious-engineer.com/