クエリ文字列を除いたURLの取得方法


  1. 正規表現を使用する方法: 正規表現を使ってURLからクエリ文字列を取り除くことができます。以下はPythonの例です。
import re
def get_url_without_query_string(url):
    return re.sub(r'\?.*', '', url)
url = 'https://example.com/page?param1=value1&param2=value2'
url_without_query = get_url_without_query_string(url)
print(url_without_query)

この例では、re.sub() 関数を使用して、URL内の ? 以降の部分を削除しています。結果として、https://example.com/page が出力されます。

  1. URLパースを使用する方法: URLをパースして、パースした結果のオブジェクトからクエリ文字列を取り除く方法もあります。以下はPythonの例です。
from urllib.parse import urlparse
def get_url_without_query_string(url):
    parsed_url = urlparse(url)
    return parsed_url.scheme + '://' + parsed_url.netloc + parsed_url.path
url = 'https://example.com/page?param1=value1&param2=value2'
url_without_query = get_url_without_query_string(url)
print(url_without_query)

この例では、urlparse() 関数を使用してURLをパースし、結果のオブジェクトからスキーム、ネットロケーション、パスを取得しています。結果として、https://example.com/page が出力されます。

これらの方法を使用すると、クエリ文字列を除いたURLを簡単に取得することができます。必要に応じて、他のプログラミング言語でも同様の手法が使える場合があります。