正規表現のキャプチャ


  1. シンプルなキャプチャ: 正規表現を使用して、特定のパターンにマッチする部分をキャプチャすることができます。例えば、以下の正規表現を使用して、文字列から日付をキャプチャすることができます。
import re
text = "投稿日付: 2024-02-29"
pattern = r"投稿日付: (\d{4}-\d{2}-\d{2})"
match = re.search(pattern, text)
if match:
    captured_date = match.group(1)
    print(captured_date)  # 結果: 2024-02-29
  1. 複数のキャプチャ: 正規表現を使用して、複数のパターンにマッチする部分を一度にキャプチャすることもできます。以下の例では、文中の人名と年齢をキャプチャします。
import re
text = "私の名前は田中太郎で、年齢は25歳です。"
pattern = r"名前は(\w+)で、年齢は(\d+)歳"
match = re.search(pattern, text)
if match:
    captured_name = match.group(1)
    captured_age = match.group(2)
    print(captured_name, captured_age)  # 結果: 田中太郎 25
  1. 名前付きキャプチャ: キャプチャした部分に名前を付けることもできます。これにより、キャプチャ結果を名前で参照できます。以下の例では、URLのキャプチャに名前を付けています。
import re
text = "ウェブサイト: https://www.example.com"
pattern = r"ウェブサイト: (?P<url>https?://\S+)"
match = re.search(pattern, text)
if match:
    captured_url = match.group("url")
    print(captured_url)  # 結果: https://www.example.com

これらは正規表現のキャプチャの基本的な例です。さらに高度なパターンマッチングやキャプチャの利用方法もありますが、ここでは簡単な例を紹介しました。