正規表現の基礎と応用:効果的なテキスト操作のためのガイド


正規表現は、テキスト処理において非常に便利なツールです。以下に、いくつかの具体的な使用例とコード例を示します。

  1. パターンマッチング:正規表現を使用して、特定のパターンにマッチする文字列を見つけることができます。例えば、メールアドレスのバリデーションなどに使用されます。
import re
pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b'
text = "Contact us at [email protected] or [email protected]"
emails = re.findall(pattern, text)
print(emails)
  1. テキストの置換:正規表現を使用して、文字列内の特定のパターンを置換することができます。例えば、特定の単語を他の単語に置き換える場合などに使用されます。
import re
pattern = r'\bapple\b'
text = "I have an apple and an orange. I like apples."
replaced_text = re.sub(pattern, "banana", text)
print(replaced_text)
  1. パターンの分割:正規表現を使用して、文字列を特定のパターンで分割することができます。例えば、カンマで区切られたデータを分割する場合などに使用されます。
import re
pattern = r'\s*,\s*'
text = "apple, orange,  banana,  cherry"
fruits = re.split(pattern, text)
print(fruits)

これらは正規表現の基礎的な使用例ですが、さまざまな応用があります。正規表現は強力なツールですが、複雑なパターンを扱う場合は注意が必要です。また、言語やツールによって正規表現の文法やサポートされる機能に違いがあるため、使用する環境に応じてドキュメントを参照することをお勧めします。