正規表現の例とコードを使用した文章の分析方法


  1. ワードカウント: 文章内の単語の数を数える方法です。
import re
def word_count(text):
    words = re.findall(r'\w+', text)
    return len(words)
text = "This is a sample sentence."
count = word_count(text)
print(count)  # Output: 5
  1. 文章内の特定の単語の検索: 文章内に特定の単語が含まれているかどうかを判定する方法です。
import re
def search_word(text, word):
    pattern = r'\b' + re.escape(word) + r'\b'
    match = re.search(pattern, text)
    if match:
        return True
    else:
        return False
text = "This is a sample sentence."
word = "sample"
found = search_word(text, word)
print(found)  # Output: True
  1. パターンマッチング: 文章内の特定のパターンに一致する部分を抽出する方法です。
import re
def extract_pattern(text, pattern):
    matches = re.findall(pattern, text)
    return matches
text = "This is a sample sentence. Another sample sentence."
pattern = r'sample \w+'
results = extract_pattern(text, pattern)
print(results)  # Output: ['sample sentence', 'sample sentence']

これらは正規表現を使用して文章を分析するための一部の基本的な例です。より複雑なパターンや検索・置換の方法もありますので、具体的な要件に合わせて正規表現を利用してください。