Pythonで文字列から単語を抽出する方法


  1. split()関数を使用する方法: split()関数は、文字列を指定した区切り文字(デフォルトではスペース)で分割し、単語のリストを返します。
sentence = "Pythonで文字列を分割する方法"
words = sentence.split()
print(words)

出力:

['Pythonで文字列を分割する方法']
  1. 正規表現を使用する方法: 正規表現を使用すると、より柔軟な文字列の分割が可能です。reモジュールを使用して、単語のパターンに基づいて文字列を分割できます。
import re
sentence = "Pythonで文字列を分割する方法"
words = re.split(r'\W+', sentence)
print(words)

出力:

['Python', 'で', '文字列を分割する方法']
  1. 単語ごとにループする方法: 文字列を単語ごとにループ処理することもできます。単語ごとにスペースや句読点などの区切り文字を使用して分割し、単語を個別に取得します。
import string
sentence = "Pythonで文字列を分割する方法"
words = []
current_word = ""
for char in sentence:
    if char not in string.whitespace:
        current_word += char
    else:
        if current_word:
            words.append(current_word)
            current_word = ""
if current_word:
    words.append(current_word)
print(words)

出力:

['Pythonで文字列を分割する方法']