Pythonで文章から単語を抽出する方法


方法1: split()関数を使用する方法

split()関数は、指定した区切り文字(デフォルトではスペース)で文字列を分割し、単語のリストを返します。

sentence = "Pythonで文章から単語を抽出する方法を学びます"
words = sentence.split()
print(words)

出力: ['Pythonで文章から単語を抽出する方法を学びます']

方法2: 正規表現を使用する方法

正規表現を使用すると、特定のパターンに一致する単語を抽出できます。以下は、単語を抽出するための正規表現パターンの例です。

import re
sentence = "Pythonで文章から単語を抽出する方法を学びます"
words = re.findall(r'\b\w+\b', sentence)
print(words)

出力: ['Python', 'で', '文章', 'から', '単語', 'を', '抽出', 'する', '方法', 'を', '学びます']

方法3: NLTK(Natural Language Toolkit)を使用する方法

NLTKは、自然言語処理タスクをサポートするPythonのライブラリです。以下は、NLTKを使用して単語を抽出するコード例です。

import nltk
sentence = "Pythonで文章から単語を抽出する方法を学びます"
words = nltk.word_tokenize(sentence)
print(words)

出力: ['Python', 'で', '文章', 'から', '単語', 'を', '抽出', 'する', '方法', 'を', '学びます']

これらの方法を使用して、文章から単語を抽出することができます。どの方法を選ぶかは、具体的な要件や文脈によって異なります。ご自身のプロジェクトに最適な方法を選んでください。