NLPテキスト要約のためのLex Rankの使い方

pip install sumy

インストールが完了したら、次のようなサンプルテキストを使用して、Lex Rankを適用してみましょう。

from sumy.parsers.plaintext import PlaintextParser
from sumy.nlp.tokenizers import Tokenizer
from sumy.summarizers.lex_rank import LexRankSummarizer
# サンプルテキスト
text = "ここにテキストを入力します。"
# テキストパーサーを作成し、トークン化器を設定します
parser = PlaintextParser.from_string(text, Tokenizer("japanese"))
# Lex Rankの要約器を作成します
summarizer = LexRankSummarizer()
# 要約を生成します
summary = summarizer(parser.document, sentences_count=3)
# 要約を出力します
for sentence in summary:
    print(sentence)

上記のコードでは、sumyライブラリを使用してLex Rankを実装しています。サンプルテキストを指定し、テキストパーサーとトークン化器を設定し、Lex Rankの要約器を作成します。sentences_countパラメータを変更することで、出力される要約文の数を調整することができます。

このコードを実行すると、指定したテキストの要約が表示されます。

以上が、NLPテキスト要約におけるLex Rankの使い方とコード例です。Lex Rankは、テキストの要約を生成するための強力な手法であり、様々な応用に活用することができます。