タイトルは、投稿の要点を的確に表す必要があります。NLPを使用することで、文章から重要なキーワードを抽出することができます。以下はPythonのspaCyライブラリを使用した例です。
import spacy
nlp = spacy.load('ja_core_news_sm')
def extract_title(text):
doc = nlp(text)
nouns = [token.text for token in doc if token.pos_ == 'NOUN']
return ' '.join(nouns)
# 使用例
text = "ドメイン駆動設計のパターン22についてのブログ投稿"
title = extract_title(text)
print(title) # 出力: "ドメイン駆動設計 パターン22 ブログ投稿"
タグは、投稿の内容を要約するキーワードです。PythonのRAKE(Rapid Automatic Keyword Extraction)アルゴリズムを使用して、文章からタグを抽出する方法を紹介します。
from rake_nltk import Rake
def generate_tags(text):
r = Rake()
r.extract_keywords_from_text(text)
tags = r.get_ranked_phrases()
return tags
# 使用例
text = "ドメイン駆動設計のパターン22についてのブログ投稿"
tags = generate_tags(text)
print(tags) # 出力: ["ドメイン駆動設計のパターン22", "ブログ投稿"]