ドメイン駆動設計のパターン22: とタグの抽出


タイトルは、投稿の要点を的確に表す必要があります。NLPを使用することで、文章から重要なキーワードを抽出することができます。以下はPythonのspaCyライブラリを使用した例です。

import spacy
nlp = spacy.load('ja_core_news_sm')
def extract_title(text):
    doc = nlp(text)
    nouns = [token.text for token in doc if token.pos_ == 'NOUN']
    return ' '.join(nouns)
# 使用例
text = "ドメイン駆動設計のパターン22についてのブログ投稿"
title = extract_title(text)
print(title)  # 出力: "ドメイン駆動設計 パターン22 ブログ投稿"

タグは、投稿の内容を要約するキーワードです。PythonのRAKE(Rapid Automatic Keyword Extraction)アルゴリズムを使用して、文章からタグを抽出する方法を紹介します。

from rake_nltk import Rake
def generate_tags(text):
    r = Rake()
    r.extract_keywords_from_text(text)
    tags = r.get_ranked_phrases()
    return tags
# 使用例
text = "ドメイン駆動設計のパターン22についてのブログ投稿"
tags = generate_tags(text)
print(tags)  # 出力: ["ドメイン駆動設計のパターン22", "ブログ投稿"]