C++でのタグの抽出の活用方法


まず、与えられたテキストを適切に解析する必要があります。これには、テキストを単語や句読点などの要素に分割することが含まれます。C++には、文字列を分割するためのさまざまな方法がありますが、ここでは簡単な方法を紹介します。

例えば、与えられたテキストを単語ごとに分割する場合、空白文字を区切り文字として使用できます。以下に、この方法を使ったコード例を示します。

#include <iostream>
#include <string>
#include <vector>
#include <sstream>
int main() {
    std::string text = "let us begin by understanding what we are supposed to do. the figure on the tit...";
    std::vector<std::string> words;
    std::istringstream iss(text);
    std::string word;
    while (iss >> word) {
        words.push_back(word);
    }
// 分割された単語の表示
    for (const auto& w : words) {
        std::cout << w << std::endl;
    }
    return 0;
}

上記のコードでは、与えられたテキストを空白文字で分割し、単語ごとにベクターに格納しています。その後、分割された単語を表示しています。