import re
text = "baabaaabbbbaabaaaababaaaababbaabbbabaabaabbababaababbabababaaaaaababbaabaaabaaab"
pattern = r"(ba)+"
matches = re.findall(pattern, text)
tags = []
for match in matches:
tags.append("Tag_" + str(len(match)))
print("Tags:", tags)
このコードでは、文字列内の「ba」の連続した出現パターンを見つけ、それぞれの出現に対してタグを作成しています。上記の例では、タグは「Tag_2」「Tag_1」「Tag_3」「Tag_2」「Tag_1」「Tag_2」「Tag_1」「Tag_3」となります。
text = "baabaaabbbbaabaaaababaaaababbaabbbabaabaabbababaababbabababaaaaaababbaabaaabaaab"
pattern = "ba"
tags = []
start_index = 0
while start_index < len(text):
end_index = text.find(pattern, start_index)
if end_index == -1:
break
match_length = end_index - start_index + len(pattern)
tags.append("Tag_" + str(match_length // len(pattern)))
start_index = end_index + len(pattern)
print("Tags:", tags)
このコードでは、文字列内の「ba」の連続した出現パターンを見つけ、同様にタグを作成しています。上記の例では、タグは正規表現の例と同様になります。
以上が、文字列のパターンマッチングとタグの抽出についてのシンプルで簡単な方法とコード例です。これらの手法を応用すれば、他の文字列パターンの抽出やタグ付けにも役立つでしょう。