まず、エラーメッセージの原因は、Pythonの標準ライブラリであるdifflib.SequenceMatcher
が純粋なPythonで実装されているため、処理が遅くなることです。このエラーメッセージを解消するためには、python-levenshtein
パッケージをインストールする必要があります。
以下に、Python-Levenshteinを使用して文字列の類似度を計算する簡単な方法とコード例を示します:
import Levenshtein
def calculate_similarity(string1, string2):
similarity_ratio = Levenshtein.ratio(string1, string2)
return similarity_ratio
string1 = "Hello"
string2 = "Helo"
similarity = calculate_similarity(string1, string2)
print(f"The similarity between '{string1}' and '{string2}' is: {similarity}")
上記のコードでは、Levenshtein.ratio()
関数を使用して、2つの文字列の類似度を計算しています。計算結果は0から1の間の浮動小数点数で表され、1に近いほど類似度が高いことを意味します。