Tesseract OCRで複数のPSM設定を使用する方法

単一のPSM設定を使用する場合:

import pytesseract
from PIL import Image
# 画像を読み込む
image = Image.open('image.jpg')
# PSM設定を指定してテキストを抽出する
text = pytesseract.image_to_string(image, config='--psm 3')  # ここでPSMの値を指定
# 抽出されたテキストを表示する
print(text)

複数のPSM設定を使用する場合:

import pytesseract
from PIL import Image
# 画像を読み込む
image = Image.open('image.jpg')
# 複数のPSM設定をリストで指定する
psm_configs = ['--psm 3', '--psm 6', '--psm 11']
# 各PSM設定ごとにテキストを抽出する
for config in psm_configs:
text = pytesseract.image_to_string(image, config=config)
print(f"PSM設定: {config}")
print(text)
print('---')

上記のコードでは、pytesseractライブラリを使用して画像からテキストを抽出します。PSMの値にはさまざまなオプションがあります。上記の例では、PSM 3、PSM 6、およびPSM 11を使用してテキストを抽出しています。