-
単一のPSM設定を使用する場合:
import pytesseract from PIL import Image # 画像を読み込む image = Image.open('image.jpg') # PSM設定を指定してテキストを抽出する text = pytesseract.image_to_string(image, config='--psm 3') # ここでPSMの値を指定 # 抽出されたテキストを表示する print(text)
-
複数のPSM設定を使用する場合:
import pytesseract from PIL import Image # 画像を読み込む image = Image.open('image.jpg') # 複数のPSM設定をリストで指定する psm_configs = ['--psm 3', '--psm 6', '--psm 11'] # 各PSM設定ごとにテキストを抽出する for config in psm_configs: text = pytesseract.image_to_string(image, config=config) print(f"PSM設定: {config}") print(text) print('---')
上記のコードでは、pytesseract
ライブラリを使用して画像からテキストを抽出します。PSMの値にはさまざまなオプションがあります。上記の例では、PSM 3、PSM 6、およびPSM 11を使用してテキストを抽出しています。