Tesseract OCRで複数のPSM設定を使用する方法


  1. 単一のPSM設定を使用する場合:

    import pytesseract
    from PIL import Image
    # 画像を読み込む
    image = Image.open('image.jpg')
    # PSM設定を指定してテキストを抽出する
    text = pytesseract.image_to_string(image, config='--psm 3')  # ここでPSMの値を指定
    # 抽出されたテキストを表示する
    print(text)
  2. 複数のPSM設定を使用する場合:

    import pytesseract
    from PIL import Image
    # 画像を読み込む
    image = Image.open('image.jpg')
    # 複数のPSM設定をリストで指定する
    psm_configs = ['--psm 3', '--psm 6', '--psm 11']
    # 各PSM設定ごとにテキストを抽出する
    for config in psm_configs:
    text = pytesseract.image_to_string(image, config=config)
    print(f"PSM設定: {config}")
    print(text)
    print('---')

上記のコードでは、pytesseractライブラリを使用して画像からテキストを抽出します。PSMの値にはさまざまなオプションがあります。上記の例では、PSM 3、PSM 6、およびPSM 11を使用してテキストを抽出しています。