-
Optical Character Recognition (OCR) ライブラリを使用する方法:
-
Tesseract OCR: Tesseract OCRは、さまざまな言語に対応したオープンソースのOCRエンジンです。Pythonで使用する場合、pytesseractというライブラリを使用して簡単に実装できます。以下は、マラーティー語の画像からテキストを抽出するPythonのコード例です。
import pytesseract from PIL import Image # 画像を読み込む image = Image.open('marathi_image.jpg') # テキストを抽出する text = pytesseract.image_to_string(image, lang='mar') # 結果を表示する print(text)
-
-
オンラインの画像からテキストへの変換ツールを使用する方法:
-
Google Cloud Vision API: Google Cloud Vision APIは、画像認識とテキスト抽出のためのクラウドベースのサービスです。マラーティー語の画像からテキストを抽出するためには、APIキーが必要です。以下は、PythonでGoogle Cloud Vision APIを使用してマラーティー語の画像からテキストを抽出するコード例です。
from google.cloud import vision from google.cloud.vision_v1 import types # 画像ファイルのパス image_path = 'marathi_image.jpg' # クライアントの初期化 client = vision.ImageAnnotatorClient() # 画像の読み込み with open(image_path, 'rb') as image_file: content = image_file.read() image = types.Image(content=content) # テキスト抽出のリクエストを作成 response = client.text_detection(image=image) texts = response.text_annotations # テキストを表示する for text in texts: print(text.description)
-
これらはマラーティー語の画像からテキストを抽出するための一般的な方法です。他にも、さまざまなオープンソースのOCRライブラリやAPIが存在するので、必要に応じてそれらを調査して利用することもできます。