Pythonを使用してPDFを分割する方法


方法1: PyPDF2ライブラリを使用する方法

PyPDF2はPythonのPDF処理ライブラリであり、PDFを分割するために使用することができます。まず、PyPDF2をインストールします。

pip install PyPDF2

次に、以下のコードを使用してPDFを分割します。

import PyPDF2
def split_pdf(input_pdf, output_prefix):
    pdf = PyPDF2.PdfFileReader(input_pdf)
    for page_number in range(pdf.getNumPages()):
        output_pdf = f"{output_prefix}_{page_number + 1}.pdf"
        writer = PyPDF2.PdfFileWriter()
        writer.addPage(pdf.getPage(page_number))
        with open(output_pdf, 'wb') as f:
            writer.write(f)
# 使用例
split_pdf('input.pdf', 'output')

上記のコードでは、split_pdf関数を定義し、入力PDFファイルと出力ファイルの接頭辞を指定してPDFを分割します。各ページは、出力ファイル名にページ番号が追加されて保存されます。

方法2: PyMuPDFライブラリを使用する方法

PyMuPDFもPDF処理のための便利なライブラリです。まず、PyMuPDFをインストールします。

pip install PyMuPDF

次に、以下のコードを使用してPDFを分割します。

import fitz
def split_pdf(input_pdf, output_prefix):
    pdf = fitz.open(input_pdf)
    for page_number in range(pdf.page_count):
        output_pdf = f"{output_prefix}_{page_number + 1}.pdf"
        writer = fitz.open()
        writer.insert_pdf(pdf, from_page=page_number, to_page=page_number)
        writer.save(output_pdf)
        writer.close()
# 使用例
split_pdf('input.pdf', 'output')

上記のコードでは、split_pdf関数を定義し、入力PDFファイルと出力ファイルの接頭辞を指定してPDFを分割します。各ページは、出力ファイル名にページ番号が追加されて保存されます。

これらの方法を使用すると、PythonでPDFを簡単に分割することができます。