PythonでPDFを分割する方法


  1. PyPDF2ライブラリを使用する方法: PyPDF2は、PythonでPDFファイルを操作するための人気のあるライブラリです。以下は、PyPDF2を使用してPDFをページごとに分割するコード例です。
import PyPDF2
def split_pdf_pages(input_path, output_path):
    pdf = PyPDF2.PdfFileReader(input_path)
    for page_number in range(pdf.numPages):
        output_pdf = PyPDF2.PdfFileWriter()
        output_pdf.addPage(pdf.getPage(page_number))
        with open(f"{output_path}_{page_number + 1}.pdf", "wb") as output_file:
            output_pdf.write(output_file)
# 使用例
split_pdf_pages("input.pdf", "output")
  1. PyMuPDFライブラリを使用する方法: PyMuPDFは、高度なPDF処理をサポートするPythonライブラリです。以下は、PyMuPDFを使用してPDFをページごとに分割するコード例です。
import fitz
def split_pdf_pages(input_path, output_path):
    pdf = fitz.open(input_path)
    for page_number in range(pdf.page_count):
        output_pdf = fitz.open()
        output_pdf.insert_pdf(pdf, from_page=page_number, to_page=page_number)
        output_pdf.save(f"{output_path}_{page_number + 1}.pdf")
# 使用例
split_pdf_pages("input.pdf", "output")

これらのコード例を使用すると、PythonでPDFファイルを分割することができます。input.pdfという名前の入力ファイルがあり、それを個別のページごとに分割してoutput_1.pdf、output_2.pdf、output_3.pdfなどのファイルに保存します。

なお、上記のコードは一般的な例であり、使用するライブラリによって詳細が異なる場合があります。必要に応じてライブラリのドキュメントを参照してください。