Google ColabとPythonで複数のPDFファイルを結合する

Pythonで複数のPDFファイルを結合する方法については以前に次の記事に書いていましたが、

Pythonで複数のPDFファイルを結合する

Pythonを使うための環境設定をどうしたらよいのかを考えたり、実際に環境設定の作業を行ったりするのに時間がかかります。

Google Colabを使用すれば比較的簡単にPythonを使うことができるのではないかと思ってやってみました。

Google Colabのノートブック

Google Colabを利用するためには、

https://colab.research.google.com/notebooks/welcome.ipynb?hl=ja

にアクセスします。

私が作成したノートブックへのリンクです。

https://colab.research.google.com/drive/19RLRK4S92abxxN9Ov9lgXZfqjCFiOs_w?usp=sharing

以下がノートブックの内容です。

import PyPDF2

from pathlib import Path

%cd '/content/drive/My Drive/Colab Notebooks/test'

# フォルダ内のPDFファイル一覧
pdf_dir = Path("./pdf_files")
pdf_files = sorted(pdf_dir.glob("*.pdf"))

# 1つのPDFファイルにまとめる
pdf_writer = PyPDF2.PdfFileWriter()
for pdf_file in pdf_files:
    pdf_reader = PyPDF2.PdfFileReader(str(pdf_file))
    for i in range(pdf_reader.getNumPages()):
        pdf_writer.addPage(pdf_reader.getPage(i))

# 保存ファイル名(先頭と末尾のファイル名で作成)
merged_file = "./pdf_files/Combine.pdf"

# 保存
with open(merged_file, "wb") as f:
    pdf_writer.write(f)

プログラムを動作させるとpdf_filesフォルダの中にCombine.pdfが作成されます。

事前に行っておくこと

1.次のフォルダを作成

  • マイドライブ>Colab Notebooks>test
  • マイドライブ>Colab Notebooks>test>pdf_files

2.結合させる複数のpdfファイルをpdf_filesフォルダの中に保存

3.PyPDF2は用意されていないので事前にインストールしておく

!pip install PyPDF2

4.Googoleドライブをマウントしておく

ノートブックを開いた状態で、

「ファイル」をクリック

「ドライブをマウント」をクリック

環境設定が必要ないと言ってもこういったことはやらないといけないので、それほど簡単というわけではないと思いました。

タイトルとURLをコピーしました