Pythonで文書処理
資料のPDF化、文字認識、検索、その他さまざまな作業をプログラミングで解決
著者 | 北山 洋幸 |
---|---|
判型 | B5変型、312頁 |
ISBN | 978-4-87783-497-5 |
価格 | 本体3,400円 |
発行日 | 2021年10月20日(初版 第1刷発行) |
備考 | ダウンロードサービス:学習に使えるサンプルファイル |
本書について
Pythonは、短くて簡潔なコードで、高度な処理を行うことができる言語です。基本的な知識を身に付ければ、高度な応用プログラムを開発することが期待できます。また、Pythonには文字認識、PDF、そして画像を扱う多数のモジュールが用意されています。
本書は、PythonでPDFを画像へ変換、その逆、文字認識、PDFへの透かし追加、PDFの保護解除、PDFのサイズ変更や結合、カメラで撮影した資料を透視投影しPDF化、大量のPDFへgrep処理、複数のPDFを1つのPDFへ結合、逆にPDFを1ページ単位へ分解、PDFへパスワード設定や解除などを行うプログラムを紹介し、Pythonの理解を深めます。同じ処理を、異なったモジュールで実現する方法も解説します。
目次
- 第1章 開発環境の準備(Anaconda編)
- 1.1 Anaconda
- 1.2 Anaconda Navigator
- 1.3 Anaconda Prompt
- 1.4 Spyder IDE
- 第2章 開発環境の準備(Visual Studio Code編)
- 2.1 インストール
- 2.2 日本語化
- 2.3 Pythonの拡張機能をインストール
- 2.4 Pythonのインストール
- 2.5 Pythonプログラムの実行
- 第3章 OCR環境の構築
- 3.1 Tesseract OCR
- 3.2 PyOCRのインストール
- 3.3 PythonでOCR
- 3.4 Visual Studio Codeとコマンドライン引数
- 3.5 環境変数の設定
- 第4章 PDFを画像へ変換
- 4.1 pdf2imageをインストール
- 4.2 popplerをインストール
- 4.3 PDFを画像へ変換
- 第5章 画像をPDFへ変換
- 5.1 img2pdfをインストール
- 5.2 1つの画像をPDF化
- 5.3 複数の画像を1つのPDFへ
- 5.4 フォルダー内の画像を1つのPDFへ
- 第6章 PDFの文字認識
- 6.1 先頭ページを文字認識
- 6.2 PDF全体をテキストファイル化
- 6.3 PDFのファイル名をサブフォルダー名へ
- 第7章 PDFの保護解除
- 7.1 プログラムの使用法
- 7.2 プログラムの説明
- 7.3 Pillowの機能の説明
- 7.4 実行
- 7.5 一時ファイルの利用
- 第8章 透かし
- 8.1 マスク画像を使用する方法
- 8.2 マスクを使用しない方法
- 第9章 PDFのサイズ変更
- 9.1 A4をA3へ変更
- 9.2 A3をA4へ変換
- 第10章 画像の部分文字認識
- 10.1 OpenCV利用の準備
- 10.2 マウスでエリア指定
- 10.3 一部を文字認識
- 10.4 画像データ交換
- 第11章 透視投影
- 11.1 透視投影と文字認識
- 11.2 透視投影した結果のPDF化
- 11.3 画像の鮮明化
- 第12章 画像加工と文字認識
- 12.1 画像を文字認識
- 12.2 画像加工と文字認識
- 12.3 閾値とトラックバー
- 12.4 OpenCVの機能の説明
- 第13章 画像のつなぎ合わせとPDF化
- 13.1 画像合成
- 13.2 画像を合成しPDF化
- 13.3 任意サイズの画像を合成しPDF化
- 第14章 文字列の検索(grep)
- 14.1 プログラムの使用法
- 14.2 プログラムの説明
- 14.3 実行例
- 14.4 改行対応
- 14.5 行番号を表示
- 第15章 PyMuPDFの利用
- 15.1 複数のPDFファイルの結合
- 15.2 PDFからの画像抽出
- 15.3 PDFからのテキスト抽出
- 15.4 テキストデータを対象とする検索(grep・2)
- 第16章 PyPDF2の利用
- 16.1 複数のPDFファイルの結合
- 16.2 PDFファイルの分割(1)
- 16.3 PDFファイルの分割(2)
- 16.4 PDFファイルのパスワード設定
- 16.5 PDFファイルのパスワード解除