PDFからテキストに

「PDF OCR X community Edition」を使って、PDFデータを、テキストデータに変換してみた。

 

pdf_ocr

アイコンをクリックする。

 

pdf_ocr1

ウィンドウが開くので、任意のPDFファイルをドラッグする。

 

pdf_ocr2

pdf_ocr3

ドロップすると、ウィンドウズの色がグレイになり、次に設定画面が出る。
各種設定を行ない、「convert」をクリック。

 

pdf_ocr4

ファイルを変換中。そのあいだ、下部のバーの印が左右にうごく。

 

pdf_ocr5

変換されたテキストデータは、こんなかんじ。