透明テキストとしてファイル化されているPDFから文字だけを出力します。
▼「pdfTrans」スクリーンショット
使い方は基本的に、PDFファイルを、「ドロップエリア」と
書かれた場所にドラッグアンドドロップして「実行」ボタンを
押すだけです。
抽出されてテキストファイルは、デフォルトでは
PDFファイルの有る同じフォルダ内に
同じファイル名で拡張子がtxtとして生成されます。
▼ドラッグアンドドロップ以外では
「ファイル選択」ボタンを使って
ファイルを選ぶことも可能です。
また、複数のPDFファイルをフォルダ単位で
一括して文字テキストを抽出する場合は
「フォルダ選択」ボタンを使います。
(サブフォルダまで抽出実行することも可能です)
▼PDFファイルの内部文書構造によっては
出力結果が改行だらけとなる場合もあります。
その場合はツール−オプションで「改行を出力する」の
チェックを外してから実行してみて下さい。
出力される抽出文字の順番は、PDFファイルに
格納された文字の順番によるため、必ずしも
PDFの見た目通りの順番で出力される訳ではないようです。
▼PDFファイルが複数ページで構成されている場合
ページ毎にヘッダーやフッターを追加しながら
出力する設定もできます。
▼pdfTransがダウンロードできる作者のサイト
http://ohju.cside4.jp/software/